魔法再現,谷歌發布最強圖片模型nano banana,劈柴一秒回印度老家

魔法再現,谷歌發布最強圖片模型nano banana,劈柴一秒回印度老家

文章圖片

魔法再現,谷歌發布最強圖片模型nano banana,劈柴一秒回印度老家

文章圖片

魔法再現,谷歌發布最強圖片模型nano banana,劈柴一秒回印度老家

文章圖片

魔法再現,谷歌發布最強圖片模型nano banana,劈柴一秒回印度老家

文章圖片

魔法再現,谷歌發布最強圖片模型nano banana,劈柴一秒回印度老家

文章圖片

魔法再現,谷歌發布最強圖片模型nano banana,劈柴一秒回印度老家

文章圖片

魔法再現,谷歌發布最強圖片模型nano banana,劈柴一秒回印度老家

文章圖片

【魔法再現,谷歌發布最強圖片模型nano banana,劈柴一秒回印度老家】魔法再現,谷歌發布最強圖片模型nano banana,劈柴一秒回印度老家

文章圖片

魔法再現,谷歌發布最強圖片模型nano banana,劈柴一秒回印度老家

文章圖片

魔法再現,谷歌發布最強圖片模型nano banana,劈柴一秒回印度老家

文章圖片

魔法再現,谷歌發布最強圖片模型nano banana,劈柴一秒回印度老家

文章圖片

魔法再現,谷歌發布最強圖片模型nano banana,劈柴一秒回印度老家

文章圖片



谷歌終于支棱起來了 , 帶來了今年可能是最令人驚喜的文生圖模型——nano banana 。

谷歌對于多模態能力的堅持和深耕 , 再次開花結果了 。

自三天前以“Nano Banana”之名低調現身后 , 相關討論便迅速發酵 , 原因無他 , 只是因為 , 過于出色 。
這個模型前幾天就在LMArena圖片編輯模型排行榜上幾乎斷代式地領先其他模型 , 而昨天 , 谷歌終于官方宣布 , nano banana正是出自 Google DeepMind 實驗室推出的
Gemini-2.5-Flash-Image-Preview 。
Nano banana現已經一躍居于圖像編輯排行榜榜首 。
不是期貨 , 開箱即用 。 不論是官方發布的素材 , 還是網友自己測的案例 , 在一致性和功能性上都非常驚艷 。
全球網絡一致好評 , 紛紛盛贊其其他任何圖像編輯模型都要出色 。
不僅一致性強 , 速度還快 , 相比 gpt-image 能實現更精準的編輯 , 同時 , 更是具備完整 LLM 的理解能力而非普通 CLIP 規模模型的認知水平 。

訪問地址:ai.studio/banana
這個模型最直觀的感受就是 , 這是一個用嘴和打字就能修改和拼接圖片的模型 , 那種初見ChatGPT和Sora的“魔法感”又回來了 。
過往AI生圖常被詬病于每次編輯都像擲骰子 , 細節失真、角色特征易變 。 而谷歌對Nano Banana主要定位的就是保持主體的一致性 。
谷歌表示 , 更換背景、視角或色調 , 畫面中的人物與物體都能穩定保持原貌不走形 。
而另一面 , 它還是帶推理的圖像模型 。 Nano Banana提示詞精準度達到了新高度 , 在聽懂人話 , 理解內容方面表現出色 。
它不僅僅能夠理解圖像內容 , 還能自主理解、處理、添加文字 。
這讓它得以同時支持多輪次編輯與多圖敘事能力 , 用戶可以持續修改生成的圖片 , 但人還是那個人 , 甚至可以保持原來的氛圍感 , 不僅“房間布置逐步變化”、“漫畫連續分鏡”、“多角色合成互動”等復雜功能都能實現 , 繪制帶文字技術插圖 , 做幾何題目也能做到 。

一句話讓模型把圖片換視角 , 上圖是原圖 , 下圖是俯視視角圖片 。

一件衣服 , 一個人物 , 一句話 , 衣服馬上就穿到人身上 。

一句話 , 拳王阿里秒變辛普森 。

劈柴從印度老家順移到谷歌辦公室(人物還是出現了些許的變化) 。

兩張人物照片 , 就馬上給你他們出演碟中諜和瓊瑤劇的劇照 。

只去掉小細節 , 局部編輯也很穩定 , 其他內容都沒有什么變化 。

人物一致性方面 , 網友測試表示 , 讓人物轉一圈再轉回來 , 人看起來的變化不大 , 一致性確實nice 。

在網友喜聞樂見的動漫領域 , 也是表現喜人 , 給出角色和手繪圖示意圖 , 就能控制多個人物的姿態 。

生成角色三視圖后 , 漫畫也可以穩定生成 。

而多次編輯工作更是讓nano banana的成圖更穩定 。

網友測評后表示 , 連續編輯方面還沒有說的那么好 , 會稍微變形一部分 , 但一致性已經相當可觀了 。

多種風格的消費漫畫信手拈來 。

網友實測反饋也很不錯 , 除了人物五官有非常微小的變化 , 一致性真的非常強 。 如果使用的是普通人的照片 , 你不盯著對比 , 很難看出面部細節的變化 。

不過對于大家都很熟悉的名人 , 可能還是能讓人看出面部不一致的地方 。

插畫變手辦更是近期網上一大測試熱點 , 說到底還是因為nano banana的成圖效果確實ai味兒少 , 看著真實 。 從平面到現實世界 , 卻沒有太大違和感 , 質感和特征都相當不錯 , 網友們爭相生成傳播 。
而繪制科學插圖 , 制作用于解釋的插圖等包含內容生成的方面 , 網友也評價很高 。

在幾秒鐘內完成科學插圖的繪制 , 高保真文本渲染+語言理解+世界知識 , nano banana確實是獨一檔的 。


不過 , 也有不少網友表示 , nano banana的過濾器有點敏感 , 有的正常請求也會會被拒絕 。
除了內容本身 , nano banana的運行速度也相當可觀 。 谷歌表示 , 在同類模型通常需要10-15秒處理一張圖片時 , Gemini 2.5 Flash 基本能做到1-2秒完成 。
Nano Banana配合谷歌的veo3的工作流更是能很快生成相當質量的視頻 , 網上已經出現了不少工作流 , Nano Banana出圖導入veo3 , 幾秒鐘的短視頻或者長視頻都能夠勝任 。

而價格上 , 有網友根據谷歌放出的使用費率做了個簡單的估算 , 生成或者修改一張圖的成本在3毛錢左右 。

網友表示 , 這是真的能替代美工的視覺工具 。
谷歌這次真是盯上了視覺打工人的飯碗了 。

    推薦閱讀