Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

大家好,我是言川。

凌晨我剛躺下準備睡覺,結果就看到我期待已久的 Nano Banana 2 上線了!

記得初代小香蕉上線時也是這種情況,然后就測了一個通宵......

初代教程:

那沒辦法,誰讓我們有時差呢,起來開始猛測!

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

先說說它的命名,Google 最終上線不叫 Nano Banana 2,而是 Nano Banana pro。

一句總結:支持多種尺寸設置,最高能輸出 4K 級別的超高分辨率。可以精細地控制圖像的多角度、景深焦點、以及色彩。

最最重要的是,也是等了太久的:它終于支持中文文字生成了!

話不多說,直接給大家展示我這一晚上肝出來的實戰案例。

一、多文本渲染(支持中文)

以前咱們總說國外模型:生成不了中文,就是差了口氣。

這次,Google 徹底把短板補齊了。

Nano Banana Pro 現在支持多國語言,但我這次主要測試的是中文能力,其他語言大家可以自行嘗試。

我們先看幾個文生圖的例子。

提示詞:一張平鋪的數字手賬頁,背景是打開的方格筆記本。主題是旅行清單,貼有可愛的卡通男孩的 Q 版貼紙。版面包含剪貼風格的產品照片:一把紅傘、一個藍色水壺、一個暖手寶和一個帆布袋。頁面用和紙膠帶、回形針和涂鴉裝飾。頂部的主標題必須用俏皮的中文字體寫著:“小魯班的旅行清單”。詳細的手寫中文注釋和箭頭指向每個產品。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

提示詞:一張充滿活力與潮流感的孟菲斯風格平面設計海報,采用高飽和度的波普藝術美學和扁平化矢量插畫風格。畫面主視覺中心是巨大的、夸張變形的白色中文字體設計“喂出來玩”,襯托在不規則的電光藍幾何色塊背景之上,具有極強的視覺沖擊力。畫面右上方漂浮的傾斜紫色標語橫幅,上面清晰地寫著白色中文字體“不是泛泛之交 是飯飯之交”。左下角有醒目的黃色立體氣泡文字“Fun!”,右上角漂浮著紫色的標語橫幅。畫面中散布著趣味十足的裝飾元素:一個身穿黃衣藍褲、手持綠色放大鏡正在探視的扁平風格人物,以及一個長著大眼睛的紅黃色甜甜圈狀吉祥物。周圍點綴著星星、笑臉、箭頭、唱片和抽象幾何形狀。整體配色采用克萊因藍、檸檬黃、玫紅和紫色等高對比度色彩,洋溢著年輕、快樂、時尚和探索的氛圍,線條利落清晰,無噪點,呈現出高質量的商業插畫質感,16:9。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

提示詞:潮流酸性波普插畫風格,高飽和度熒光色系配色(檸檬綠與電光紫撞色),輔以極簡矢量線條與微立體質感,8 個圖標以 4×2 陣列整齊排列,每個圖標都置于一個獨立的 1:1 白色圓角矩形卡片內,這些卡片則懸浮在一個整體的淺灰色背景之上,以擬人化的方形小怪獸為視覺主體,適用于移動端 APP 空狀態、缺省頁、系統反饋界面。8 個圖標具體場景:暫無定位、暫無工作、暫無新帖、暫無評論、網絡出錯啦、空狀態、逛完啦、無法定位;每個圖標下方標注對應中文提示,表達生動、造型潮酷、視覺統一,16:9。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

提示詞:這是一幅中國風國潮藝術插畫,將巨大的中文楷體字“貴陽”設計成了一幅融合城市地標與美食的文化畫卷。左側的“貴”字內部巧妙集成了紅色的貴州省博物館古建筑群、蜿蜒的山脈、祥云和藍色的波浪紋理,周圍環繞著幾碗誘人的貴陽特色美食,包括腸旺面、絲娃娃、以及一碗紅油米粉。右側的“陽”字同樣以古建筑甲秀樓和文昌閣為核心,背景是青綠山水、翻滾的海浪和祥云,前景是一碗熱氣騰騰的牛肉粉。整體配色古樸典雅,采用紅、綠、藍、黃等傳統色調,具有扁平化插畫風格和細膩的紋理質感,背景為純白色。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

這效果,我還以為是用國內模型生成的,Google 對中文字的生成,真的上大分!

再來個圖生圖,基于一張寫實圖片,生成漫畫風的分鏡腳本圖。

提示詞:參考圖片制作一張黑白漫畫分鏡腳本,手繪墨線風格,草稿,圖像小說。木質寫字板背景,膠帶固定。四個分鏡格,中文手寫注釋。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

基于它強大的文本渲染能力,你還可以這樣玩。

將圖片中的外國場景,原地翻譯成中文。

提示詞:將這張圖的場景換成中國某地,保持場景和周邊元素完全一致,圖中文字需翻譯成中文。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

甚至是可以改變產品中的文字。

提示詞:保持圖中產品和場景不變,將圖中飲料瓶身的文字換成中文。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

這次更新在理解世界知識上也有加強。

比如我上傳了一張香辣蟹的圖像,讓它幫我制作食譜流程圖。

提示詞:幫我制作這張香辣蟹的雙頁手寫食譜剪貼簿,每個步驟都配有照片,照片下方用手寫文字簡要描述該步驟。陳舊的活頁橫線紙,中文手寫筆跡,照片用膠帶固定,包含手繪小元素。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

它就真的懂怎么做的(我做過,差不多的流程),并且還圖文并茂。

還可以制作一些理論知識的信息圖表,比如勾股定理和光合作用。

提示詞:高質量的平面攝影作品,創作一個簡單的 DIY 信息圖表,解釋「勾股定理/光合作用」,排列在干凈、淺灰色紋理的背景上。簡單的黑色箭頭手繪在背景上,引導觀眾的視線。整體氛圍是教育性的、現代的,易于理解。圖像采用俯視、鳥瞰視角拍攝,柔和均勻的光線最大限度地減少陰影,使焦點保持在過程上,16:9。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

我上學有這畫圖的本事也不至于坐在最后一排。

這個世界知識能力,還可以讓它識別圖中的建筑,并標注出來。

提示詞:識別畫面中的橋梁主體,并在左上角用白色手繪筆跡寫出其對應的中文名稱。同時,在畫面上疊加一層白色的手繪工程示意圖,內容需包含指向橋梁細節的引線說明,以及解釋張力和尺寸的技術數據標注。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

這里我讓它給我把橋梁的手繪工程示意圖也給畫出來了,這對真實世界的認知真的強。

二、影視級圖像控制

上一代 Nano banana 最大的痛點是分辨率不足,而這一次,它直接飆升到了 4K 超分辨率!

直接將圖像生成能力拉到了影視級水準。

這意味著我們可以實現更精細、更專業的鏡頭控制,玩法很多。

我們先從最基礎的景深開始玩起,上傳一張前景模糊的圖。

提示詞:聚焦于人的手部,模糊其面部。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

這細節強的可怕......

反過來再玩下,把前景模糊,后景清晰地表現出來。

提示詞:清晰后面兩人,模糊前景,將女性人物的畫面處理得模糊不清。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

也完全沒問題。

再來測試下圖像多角度,把特寫鏡頭切換為全景鏡頭。

提示詞:一位男士坐在窗邊,人物姿勢和場景保持不變,展示人物全景鏡頭,16:9。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

一致性表現非常好。

再來一組全景鏡頭切換特寫鏡頭的。

提示詞:一輛紅色的跑車停在路邊,將視角切換至車輛正后方低角度,重點聚焦于圓潤飽滿的后輪拱線條、精致的紅色尾燈內部細節、閃亮的鍍鉻后保險杠以及排氣管。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

不僅切換了視角,還完美理解了正后方低角度這種運鏡語言,細節特寫質感拉滿了。

除了鏡頭控制,這次升級還對光影控制進行了史詩級加強。

先來一個全局調整,將傍晚夕陽切換為白天。

提示詞:切換為白天。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

上面是全局調整,你還可以進行局部光影的精細化控制。

提示詞:生成一張具有強烈明暗對比效果的畫面。人物應保留其原始特征和表情。引入強烈、方向性的光線,看似從上方略微向左照射,在臉上投下深邃、清晰的陰影。只有少量光線照亮他的眼睛和顴骨,其余臉部處于深暗之中。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

PS 真的可以退休了,啥都可以一句話解決,我還費那勁干嘛......

三、草圖參考控制

上一代在上傳多張參考圖時,最讓人頭疼的就是素材會被吞掉。

Google 針對多圖輸入和融合又做了優化,我們直接上難度,挑戰它的極限!

我一次性上傳了 5 張參考圖,讓它給我用作于一張圖上做融合。

提示詞:將這些圖片整合成一張格式為 9:16 的、布局恰當的圖片,并將模特身上的服裝更換為圖片中的服裝和包。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

處理的細節完全沒問題,服裝材質、包包款式,甚至連細小的參考圖信息都完全一致。

做品牌 LOGO 設計也不在話下,只需要上傳風格參考圖,便可將草圖一鍵渲染上色,省去手動上色的時間。

提示詞:將右邊的草圖渲染成左邊的參考圖風格。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

它還可以支持批量生圖。

比如我通過一句提示詞,讓它幫我生成 4 張周邊物料圖。

提示詞:根據這張 LOGO 圖,創建咖啡杯、帆布包、T 恤、廣告牌四張圖像,每張圖尺寸為 16:9。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

再來個參考風格生圖。

提示詞:將這幅簡單的草圖轉化為一個逼真的椅子,遵循草圖的創意方向,并運用汽車圖片中的顏色和紋理。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

打敗 AI 的只有更強大的 AI,再見,SD。

再來測試下多主體一致性。

這部分我加大點壓力,選擇上傳兩張圖片,包含 7 人人物,看看它的融合能力如何。

提示詞:將這兩張圖片中的人物放在一個室外場景中,雙方在微笑交談,保持人物的身份、服裝和風格不變,但可以改變人物的動作,16:9。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

好家伙,我是真服了,一次生成,沒抽卡......

再來一組,直接扔給他 12 張參考圖,就給我可勁造吧。

提示詞:一個中景畫面,12 個毛茸茸的角色擠在一起,并排坐在寬大的木質長椅上和長椅前的鵝卵石地面上。他們都面向前方,看著放在長椅前低矮石桌上的復古手搖留聲機。房間光線昏暗,右側的篝火透進溫暖的光線,留聲機發出的微光照亮了生物的面龐和毛茸茸的質感。背景是一個舒適、略顯雜亂的森林營地,有鋪著松針的地面、擺滿野營工具和食物的木箱,以及背景中簡易的帳篷和遠處的樹林。整體氛圍溫暖、舒適且充滿趣味,16:9。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

最后

我們來個反向操作。

上傳一張圖,讓它一次性給我生成 10 個相同主體,但不同場景的分鏡圖。

提示詞:著名的公共領域兒童電影,采用提供的風格和相同的配色方案。共 10 個畫面,一個接一個地生成。不要文字。不要生成單個連環畫,而是生成 10 個畫面,每個畫面單獨使用一個提示詞生成。每個畫面為橫向 16:9 比例。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

得了,Google 這次真的把設計、圖像生成領域的桌子給掀了。

幾乎幾乎,你能想到的所有圖像生成、圖像編輯場景,它都能給你解決。

以前它不能生成中文字,現在能了。

以前它生成的圖像分辨率低,現在直接給你 4K 超分辨率!

以前角色一致性還缺點意思,現在你上傳 7-8 個人物、10+ 張圖片,都能給你融合的明明白白。

這哪是設計師接受不了,老牌的圖像模型看到都要淚奔了。

行了,廢話就不多說了,今晚熬個通宵,值得!

目前登錄 Gemini 就能使用了。地址在這: https://gemini.google.com/

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

如果上不去,用 Lovart AI 也可以,訂閱會員好像還是免費用,我跑了幾個案例沒花積分。

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

另外測試的比較早,還有許多好玩的場景沒來得及挖掘,之后再給大家分享。

最后希望本篇文章對大家有所幫助!

如果你想學習 AIGC,可以加入我主理的《優設 AI 俱樂部》,俱樂部內沉淀有 2000+ 優質 AI 學習資料,涵蓋 AI 繪畫、AI 視頻、AI 提示詞、AI 工具庫、AI 商業設計案例、研究報告......

也可以點擊鏈接: https://wx.zsxq.com/group/15288828142182

Nano Banana Pro深度測評!中文字生成和多圖融合能力太強了!

收藏 101
點贊 181

復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。