人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

上個月發布的 Nano Banana Pro (Gemini 3 Pro Image)迎來了基于 Gemini 3 的重大升級,這是一款強大的新圖像生成和編輯模型,具備高級功能和創意控制。是谷歌迄今為止最先進的圖像模型。

本篇文章,我將帶大家了解 Nano Banana Pro 的玩法特點。

更多玩法:

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

一、 模型介紹

還是老規矩,我們先來看看模型的特點。

最讓我眼前一亮的,是 Nano Banana Pro “不講武德”的推理能力,模型基于 Gemini 3 推理模型打造,它可不是靠“照貓畫虎”來畫畫,而是先在腦子里“推演一遍物理規律+邏輯關系”,再動手生成圖像。對現實世界的認知和推理能力,有了大幅提升,不再是簡單的繪圖工具,而是能把復雜概念可視化的智囊;

其次,在文字渲染方面,看看多款不同熱門 AI 模型在“單行文本渲染錯誤率(%)”上的測試結果:

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

熱門模型各語言單行文本渲染錯誤率對比

以往國外模型生圖的中文兼容性很差,亂碼頻發,而 Nano Banana Pro 現在支持多國語言,一鍵翻譯和本地化,中文生成錯誤率直接降到 13%,直接吊打同類模型;

然后是模型展現出極致的真實美學,生成的風景動物植物,非常逼真,分辨率最高達到 4k,光影紋理都貼合真實物理世界,仿佛使用相機實拍一樣。

我們來看看不同模型在文生圖中的表現對比:

Overall Preference(GenAI-Bench):綜合偏好(用戶/測評對生成圖像的整體滿意度);

Visual Quality(GenAI-Bench):視覺質量(圖像清晰度、美觀度等);

Infographics:信息圖表(生成含文字/數據的圖標類圖像的能力)。

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

Nano Banana Pro 在文字轉圖像 AI 基準測試中表現出色

Nano Banana Pro 憑借文本渲染精度顯著提升,具備扎實的通用知識庫,并借助谷歌搜索能力,根據用戶提示詞精準獲取數據,提供更精確、最新的知識,進一步強化模型性能。

另外需要補充一點,谷歌為這次模型所有生成內容嵌入 SynthID 數字水印,將 AI 生成的信號嵌入 AI 生成內容,讓所有人更容易驗證圖片是否由 Google AI 直接生成或編輯。

在創作的時候,Nano Banana Pro 支持對話式、多輪次的圖像編輯工作流,最多可將 14 張輸入圖像組合為 1 張輸出圖像,最多支持 5 個角色的外貌在多圖之間保持一致,同時能理解極長的文本提示詞,通過文字指令調整鏡頭、光線、風格、調色等。

說白了就是對以前模型的能力進行了全方位的提升,別的模型做的到的,它能做到;同樣的提示詞/圖片,別的模型做不到的,它可以做到了。

現在,你可以直接訪問 Google Gemini 官網來體驗模型功能。登錄后即可開始體驗。

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

Google Gemini

目前可在 Google Gemini 官網免費使用(需要魔法上網,每天有次數限額)

這里是官網網址:https://gemini.google.com/app

除此之外,國內可用的平臺我也給大家整理了(目前 海螺 AI 每天免費生成 50 張,另外 YouMind 和 flowith 兩個平臺限時免費,大家可以去體驗體驗)

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

海螺AI

這里是平臺鏈接:

  1. https://hailuoai.com
  2. https://youmind.com
  3. https://flowith.net

好了,接下來讓我們一起看看模型的玩法吧~

二、 模型推理能力

這次 Nano Banana Pro 尤其擅長制作復雜的圖表——就像工程師看待世界的方式一樣

提示詞:

識別畫面中的主體,并在左上角用白色手繪筆跡寫出其對應的中文名稱。同時,在畫面上疊加一層白色的手繪示意圖,內容需包含指向細節的引線說明,以及解釋各項技術數據標注。

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

小米汽車 SU7 數據標注

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

蘋果 Vision Pro 數據標注

除此之外,還可以給它一道數學題,它能夠結合超強推理,精準文字渲染,生成帶詳細步驟的解題過程。

提示詞:

求解給定的積分,并將完整解法寫在白板上。

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

做數學題

用模型作 AI 生圖領域的信息圖表

提示詞:

制作一張關于 AI 生圖領域的市場地圖(中文)

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

AI 生成信息圖表

再舉個例子,如果你對一部電視劇或者游戲角色之間的關系不太清楚,Nano Banana Pro 讓復雜的關系鏈,一瞬間變成連路人都看得懂的精美圖畫。

關鍵詞:

畫出魔獸游戲的人物關系圖,用中文標注人名,每個角色需要有圖像。

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

魔獸世界角色關系圖

Nano Banana Pro 會先在網上搜索并分析角色,然后根據需求專門生成角色的圖片,最后輸出這張關系圖。這生成的質量真的太強了…

從產品標注到信息圖制作,Nano Banana Pro 把人類需多年苦練的「視覺表達力」,濃縮進幾行提示詞——創意,從未如此觸手可及。

它改變的,遠不止設計師、游戲開發者或科研人員; 它正在重塑我們「看世界、記世界、講故事」的基本方式——我們站在想象力的巔峰,也站在真實與虛構的邊界之上:

還原這張撕碎的紙

提示詞:

修復這些被撕碎的帶有文字的紙張

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

將撕碎的紙張復原

又或者根據手指紋路生成指紋圖

提示詞:

參考圖片中的手指紋路細節特征,生成一張正式文件的微距特寫照片,畫面中央是圖一手指黑色指紋印記,指紋紋路受按壓影響顏色深淺不一,包括中心的環形核心還有皮膚破損以及條形紋線細節。指紋位于白色紙張上,周圍有黑色的表格線條分隔,可見部分文字包括"姓名"、"日期"、“職業"等中文小標題。整體光線均勻柔和,紙質紋理清晰,指紋油墨質感真實自然,拍攝角度傾斜 40°,正面微距,突出指紋的細節和文件的正式感。

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

生成手指紋路圖 ,連指紋細節都能夠保持一致

既然這么厲害,那能不能跟據地理坐標生成發生在此地的重大事件呢?

提示詞:

布局生成坐標 41°43′32″N 49°56′49″W處發生的重大事件的圖像。畫面比例為16:9

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

泰坦尼克號

好家伙——它居然真把「泰坦尼克號沉沒現場」給畫出來了!

驚訝之余,思考片刻之后,我決定整點“有味道”活兒,跟據菜品圖片提煉菜品中所有食材/將制作步驟做成手賬圖。

提示詞:

為圖一生成這道菜所有食材的照片,并用中文標明名稱和數量。

提示詞:

生成一張平鋪的手賬圖,里面是帶有真實圖片的分步信息圖,打開的方格筆記本,每一步需要附上這道菜的制作說明。

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

跟據菜品生成食材圖片/手賬圖片

生成的效果感覺真的很 nice,要是有這手藝,不當美食博主都對不起這個模型了,現在緊急征名!

三、 文字渲染能力

Nano Banana Pro 相較于 2.5 Flash Image 實現了重大升級——它不再只是“畫得好看”,而是能真正“畫得有用”。它特別擅長理解邏輯和語言,比如在圖片里添加文字時,不僅能寫得清清楚楚、準確無誤,還能讓文字自然融入畫面,就像專業設計師做的一樣。簡單說:它生成的不只是圖片,而是可直接使用的“成品素材”。

我們先來看幾個例子:

提示詞:

制作 8 個精致的極簡主義標志,每個都是有趣的中文食物詞語,包括:{食品名稱},用食物筆畫表達這個詞的含義,白色的背景。

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

創意美食字體設計 ,每個詞都用食物相關的元素拼寫出來

有了 Nano Banana Pro,改圖再也不用“從頭畫起”了!它能真正“看懂”圖片里有什么、文字在哪、整體是什么風格——比如菜單、招牌、說明書這類帶文字的圖,你想把英文換成中文,它不僅能準確替換文字內容,還能讓新文字的字體、顏色、排版和原圖完美融合,就像原本就是這么設計的一樣。簡單說:改字不改樣,換文不換風。

提示詞:

將英文翻譯成中文

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

一個飲料宣傳圖 ,展示英文文本準確翻譯和呈現中文

在測試的過程中,作者總是(一不小心)刷到鬼滅之刃的內容,所以也是想著用 Nano Banana Pro 生成鬼滅相關的素材看看效果怎么樣

提示詞:

一張日式浮世繪風格的收藏級集換式卡牌設計,豎構圖。插畫風格需要緊密模仿《鬼滅之刃》的視覺美學,特征包括:粗細變化的墨筆輪廓線、傳統木版畫的配色方案,以及戲劇性的動態構圖。

主體描述: 卡牌主角是 {角色名字}(稱號:{柱名/稱號}),處于動態戰斗姿勢,手持 {武器描述}。角色正在施展 {呼吸法招式名稱},周圍環繞著 {視覺特效描述}(例如:巨大的火焰 / 水龍 / 旋風),這些特效需要以 傳統日式水墨畫(Sumi-e)風格 呈現。

背景與材質: 背景需融合 紋理化的鐳射閃卡(Holographic Foil)效果,在傳統水墨元素下方閃爍。

邊框: 圖片周圍要有 日本傳統紋樣(如青海波或麻葉紋)組成的裝飾性邊框。底部有一個風格化的橫幅,上面用古樸的日式書法寫著 “{日文漢字名字}”。

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

鬼滅之刃卡牌

生成效果簡直驚艷到了!求人不如求 AI,以后想要啥圖,動動嘴,自己就能“手搓”出來。

四、 搜索能力

Gemini 3 Pro Image 不光會“畫”,還特別“有知識”——它背后連著一個超大的資料庫,畫出來的東西更真實、更靠譜,比如建筑細節、品牌標識、歷史場景,都能精準還原。更厲害的是,它還能“上網查資料”:開啟谷歌搜索功能后,它會實時參考最新網頁信息來生成圖像,確保內容準確、不過時。像做天氣卡片、新聞配圖、教學素材這類對真實性要求高的任務,它就特別管用。

提示詞:

生成武漢市江夏區今日天氣的預報卡片,卡片顏色以淺色為主,高級好看。畫面比例為 16:9。

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

提示詞:

制作一張關于這種植物的信息圖,重點用中文介紹有趣的信息。

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

跟據植物照片生成趣味知識卡片

五、 圖像控制

與以往模型“修修補補式升級”不同,Nano Banana Pro 是一次真正的「感官躍遷」。

我們來試試空間圖片生成。

提示詞:

一個壯觀的螺旋樓梯建筑內部,混凝土材質的圓形空間,中央是優雅的螺旋樓梯盤旋而上,樓梯扶手呈現流暢的曲線。頂部有圓形天窗透入柔和的自然光,照亮整個空間。一位身穿黑色服裝的人影站在樓梯底部,形成剪影效果。墻面呈現粗糙的混凝土質感,局部有溫暖的燈光照明。整體色調以灰藍色和暖黃色為主,營造出寧靜而神秘的氛圍。建筑風格現代簡約,具有強烈的幾何美感和空間層次感。

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

空間圖片

試試草圖轉現實圖片

提示詞:

一個精美的機械裝置,圓形金屬外殼上有鉚釘裝飾,中央是螺旋狀的金屬結構,頂部有黃銅色的齒輪和手柄,放置在古樸的木質工作臺上。周圍散落著羊皮紙圖紙、木工工具、皮革帶等物品。整體采用暖色調的復古工業風格,光線柔和,營造出文藝復興時期工作室的氛圍。畫面構圖居中,細節豐富,質感真實。

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

將達芬奇手稿轉為現實圖片

多素材場景融合

提示詞:

將這些圖像合成一張 4:3 格式的適當電影圖像

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

多圖融合

Nano Banana Pro 不再只是“拼貼”,而是真正“理解”構圖:能智能識別多素材的視覺層級與空間關系,自動調整大小與位置,輸出一張邏輯自洽、比例協調的完整畫面。

鏡頭變焦

提示詞:

讓人物面部極度清晰,前景虛化

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

鏡頭焦點變換

鏡頭拉近拉遠也穩的一批,無論是近距離的畫筆還是后面的人物五官、光線角度的表現全部在線,毫無“換臉式”崩壞。

我們再來看看場景和人物的一致性方面的表現:

風景圖季節變換提示詞:

將場景季節變為冬季

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

調整風景圖片的季節

人物造型延展

提示詞:

三張照片垂直排列,構成了一幅連續肖像攝影的視覺敘事。

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

人物三連圖

Nano Banana Pro 對人物一致性和細節把控能力都非常強。包括人物手部的結構、發辮劉海等特征把握準確無畸變。

在這么短的時間就能生成這樣的高質量的圖像讓我不禁感慨,或許你的攝影師朋友還在反復找角度調整參數的時候,它已經完成三版精修。

最后看看局部光影調整

提示詞:

生成一幅具有強烈明暗對比效果的圖像。人物應保留其原有的面部特征與表情。引入強烈而具有方向性的光線,光源位于人物上方略偏左的位置,在面部投下深邃、輪廓分明的陰影;僅留細窄的光束照亮其雙眼與顴骨部分,其余面部區域則隱沒于濃重的暗影之中。

人人都是設計師!6大章節總結Nano Banana Pro的超多玩法

局部光影調整

六、 模型的局限性

雖然模型在分辨率、一致性、中文語義理解上實現了顯著躍遷,但目前仍有一些需要改進的地方:

  1. 視覺和文本保真度: 渲染微小文字、精細細節或生僻拼寫可能不完美;
  2. 數據和事實準確性: 對于圖表等數據驅動的視覺內容,請務必核實事實準確性;
  3. 翻譯和本地化: 多語言生成可能會有語法錯誤或遺漏特定的文化細微差別;
  4. 復雜編輯和圖像混合: 高級編輯任務(如混合或光照更改)有時會產生不自然的偽影;
  5. 角色特征: 雖然通常可靠,但跨編輯的角色一致性可能會有波動。(如將畫面 1 中的女生替換為畫面 2 的男生);
  6. 生圖速度:與即夢 4.0 以及 Nano Banana (上一代)模型相比,Nano Banana Pro 生成的成本和延遲更高。

七、 總結

Nano Banana Pro 再次刷新了 AI 圖像的天花板——這一次,它把「想象力的分辨率」調到了 4K。

作為一款海外前沿模型,它或許在訪問速度、復雜中文文字生成等問題上尚有缺陷;

但當一束光從遠方亮起,我們要做的,從來不是仰望,而是——追光、拆解、再造,直至自己成為光源。

我們正站在一個離譜到近乎瘋狂的起點上——設計軟件,正在失去原有的不可替代性。

而「想象力的翻譯能力」,成了新時代的硬通貨。

你不再需要精通圖層、蒙版或鋼筆工具,但你必須會說,例如:

“晨霧中的老茶館,木窗半開,蒸汽裹著茉莉香漫出來,一只搪瓷缸擱在竹椅扶手上,缸身印著褪色的‘先進工作者’,光從瓦縫斜切進來,像一道溫柔的判決。”

——細節,是新的畫筆;共情,是新的構圖法則;審美,是最后的護城河。

當別人還在爭論“AI 會不會取代設計師”,

你已經用 3 行中文,生成了一張讓百萬用戶停下滑動的手指的封面。

一個“人人都是設計師”的時代——它不是要來了。它已經在你剛剛按下的 “生成” 鍵里,轟然啟動。

現在,輪到你了:

“說出你想看見的世界。

然后,生成它”。

收藏 53
點贊 119

復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。