
上周我介紹了 gemini 生圖模型,我覺得已經算是實用性很強了,但緊接著 Open AI 就卷起來了,也更新了一波圖像生成模型,然后迅速在全網刷屏。那它的效果到底好不好用呢?是不是被吹的很厲害?我很好奇啊,所以周末趕緊深度實測了一波,先說結論:生成的圖確實比 Gemini 的更好,但也并不完美。
我用 GPT-4o 深度測評了 2 天,當它真的可以指哪打哪后,我實在是不知道怎么形容。這篇文章我先跟大家總結 10 個最好用的使用示例,向你證明它確實是太好用了!
先說明一下,有些人可能會發現不充會員也能用 GTP-4o,但出來的圖效果完全不行。這是因為免費用戶是用不了新的圖像生成模型的,每天送的那 5 次用的其實是 Dall-E 模型,不是真正的新繪圖模型。
充值后,選擇更多中的“創建圖片”用的才是全新的 GTP-4o 畫圖模型。

所以,我周末花費巨資,先是買了一張虛擬信用卡,然后又再充值了一個 plus 會員,很順利的就用上了。注意咱們只需要花$20 買 plus 會員就夠了,不用去買那個$200 每個月的,太浪費了。 從我使用的情況來看,plus 會員就能一直生圖,我用了 2 天,沒出現限制的情況。
我測試了以下 10 種場景,各個都非常驚艷!
注意:用的時候,記得先點更多,選擇創建圖片后再輸出提示詞,在提示詞前面會有藍色的“創建圖片”,確保使用新模型且生效。

10 個最常用的使用場景案例
1. 生成組圖
我測試的第一個生成圖片,就是直接挑戰高難度,讓它在一個畫面中同時生成一批帶有對應特征的內容。這在目前其他 AI 生圖能力上基本都超綱了,咱們直接上強度,看看它到底行不行?
提示詞:一張正方形圖片,包含一個 4 行 4 列的網格,網格上有 16 個圖形,背景為白色,從左到右,從上到下。圖形的風格請保持和參考圖一致,列表如下:1、一塊橙色的面包 2、一個白色的星巴克杯子 3、一個草莓蛋糕 4、一瓶牛奶 5、一瓶汽水 6、一杯奶茶 7、一張桌子 8、便利店 9、一只戴著帽子的狗 10、一輛紅色的小汽車 11、一束玫瑰花 12、一把黑色雨傘 13、一雙紅色高跟鞋 14、幾個包子 15、用草書寫的“caiyun”16、辦公樓

效果出來了,16 個元素,位置、內容完全正確,風格和細節程度還做到了統一,非常棒!

接著,我想把它的風格按我提供的參考圖重新設計下,畢竟在實際項目里,需要的風格比較確定,風格要做到一致性。
提示詞:參考這張圖,把上面的圖風格改成和參考圖一致

這是生成后的效果,開始有一些錯誤了。所以,我不滿足,讓它繼續改。

有一些修正,但也還是會有問題,所以我想把它改回來,看看有沒有修正回來的可能性,就和在實際工作中指導實習生的感覺。
提示詞:再仔細對照最初的參考圖和設計要求,顏色沒有這么多,有幾個地方的內容出錯了,第 2 個,第 7 個,第 10 個

最終改了幾輪后,有些改回來了,但又出了新的錯誤,我打算就此打住。

雖然它的效果還不是很完美,但總體上拿來稍微改改其實就能用了,已經給了我不小的驚喜,因為我也同時把這個提示詞問了谷歌 gemini,出來的圖是這樣的。

只能說,沒有對比就沒有傷害。
2. 風格轉換
GPT-4o 有類似 ComfyUI 中的 ControlNet 的功能,可以完全復刻參考圖中的人物姿勢,或根據線稿生成指定風格的圖像。
給大家看下我當時測試的一個例子。

提示詞:把上圖中的畫面轉換為 3D 風格

轉換后的圖,已經非常像了有沒有,這還學啥建模啊?質量也太高了。

眼尖的你可能會發現,生成后的圖和原圖稍微會有點區別,但這其實是官方刻意為之,不是做不到。因為當我要求它跟原圖一樣時,就違反規定了。

可能大家在操作的時候,經常會出現一個限制提示,說你違反了他們的規定。OpenAI 的內容政策特別嚴格地限制“高度擬真人物”的圖像生成,尤其是當提示詞中涉及“肖像還原”“外貌匹配”等字樣時,哪怕是你自己的照片,模型出于防止誤用(例如深度偽造)的政策,也有可能拒絕生成。
所以當出現人物相關需求時,可以用回 comfyUI 或 Gemini,能解決問題。
此時,我已經不滿足于把帶人物的插畫轉成照片,我想把我覺得很美的插圖壁紙也都轉成照片了,那會是什么樣的美景呢?咱們試試效果。
提示詞:把這個場景變成一張寫實照片

這是它生成出來的效果。

當我看到它生成出來的效果時,我真的是被驚艷到了,這效果還原的確實是有點太好了。
我在出這張圖的時候已經是晚上 12 點多了,但我已經沒了睡意,想趕緊多試試,這錢沒白花呀。

我又找了另外一張我很喜歡的風景插圖轉換成了真實美景。

除了轉成通用的卡通風格,還可以在提示詞中加入指定的漫畫家風格,使其更有對應風格的特點。比如我把上一篇文章中生成的美女圖換成海賊王風格會是什么樣的?

提示詞:將參考圖變成海賊王的畫風

再轉成樂高風格,提示詞:將參考圖變成樂高的畫風

我還想把哪吒的 3D 圖改為哆啦 A 夢的風格。
提示詞:將參考圖變成藤子不二雄風格

風格轉換后,有點大雄的感覺啊,哈哈。

3. 生成海報
它能根據自身的知識庫,生成符合用戶意圖的配圖。
比如我希望它幫我生成一張宇宙百科示意圖。
提示詞:我需要給百科全書畫一張插圖,請幫我用矢量插圖風格生成一張不同類型的星球插圖,需要有對應星球的名字,一句話介紹,背景為白色

這是生成出來的效果,質量很高啊,文字也都是對的。這在之前的生圖模型中,其實很難做到,現在居然這么準確了。

英文沒問題,那中文如何呢?我又試了下
提示詞:把圖中的英文改成中文

發現基本都能對上,不過也有一些小瑕疵,比如錯別字,筆畫粗細之類的細節還有提升空間,不過基本上稍微改改就能用了。
然后我又覺得太背景太干,適當加多一些細節。
提示詞:背景上需要加多一些設計感,能用在書籍的宣傳插圖

背景加的還可以,還能繼續微調,就像在指導一位設計實習生一般,沒有脾氣,不會疲勞,可以一直改,就問老板們喜不喜歡?設計師們怕不怕!
4. 虛擬試穿
GPT-4o 能把提供的衣服、模特素材,直接合成想要的畫面,完成電商里面經常用到的試穿效果圖。這個能力其實在 comfyUI 和 Gemini 中都能做到,但我發現 GPT-4o 出來的效果似乎會更好。

提示詞:把褲子,帽子,衣服穿到模特身上,并且走在街道上

出來的效果非常好,除了帽子 logo 那稍微有點瑕疵,其他幾乎完全被復刻了過來。瞬間感覺用 comfyUI 搭建的工作流已經失去了意義。

5. 動漫設計
它可以一次性上傳多個角色設定,然后要求 GPT-4o 轉換視角和場景,生成全新的漫畫設定,同時保留漫畫角色特征。

提示詞:讓鳴人和路飛這 2 個角色在中忍考試的場景中激烈的戰斗,畫面中有相應角色的技能特效

直接這樣會提示違規,猜測可能是有版權的問題。按它提示繼續操作就可以了,依然能保持參考圖的特征,繞過限制。

但在出來的圖片這里,手臂是有點問題的,我們也可以用它的局部修改功能。怎么操作呢?
點擊圖片放大,然后點右上角有一個編輯圖標

點完之后,可以看到一只畫筆,然后把想修改的地方圈出來,寫上提示詞就可以了。

這是優化之后的,能看到還是有一些瑕疵,還可以繼續優化,我這里就不演示了。

6. 改圖標風格
在 UI 領域,也可以讓它根據一種風格生成對應的圖標。咱們設計師經常找參考圖,做情緒版,不就是為了做好風格設計嗎?這下 GPT-4o 也能搞了,而且還挺精細。
比如讓它按找到的設計參考圖,重新設計圖標。
提示詞:按照第 1 個風格圖標重新設計第 2 張圖中的圖標

最后生成的效果,雖然圖片還存在一定的瑕疵,比如透視關系不大對,但這個效果還是非常不錯的。

一整套圖標時也可以出效果

最后的效果也還不錯,除了第一個圖標有瑕疵。

7. 圖像提取
GPT-4o 可以從圖像中摳圖,它還不是一種簡單的摳圖,而是扣出畫面內容,然后幫你做高清修復。
比如我找到了這張圖,水中的海豚其實已經很不清晰了,整個圖片也不到 700px,要想摳出來完整細節挺不容易的。

提示詞:幫我把畫面中的海豚提取出來

看到了嗎?它不是簡單的摳圖,而是把需要摳圖的海豚完整的摳出,而且還自帶了修復,并且還給了一張透明格式的圖片!

8. AI 找圖
它不僅能按提示詞出圖,還能根據它自己的知識庫,根據我的一句話描述,直接把我想要的圖“找”出來。
提示詞:找一張火影里面的小櫻的圖

這是幫我找出來的圖,質量非常高,幾乎沒有啥瑕疵。

9. 老舊照片上色
這個功能其實其他 AI 也有,只是我覺得 GPT-4o 出來的圖更好,尤其是在那些細節還原度上,甚至景深那些都能比較好的復原。
比如我從網上找到這樣一張照片,我覺得挺有質感的,咱們來實驗一波。

提示詞:為這個老照片變為彩色

這是修復后的照片,細節還原度拉滿。

10. 一鍵修圖
它的修圖能力,感覺比 PS 還要強,一鍵就把畫面中的人物全干沒了。

提示詞:修改圖片,要求移除畫面中所有人,完全保留畫面中的其他實景細節

這是修完之后的效果,除了細微處還有點瑕疵外,乍一看,幾乎挑不出毛病。

好了,以上就是我自己在測試中覺得最實用的 10 個使用場景,它還有更多其他用法等待大家去發現,留言區期待你的發現和分享。
當前這個模型也不是完美的,它也有一些做的沒那么好的地方。比如對中文的生成還沒那么好,對一些細節做遷移的時候會有一些瑕疵,限制比較多,出圖速度上也比較慢,而且動不動還限速,挺麻煩的,然后它在一些出圖的美感上也有點不太足,和 Midjourney 稍差一些。但我覺得,這些問題很快就會被迭代解決,畢竟 AI 領域的更新節奏實在是太快了。
從各家大模型卷的方向來看,都是先保實用性,再提升美感。這和咱們平時做產品的思路一樣,先保證可用,再做到好看。
從天馬行空的驚喜到精準可控的生成,這就是這次升級中最核心的升級內容。
最后說點心里話。
從最初 Midjourney 剛出的時候,就有一種聲音在說設計師要下崗了,不再需要設計師了。但后面這種聲音也隨著實際項目中的應用情況而逐漸回歸理性,設計師還是沒法被取代。而到近期 GPT-4o 出來時,大家更能感覺到工具的好用,設計師下崗論似乎更加強烈。
但我覺得此時如果真的被取代的不是設計師,而是只會畫圖的美工,進而會進一步拉大初級和資深設計師之間的鴻溝。畫圖在實際項目中,只是設計師日程工作中的一部分,項目前期的需求溝通、概念策劃、后期與開發的對接、還原走查、用戶反饋后的分析、策略調整都是工作,而這個鏈路暫時都需要設計師的介入,沒法完全實現 AI 代辦。
雖然我覺得設計師完全被取代不大可能,但我隱約看到一種趨勢:距離直接畫圖越近的設計師,越容易被取代。而在項目中做設計項目管理,做概念策劃的人,負責節點較多的人會比較難被取代。原因是流程多,組織團隊復雜,需要人的介入就更多,越不容易被 AI 自動化。
所以,苦心鉆研技術可能并不會有出路,關鍵還是策略的思考。如果你想依賴學習到的技術做為壁壘,當你苦心學習了很多年的各種技能,結果被給 AI 說的一句話就打敗了,想想還是有點悲哀的吧。
歡迎關注作者的微信公眾號:「彩云譯設計」

復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。




發評論!每天贏獎品
點擊 登錄 后,在評論區留言,系統會隨機派送獎品
2012年成立至今,是國內備受歡迎的設計師平臺,提供獎品贊助 聯系我們
DeepSeek實用操作手冊
已累計誕生 770 位幸運星
發表評論 為下方 15 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓