就在剛剛,Vidu Q2?終于放出了它真正的王炸功能「參考生」!
我們暫且不說新功能,就說 Vidu Q2 這個模型,本身文戲人物微表情和情緒就很到位,而且武戲也非常能打。現在,Vidu 把它的看家本領「參考生」功能,正式升級搭載到了這個演技炸裂的新模型上。
說起參考生,Vidu 才是真正的開創者,早在去年9月,它在全球首次提出了這個概念。這次升級,就等于給一個天賦異稟的頂級演員,配上了經驗老道的金牌導演。它的核心,就是來解決 AI 視頻最頭疼,也最關鍵的一致性問題。為什么我敢說它是王炸?因為它能同時理解多達 7 個不同類型的參考圖,而目前的 Sora 2,只支持1個。

它意味著,你對畫面的控制力,達到了前所未有的程度。 內容可控、語義可懂、多主體保持一致。接下來,我們就把這個參考生功能,掰開揉碎了聊。
殺手锏
我們先用人話解釋一下,參考生到底是個啥。早期的 AI 視頻,就像開盲盒。你輸入一段文字,AI給你生成什么,全憑運氣。但參考生功能,徹底解決了這個問題,你可以直接扔給 AI 參考圖。
比如,一個特定長相的演員,一個你們公司設計的 IP 形象,或者一款剛上市的新品。AI 會精準識別這張圖里的核心元素,并讓它在視頻里動起來。而且,最新版的 Vidu Q2,生成的視頻時長已經可以達到8秒,主體的連貫性和畫質效果表現非常好。

我們來看一個具體的案例,你就懂了。假設,我們想給一個新上市的咖啡品牌,做一條廣告片。傳統方式,得組建團隊、找演員、租場地、拍攝、剪輯,一套下來,沒個十天半月搞不定。現在用 Vidu Q2 參考生怎么做?
第一步,我們上傳一張女主角的照片。第二步,上傳一張咖啡產品的特寫圖。第三步,再上傳一張巴黎街頭咖啡館的場景圖。

然后,輸入一句話指令。Vidu 有個獨創玩法,直接@圖片或者將提示詞框中的「圖1」、「圖2」、「圖3」標簽拖到詞組對應的區域即可精準控制。
提示詞:在巴黎街頭的露天咖啡座,和煦的陽光透過遮陽棚灑在她身上。她優雅地拿起手中的紙質咖啡杯,輕輕品嘗了一口,隨后抬起頭,臉上露出一個滿足而溫暖的微笑,眼中閃爍著喜悅的光芒,慢動作,電影感。
Vidu Q2 會把這三個你指定的元素,完美融合在一個視頻里。
女主角就是你選的那個演員,產品就是你的那款咖啡,場景就是你想要的巴黎風情。 人物、產品、場景,三者都牢牢鎖定,精準可控。整個過程,可能只需要幾十秒。(據悉,Vidu Q2 在內容一致性進一步提升的同時,其推理生成的速度對比上個版本 的 Vidu Q1 參考生提升3倍,價格也更加優惠。)這就是參考生功能的威力,它讓視頻創作的門檻,從專業級,一下子降到了人人可玩的程度。
這背后,是AI對畫面語義的深度理解。
它知道哪個是人,哪個是物,哪個是背景。 并且能讓這些元素在動態的視頻里,始終保持高水準的一致性和穩定性。對于電商、廣告、動畫這些行業從業者而言,簡直太爽了。內容生產的效率,將迎來一次史詩級的提升。
我們先拿電商舉個例子,這個感受最直接。假設我們要推廣一款降噪耳機。我們只需要上傳兩張圖:一張品牌代言人的高清半身照,和一張耳機的產品精修圖。

我們甚至不需要準備場景圖。 直接用提示詞告訴 Vidu 這段視頻呈現的是什么效果。
提示詞:電影級鏡頭,他站在一間極簡主義的頂層公寓里,背景是巨大的落地窗和窗外璀璨的城市夜景。他緩緩地、流暢地將耳機戴在頭上,隨著耳機的落下,他原本平靜的表情變得更加寧靜和專注,仿佛瞬間進入了自己的世界。高級廣告質感。

瞬間,Vidu 就為我們生成了一段質感堪比電影的廣告片。 代言人形象完美還原,產品無縫融入。但這還只是開始。除了故事片,電商還需要純粹、高級的產品渲染視頻。Vidu Q2 參考生同樣能輕松搞定,而且方式更簡單。這一次,我們只上傳一張圖:就是那張耳機的產品精修圖。然后用提示詞,讓 AI 生成產品渲染圖。
提示詞:耳機靜置在一個由半透明磨砂玻璃和金屬線條構建的幾何空間中央。鏡頭圍繞耳機進行一次優雅的弧線運動,同時耳機自身在軸心上進行小幅度的傾斜和旋轉。周圍有微弱的藍色能量光粒子在空氣中漂浮,營造出一種產品發布的神秘和高級氛圍。

Vidu 幾乎是憑空將一張 2D 的平面產品圖,變成了一段擁有流暢動態、高級光影的3D渲染視頻。這意味著什么?
想象一下,在過去,完成我們剛剛做的這兩段視頻,至少需要一個導演團隊、攝影師、燈光師、場景搭建、再加上一個專業的三維動畫師,前后花費數周時間。而現在,只需要一個運營人員,拿著代言人和產品的兩張圖,一個下午就能全部搞定。不只是效率提升了10%或20%,這是對整個電商內容生產流程的徹底顛覆。
聊完電商,我們再看看它對內容創作,尤其是短劇國漫行業的賦能。國漫修仙題材,一直是大熱門,但制作門檻非常高。 一個角色御劍飛行的幾秒鐘鏡頭,背后可能是動畫師數十個小時的辛勤工作。現在,情況完全不同了。 創作者只需要把自己的角色設計稿、仙氣繚繞的場景原畫,作為參考圖輸入給 Vidu Q2 參考生。

然后輸入指令,我們還可以將「AI 配音」功能打開(目前ViduQ2已支持音視頻同出功能,可自由選擇生成人聲/音效)。
提示詞:鏡頭聚焦于男主角手中古劍的劍尖,它正緩慢地插入祭壇中心。隨著劍尖沒入,祭壇四周的石柱開始崩裂,空中的烏云中傳來低沉的雷鳴。他身上的白色長袍無風自動,周圍形成一個由無數能量符文組成的金色旋渦,不斷向他匯聚,充滿遠古力量蘇醒的史詩感。

Vidu Q2 不僅能生成一段極具東方美學神韻的動畫短片,它還會自動匹配上低沉的雷鳴和能量的嗡鳴聲,一個有聲有色的電影級片段瞬間完成。如果說宏大場面是國漫的骨架,那細膩的人物互動就是國漫的靈魂。這一點,Vidu Q2 同樣能駕馭,而且方式更簡單。這一次,我們只上傳男主角和女主角兩張角色圖,不提供任何場景。 我們用提示詞描述一個互動場景。
提示詞:男主角和女主角站在一片開闊的星空下,背景是璀璨的銀河和點點繁星。師姐微微抬頭,凝視星空,眼中充滿向往。男主角則站在她身側,深邃的目光望向遠方,似乎在思考著星辰軌跡的奧秘。兩人之間雖然沒有言語,但眼神和姿態透露出一種精神上的共鳴和對仙道的探索。

Vidu 憑空生成了意境宏大的璀璨星空,還精準還原了兩個角色的形象。單人特效、多人互動,角色的形象、服裝,場景的畫風,都能保持高度的一致性。這等于直接打通了從原畫設定到動畫成片的關鍵環節。
對于無數擁有好故事,但缺乏資金和技術團隊的獨立創作者來說,這扇門,終于被打開了。一個全民創作優質國漫的時代,真的不遠了。
視頻延長
參考生功能讓視頻內容精準可控,而 Vidu 的另一個新功能「視頻延長」,解決了視頻敘事連貫性的問題。AI 視頻的一大痛點,就是時長太短。幾秒鐘的片段,很難講好一個完整的故事。而 Vidu 也很好地解決了這個問題,它搭載的視頻延長模式,讓故事可以被完整地講述出來。

我們可以通過兩個場景,來直觀感受它的強大之處。比如在一個動漫片段里,輸入的指令是:兩個小孩將手中的杯子放下,起身向屋外走去。

在生成的續寫片段里,兩個小孩的形象、服飾、包括周圍的環境,都保持了驚人的一致性。 從放下杯子,到轉身,再到邁步,整個動作自然連貫,沒有任何的突兀感。這證明 Vidu 延長功能對人物主體和動作的理解非常到位。而在另一個更復雜的動畫場景里,挑戰升級了。 原始視頻是一段8秒的動畫:男子在歡呼聲中將棒球扔出去。然后,讓 AI 進行延長,指令里特別加了一句:鏡頭跟隨棒球。最終,原來生成的8秒視頻,在「延長功能」選項中選擇延長6秒后,視頻被完美地延長到了14秒。
這段視頻厲害的地方有兩點:① 它精準還原了棒球飛行的物理軌跡,那個弧線非常真實。第二,也是更關鍵的,AI 竟然真的理解了「鏡頭跟隨」這種影視語言。

這也說明 Vidu 延長功能不只生成畫面,AI 還像一位專業的攝影師理解如何拍攝畫面,這一點就非常夸張了...更夸張的是,它的延長功能,還給了你導演級別的剪輯權。它允許你把一段生成的視頻,看作一條可以隨意剪開的時間線。你可以從中間截取最精彩的幾秒,從這里,讓 AI 給你一個新的故事分支。

而且,這個功能還針對不同用戶群體,設定階梯式的視頻時長上限:
① 免費用戶最長可延長至30秒。
② 標準版用戶上限為1分鐘。
③ 專業版用戶可延長至3分鐘。
④ 而為深度創作者設計的旗艦版用戶,則最高可享有5分鐘的延長權限。
但真正的王牌,其實是這套組合拳:「參考生」+「視頻延長」功能,前者保證主體像不像,后者決定視頻夠不夠完整。未來,我們完全可以期待,通過不斷地延長和組合,用 AI 生成一部擁有完整情節的動畫片,甚至一部微電影。人人都是導演的可能性,被無限放大了...
全新升級的 Vidu App
聊完了技術,我們再來看看產品。這也是 Vidu 這次升級,最讓我驚喜的地方。最近很多人都在聊 Sora 2 的App,說它是 AI 版的抖音。而擁有豐富國產元素的Vidu或許更值得期待。打開最新版Vidu AI?App,你會立刻進入一個沉浸式的視頻 Feed 流。對,就是我們最熟悉的那種上下刷的模式。

這個設計,徹底打通了內容生產、互動和內容分發三個環節。你在這里,可以邊刷別人的作品尋找靈感,邊進行自己的創作,然后一鍵發布,無縫銜接。看到好的作品,可以直接把它作為參考,進行二次創作,玩轉與不同角色、場景的合拍,整個社區的創意就像滾雪球一樣,越滾越大。創作、社交、分發,被完美地融合在了一起。

在規劃上, Vidu 想得更深一層。它從一開始,瞄準的就是一個完整的 AI 原生內容生態。在這里,每個人既是創作者,也是消費者,更是傳播者。
這種 AI 原生、生態先行的思路,才是它真正可怕的護城河。毫無疑問,Vidu Q2 的這次亮相,給整個 AI 視頻行業,都帶來了巨大的震撼。精準的「參考生」,強大的延長功能,以及一個完整的App生態,很清晰地指出了AI視頻的下一個進化方向:真正好用、人人可用的生產力工具。
現在,這個能力已經向所有人開放。升級后的參考生功能,已經正式登陸 Vidu Q2 模型,網頁端和全新升級的 App 均可使用,無需等待,即刻體驗。地址在這:www.vidu.cn
還可以去各大應用平臺下載Vidu AI APP,體驗全新的AI內容社交方式。

Vidu提供的,不僅僅是領先的技術,更是讓創意自由流動、碰撞、再生的全新內容生態。
將創造的權力,真正交還到大家手里。如果讓你來當導演,你最想創作一個什么樣的故事?
本文相關的視頻內容,可以在 @優設AIGC 公眾號觀看:https://mp.weixin.qq.com/s/DzDbqQB6kujG1yt_6vRstg




發評論!每天贏獎品
點擊 登錄 后,在評論區留言,系統會隨機派送獎品
2012年成立至今,是國內備受歡迎的設計師平臺,提供獎品贊助 聯系我們
MJ+SD智能設計
已累計誕生 771 位幸運星