重磅消息回顧!2025年11月值得關注的8條AI資訊

往期回顧:

一、AI秒級生成3D場景!廈大x騰訊開源FlashWorld

近日,AI為3D內容生成領域又迎來了一項突破性進展。廈門大學與騰訊聯合研發的FlashWorld模型橫空出世,僅憑單張圖片或一段文字,就能在5-10秒內生成高質量3D場景,速度較以往提升10到100倍,同時渲染質量更加驚艷。

這項研究的問世,或許意味著我們離那個“人人都能快速創造3D世界”的時代又近了一步。

開源地址:https://imlixinyang.github.io/FlashWorld-Project-Page/

重磅消息回顧!2025年11月值得關注的8條AI資訊

二、南洋理工&騰訊ARC:分鐘級實時生成突破

近日,南洋理工大學&騰訊ARC實驗室:合作研發RollingForcing技術,通過聯合去噪、注意力池、高效訓練策略,單GPU實現分鐘級實時長視頻生成,解決誤差累積問題,生成視頻質量高。Rolling Forcing成功突破了實時長視頻生成的不可能三角,在保持16 fps實時生成速度的同時,顯著降低了長序列生成中的誤差累積,實現了分鐘級別的高質量視頻流生成,為交互式世界模型、神經游戲引擎等應用提供了基礎。

官方介紹:https://github.com/TencentARC/RollingForcing

重磅消息回顧!2025年11月值得關注的8條AI資訊

三、Lovart平臺上線“編輯元素”新功能

近日,針對海外市場的AI設計平臺Lovart宣布上線新功能“編輯元素”,能夠將圖片中的不同元素自動分離獨立圖層,并靈活調整細節。

這一更新也解決了AI生圖“難以局部修改”的常見痛點,Lovart的“編輯元素”功能,能夠像PS分圖層一樣,自動識別生成圖片中的各個元素,并將其拆分為獨立圖層。每個圖層均可單獨編輯并保存,且修改某一元素時不會干擾其他部分,大大提升了控制的精細度。

重磅消息回顧!2025年11月值得關注的8條AI資訊

四、OpenAI發布GPT-5.1,智商情商雙提升

11月12日,OpenAl正式官宣推出新一代旗艦模型GPT-5.1系列,官方表示此次升級旨在“讓ChatGPT更智能,對話體驗更有趣”。

此次發布距上一代GPT-5僅數月時間,此前GPT-5因缺乏“人味”、“刻板而缺乏創造力”引發用戶爭議,而GPT-5.1則實現了智能水平與溝通風格的雙重升級。

OpenAI公司CEO薩姆?奧爾特曼表示,GPT-5.1升級給力,尤其是指令遵循和自適應思考的改進,整體的智力和溝通風格提升也很顯著。

重磅消息回顧!2025年11月值得關注的8條AI資訊

五、谷歌“嵌套學習”突破LLM遺忘瓶頸

近日,谷歌推出了一種全新的用于持續學習的機器學習范式——嵌套學習,模型不再采用靜態的訓練周期,而是以不同的更新速度在嵌套層中進行學習,即將模型視為一系列嵌套問題的堆疊,使其能夠不斷學習新技能,同時又不會遺忘舊技能。

這或將標志著人工智能朝著「真正像大腦一樣進化的方向」邁出了一大步。嵌套學習代表了谷歌對深度學習理解邁進了新階段,通過將架構與優化視為統一的、層次化的優化系統,打開了一個全新的設計維度。

重磅消息回顧!2025年11月值得關注的8條AI資訊

六、英偉達發布OmniVinci全模態大模型

近日,英偉達(NVIDIA)開源了OmniVinci,一款能理解多模態世界的全模態大語言模型(Omni-Modal LLM)。

該模型實現了視覺、音頻、語言在同一潛空間 (latent space)中的統一理解,讓AI不僅能識別圖像、聽懂語音,還能推理、對話、生成內容。

這個9B的視覺-語音理解全模態模型剛上線就爆火,Huggingface模型權重目前已經有超過10000次下載量!

開源地址:https://github.com/NVlabs/OmniVinci

重磅消息回顧!2025年11月值得關注的8條AI資訊

七、Meta開源1600語言語音識別系統

近日,Meta基礎人工智能研究(FAIR)團隊推出了“全語種自動語音識別系統”(Omnilingual ASR),該系統可支持1600多種語言的語音轉寫,大幅拓展了當前語音識別技術的語言覆蓋范圍。

據Meta介紹,在其支持的1600種語言中,有500種系首次被任何AI系統所覆蓋。FAIR團隊將該系統視為邁向“通用語音轉寫系統”的重要一步,有望助力打破全球語言壁壘,促進跨語言溝通與信息可及性。

重磅消息回顧!2025年11月值得關注的8條AI資訊

八、Utopai Studios發布影視專用AI模型與工作流

近日,AI原生影視工作室Utopai Studios宣布推出專為電影與電視制作而設計的AI模型和工作流。

與目前主流的通用視頻模型不同,Utopai的AI模型并非為了生成短視頻或視覺效果,而是專為影視創作而生,具備“理解劇本、解析故事,并協助導演規劃鏡頭和生成場景”的能力。

將這些環節整合為一體后,系統可以強化故事結構、表演呈現與鏡頭連貫性——這些都是專業影視制作的關鍵能力。

重磅消息回顧!2025年11月值得關注的8條AI資訊

收藏 4
點贊 49

復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。