2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

一篇文章帶你回顧2024年,AIGC 領域的重磅產品和新模型。

更多AIGC 干貨:

一月

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「趨勢」釘釘與 IDC 聯合發布的《2024 AIGC 應用層十大趨勢白皮書》。

二月

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「模型」大模型 Sora 發布。美國人工智能研究公司 OpenAI 正式對外發布人工智能文生視頻大模型 Sora,該模型能夠根據用戶的文本提示創建最長 60 秒的逼真視頻。

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「產品」字節跳動推出的一站式 AI Bot 開發平臺「扣子」正式發布;

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「模型」谷歌發布 Gemini 大型語言模型。谷歌正式宣布將旗下 Bard AI 聊天機器人更名為 Gemini,并同步推出了專為安卓用戶打造的 Gemini 應用。Gemini 是谷歌最新、最大規模且功能最為強大的大型語言模型,其發布進一步推動了 AIGC 在對話和搜索引擎集成 AI 領域的發展。

三月

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「模型」Claude3 模型發布。該模型是 Anthropic 發布的最新 AI 大模型系列,包括 Claude 3 Haiku、Sonnet 和 Opus 三種型號。該系列模型在設計時考慮了提高對各種問題的響應能力,特別是在處理復雜推理任務時表現出色。其中,Opus 模型在執行高級推理 任 務 時 的 表 現 優 于 OpenAI 的 GPT-4 和 谷 歌 的 Gemini Ultra。

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「模型」北大團隊聯合兔展發布了 Open Sora 文生視頻大模型。旨在通過文本輸入生成視頻內容。該模型是北大團隊與兔展合作發起的 Sora 復現計劃的一部分,提供了完整的視頻生成解決方案,包括視頻數據預處理、加速訓練、推理等。

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「模型」Yi-9B 大型語言模型。該模型是李開復旗下 AI 公司零一萬物開發的,Yi-9B 是一款具有 90 億參數的大型語言模型,特別加強了在代碼和數學方面的學習能力。該模型在代碼和數學能力上達到了前所未有的高度,同時保持了對消費級顯卡的良好兼容性,為廣大開發者和研究人員提供了前所未有的便利性和強大功能。

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「模型」Stability AI 發布 SD3 大模型。采用了與 Sora 相同的 DiT(DiffusionTransformer)架構,生成的圖像質量實現了顯著提升。該模型支持多主題提示,并改進了文字書寫效果。Stability AI 表示,Stable Diffusion 3 在基于人類偏好的評估中優于當前最先進的文本到圖像生成系統。

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「模型」蘋果公司發布了 MM1 大型多模態基礎模型 。MM1 是蘋果公司最新發布的一款大型多模態基礎模型,擁有 300 億參數,采用了 MoE 架構。該模型是蘋果在 AIGC 領域的重要布局之一,展示了蘋果在 AI 技術方面的深厚積累和創新實力。

四月

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「模型」 生數科技發布 Vidu 視頻生成大模型。生數科技發布了 Vidu 視頻生成大模型,該模型融合了 Diffusion 與 Transformer 技術,開創性地創建了 U?ViT架構。Vidu支持一鍵生成長達16秒、分辨率1080P 的高清視頻內容,展現了 AIGC 在視頻生成領域的強大能力。

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「模型」昆侖萬維發布天工音樂大模型。昆侖萬維推出了天工音樂大模型,這是中國唯一公開可用的音樂 AIGC 模型。該模型的 AI 人聲合成技術達到了業內領先水平,為音樂創作和生成提供了全新的解決方案。

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「模型」微軟發布 Phi-4 移動端大模型。微軟研究院發布了 Phi-4 移動端大模型,該模型延續了 Phi 系列的小參數模式,盡管只有 140 億參數,但在多項基準測試中表現出色,甚至在某些方面超越了參數更多的模型。Phi-4 的發布展示了微軟在移動端 AI 技術方面的實力。

五月

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「發布」OpenAI 發布 GPT-4o。OpenAI 發布了 GPT 4的迭代產品——GPT-4o,并宣布向所有用戶開放。

這一消息的發布不僅提升了用戶對 ChatGPT 的興趣,也促使國內大模型產品開始考慮降價策略以應對競爭。GPT-4o 的發布進一步推動了生成式 AI 技術的發展,為用戶提供了更高質量的服務、更有趣的對話體驗以及更有用的信息。

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「產品」即夢 AI 正式上線,提供圖片生成和智能畫布等功能。

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「模型」阿里云在 AI 智領者峰會上發布了通義千問 2.5 版 本 , 并 開 源 了 1100 億 參 數 模 型 Qwen1.5-110B。相較于 2.1 版,2.5 版本在理解能力、邏輯推理、指令遵循及代碼能力上分別實現了 9%、16%、19%和 10%的提升。此外,通義還不斷拓展其應用場景,新增了文生圖、智能編碼、文檔解析、音視頻理解等功能。

六月

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「模型」可靈 AI 發布可靈 1.5 模型,其產品被用于電影拍攝,九個導演已經用它拍完片子。

七月

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「產品」可靈宣布國際版 1.0 全球上線,同時國內版本也進行了基礎模型的升級,并全面開放內測。

八月

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「模型」Flux.1 發布,包含專業版、開發者版和快速版三種模型。其中,專業版和開發者版在性能上擊敗了 SD3-Ultra 等主流模型,而快速版 FLUX.1 schnell也超越了 Midjourney v6.0、DALL·E 3 等更大的模型。

九月

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「產品」阿里通義 AI 實驗室宣布,將在即將舉行的云棲大會上推出一款創新視頻生成大模型。該模型的預約通道已在通義 App 及通義萬相 PC 平臺上開放,但具體使用權限尚未向公眾開放。這款大模型融合了“文生視頻”與“圖生視頻”兩大創意模式。

十月

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「模型」Flux 推出了 1.1 Pro 版本,并在 Beta 版中推出了 BFL API,進一步提升了模型的性能和易用性。

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「模型」Stability AI 正式發布了其最新的 StableDiffusion 3.5 系列 AI 圖像模型。與前一版本相比,Stable Diffusion 3.5 在現實感、提示依從性以及文本渲染質量方面均有顯著提升。

十一月

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「模型」2024 年 11 月,超清 AI 圖像生成模型 FLUX1.1 Pro Ultra 發布,支持高達 4 兆像素的分辨率,生成速度大幅提升。

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「工具」ComfyUI:啟用了新 UI(Beta UI)作為默認界面,提升了用戶體驗

?十二月

2024 AIGC 行業重大事件回顧:可能改寫歷史的瞬間

「發布」OpenAI 12 天超長發布會。OpenAI 在 2024 年 12 月舉辦了一場為期 12 天的超長發布會,期間陸續發布了多款新產品和功能,包括完全體的 o1 推理模型、o1-mini 強化微調技術、Sora Turbo 視頻生成版本 、Canvas 工作臺 、ChatGPT 與 AppleIntelligence 的集成、高級語音模式、Projects 項目管理功能、升級后的 ChatGPT 搜索功能、o1 推理模型 API 開放、辯論游戲、Microscope 神經網絡分析工具,以及新一代推理模型 o3。這些發布內容不僅展現了 OpenAI 在 AI 領域的創新實力,也為 AI 產業的未來發展指明了方向。

收藏 30
點贊 39

復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。