趨勢搶先知!2025年7月值得關注的10條AI資訊

往期回顧:

一、Perplexity 推出 AI 驅動瀏覽器 Comet

Perplexity 推出首款 AI 驅動網頁瀏覽器 Comet,旨在挑戰谷歌搜索作為用戶獲取信息主要途徑的地位。該瀏覽器初期向每月 200 美元的 Max 計劃訂閱者及少量等待名單邀請用戶開放,核心特色是預裝并默認設置 Perplexity 的 AI 搜索引擎,突出展示其核心產品 ——AI 生成的搜索結果摘要。同時,瀏覽器內置全新 AI 助手 Comet Assistant,可自動完成日常任務,如總結郵件和日歷事件、管理標簽頁、代用戶瀏覽網頁等,用戶可通過側邊欄調用該助手,使其查看網頁內容并解答相關問題。

趨勢搶先知!2025年7月值得關注的10條AI資訊

二、谷歌發布 32 個 T5Gemma 模型

谷歌發布編碼器 - 解碼器架構的 T5Gemma 系列模型,同時還推出了用于健康 AI 開發的多模態模型 MedGemma。T5Gemma 采用 “適應” 技術,將預訓練的僅解碼器模型轉換為編碼器 - 解碼器架構,可靈活組合不同大小模型,平衡質量與效率。實驗顯示,T5Gemma 在多個基準測試中表現優異,尤其在推理密集型任務上,相比僅解碼器的 Gemma 2 有顯著提升,被認為可能推動編碼器 - 解碼器架構復興。MedGemma 包含 4B 和 27B 大小的模型,能輔助醫療診斷,表現良好。

趨勢搶先知!2025年7月值得關注的10條AI資訊

三、馬斯克 xAI 發布 Grok4

馬斯克旗下 AI 公司 xAI 發布最新旗艦大模型 Grok 4 及多智能體版本 Grok 4 Heavy,并推出每月 300 美元的高價訂閱計劃 Super Grok Heavy。在 “人類的最后考試” 中,Grok 4 無工具時準確率 25.4%,超谷歌 Gemini 2.5 Pro 和 OpenAI o3;Grok 4 Heavy 帶工具得分 44.4%,表現亮眼。其在多學科測評中成績優異,馬斯克稱其科研能力超人類博士,還能處理源代碼文件。此外,Grok 4 已在庫存管理、游戲創作等領域落地,未來還將推出編碼、多模態、視頻生成等模型,與 OpenAI 的 GPT-5 形成競爭態勢。

趨勢搶先知!2025年7月值得關注的10條AI資訊

四、新版 PNG 格式發布

新版 PNG 格式規范發布,沉寂 20 余年的 PNG 格式重煥活力。美國國會圖書館等機構均推薦該格式,此次更新由 Adobe、蘋果、谷歌等多巨頭參與推動。新功能包括:一是完善 HDR 支持,僅用 4 字節即可實現,且具備前瞻性;二是正式認可 APNG 動畫格式,此前該格式已獲廣泛支持;三是官方支持 Exif 數據,可存儲版權、GPS 等附加信息,同時還進行了錯誤修正和說明澄清等整理工作。目前,Chrome、Safari、Photoshop 等眾多程序已支持新版 PNG 規范,廣播領域的硬件和工具也在更新適配。后續計劃推出第四版更新以提升 HDR 與 SDR 的互操作性,第五版將研究壓縮優化及并行編解碼功能。

趨勢搶先知!2025年7月值得關注的10條AI資訊

五、B 站推“代號 H”AI 創作工具

B 站推出 “代號 H” AI 創作工具,聚焦視頻播客領域,該工具可實現音頻內容視頻化,支持文案、音頻輸入,適配播客和泛知識雜談圖文模板,能在 6 分鐘內生成千字內容視頻,未來預計縮至 3 分鐘,定向邀請用戶體驗反饋超預期。

趨勢搶先知!2025年7月值得關注的10條AI資訊

六、京東推出兩款 AI 社交產品

京東在其 App 內推出兩款 AI 社交產品 “寵 TA” 和 “聊愈小宇宙”,虎牙則推出首個 AI 助手產品 “小虎 AI 加工坊”。“寵 TA” 是以寵物為中心的 AI 社區產品,用戶可與寵物或寵物數字人形象的智能體聊天,兼具換裝、寵物數字人等可玩性功能,還設有寵物醫生咨詢、食品購買專區,將情感陪伴與消費場景結合,形成 “邊玩邊買” 閉環。“聊愈小宇宙” 是 AI 類對話產品,能識別用戶情緒,提供情緒記錄、解壓游戲等服務,用戶可與 AI 心理咨詢師聊天,還可在 “微光社區” 交流,同時提供專業心理咨詢師付費服務,增強用戶認同感。

趨勢搶先知!2025年7月值得關注的10條AI資訊

七、字節上線“小荷 AI 醫生”

字節首款 AI 醫療助手獨立 App “小荷 AI 醫生” 上線,定位健康管家,提供健康咨詢、報告解讀等服務。用戶注冊登錄后進入對話界面,可咨詢疾病自查、用藥參考等健康問題,AI 會主動收集關鍵信息(如癥狀持續時間),并通過讓用戶上傳診斷報告、拍攝病灶圖片等方式,結合信息給出建議。其還能解讀血常規等報告,快速分析指標異常,評估狀況并給出建議;支持拍攝藥盒查詢藥效說明。2024 年中國 AI 醫療器械市場規模達 96.41 億元,預計 2025 年將達 242.3 億元,大廠競速或重新定義 AI 健康邊界。

趨勢搶先知!2025年7月值得關注的10條AI資訊

八、vivo 發布端側多模態模型

vivo AI Lab 發布端側多模態模型 BlueLM-2.5-3B,參數量僅 2.9B,專為端側設計,緊湊高效。該模型融合文本與圖文理解推理能力,支持長短思考模式切換及思考預算控制,可直接理解 GUI 界面。在 20 余項評測中表現突出:文本任務上,緩解多模態模型文本能力遺忘問題,與同規模文本模型效果相近,優于同規模及更大規模多模態模型;多模態任務領先同規模模型,部分接近大規模模型;GUI 理解能力在同規模模型中領先,尤其中文場景表現優異。

趨勢搶先知!2025年7月值得關注的10條AI資訊

九、騰訊元器接入微信支付 MCP

騰訊元器宣布正式接入微信支付 MCP,成為首個接入該支付解決方案的智能體開發平臺。這一舉措支持開發者在智能體上直接添加下單、贊賞、查詢訂單等功能,打通了智能體商業化的最后環節。開發者僅需通過簡單的提示詞調用或工作流編排,就能快速接入微信支付 MCP,使智能體具備支付能力。目前,元器平臺已向開發者開放微信支付 MCP 的體驗版本,正式版本將在資質審核通過后開放。

趨勢搶先知!2025年7月值得關注的10條AI資訊

十、字節發布 Xverse 圖像生成模型

字節發布多主體控制生成模型 Xverse,可對設定的每個主體進行精確控制,且不破壞圖像生成質量,能應對多主體、多光源、多風格等場景。其核心是通過學習 DiT 中文本流調制機制中的偏移量,實現對多個主體身份和語義屬性的一致控制,包含 T-Mod 適配器、文本流調制機制、VAE 編碼圖像特征模塊及兩種正則化技術等關鍵組成部分。對比測試顯示,Xverse 在單主體、多主體任務及整體表現上均優于 MS-Diffusion、OmniGen 等領先技術。

趨勢搶先知!2025年7月值得關注的10條AI資訊

收藏 5
點贊 66

復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。