ChatGPT 的強大相信大家都體驗過了,近日,微軟推出了更為強悍的全能型 AI--Kosmos-1。ChatGPT 是純文本 LLM,而它是更強大的多模式大型語言模型(MLLM)。研究人員在他們的學術論文中寫道:“作為智能的基本組成部分,多模態感知是實現人工智能的必要條件”。Kosmos-1 論文中的視覺示例顯示模型分析圖像并回答有關圖像的問題,從圖像中讀取文本,為圖像編寫標題,并以 22-26% 的準確度進行視覺智商測試。

微軟表示,它計劃向開發人員提供 Kosmos-1,大家可以期待一下哦~

