GPT-4 重磅發布!零基礎也能一秒做網站了?

大家好,這里是和你們聊設計的花生~

當我還沉浸于收集各種基于 ChatGPT 開發的 AI 效率神器時,OpenAI 竟然發布了 GPT-4。之前為大家介紹 ChatGPT 時就提到過它使用的是 GPT-3 的模型,而當時 OpenAI 的研發進度其實已經超過了 GPT-3,但是沒想到 GPT-4 的發布會這么突然,一時間網上鋪天蓋地都是關于 GPT-4 的各種消息,看來真的是功能很強大,廢話不多說,一起看看和 GPT-3 相比 GPT-4 有哪些進步吧~

GPT-4 重磅發布!零基礎也能一秒做網站了?

往期回顧:

一、接受圖片輸入并識別內容

這次發布最令人激動的一點就是 GPT-4 支持多模態(接受圖像和文本輸入,發出文本輸出),這意味著我們可以發送圖片給 GPT-4,并指示它識別分析圖片的內容,圖片的類型可以是帶有文字和照片的文件、圖標或者屏幕截圖。

雖然該功能目前僅供預覽,沒有開放給用戶,但從官方論文和直播公布的案例來看,GPT-4 并不是簡單地描述圖片的內容,而是能夠理解內容物之間的聯系,并做出進一步的判斷和動作,也就是說 GPT-4 理解圖片能力與它理解文本的能力不相上下。比如下面的案例,將一張圖片發送給 GPT-4 分析它的笑點,GPT-4 能非常準確地識別一張圖片中的不同部分,理解它們之間的邏輯關系,并之指出笑點所在。

GPT-4 重磅發布!零基礎也能一秒做網站了?

它也能識別出圖片的不合理之處,或者推斷出圖片內容狀態被改變時會發生什么事情。

GPT-4 重磅發布!零基礎也能一秒做網站了?

GPT-4 還能像理解文本內容一樣,理解圖像內的文字并按照用戶指示作出下一步的操作,比如分析論文內容然后總結提煉。OpenAI 在官方直播里還展示了一個神奇的案例 —— 利用 GPT-4 的識圖功能,結合其強大的代碼編寫能力,將簡單潦草的手繪網頁線框草稿轉換為代碼,從而制作出一個真正的網頁。

GPT-4 重磅發布!零基礎也能一秒做網站了?

GPT-4 重磅發布!零基礎也能一秒做網站了?

二、在專業和學術領域上表現的提升

OpenAI 官方在介紹 GPT-4 時著重強調的另一點是“在各種專業和學術基準上表現出人類水平的表現”,比如它通過了模擬律師考試,分數排名在所有應試者的前 10% 左右,相比之下 GPT-3.5 的得分則在倒數 10% 左右,且 GPT-4 在其他各種專業和學科模擬考試中也有不俗的表現。當時看到這個的我只覺得這不是“表現出”人類水平,而是“超過”大部分的人類水平了,之后估計會出現很多公司直接讓 GPT-4 對接服務客戶的情況,畢竟專業能力都是過關的。

GPT-4 重磅發布!零基礎也能一秒做網站了?

OpenAI 的研發團隊還進一步提升了 GPT 的英語能力,GPT-4 的英語翻譯準確度為 85.5%,比 GPT-3.5 的 70.1% 高出 15%。而且在模擬測試中 GPT-4 在意大利語、德語、西班牙語、法語、日語、韓語、土耳其語、俄語等 24 種語言中的翻譯表現都優于與其他大型語言模型的英語表現,包括拉脫維亞語、威爾士語和斯瓦希里語等低資源語言。

GPT-4 重磅發布!零基礎也能一秒做網站了?

據 OpenAI 官網顯示,在線免費語言學習平臺多鄰國 Duolingo 將把 GPT-4 融入自己的應用中,以推進產品的兩個新功能:角色扮演(Role Play)和解釋我的答案(Explain my Answer)。之前多鄰國一直嘗試通過腳本化的對話與學習者 "聊天",其中包含了各種經典的場景,如點菜、第一次見面或買機票。而接入 GPT-4 后,多鄰國將擁有在小眾背景下與學習者 "沉浸式 "交談的能力——比如就籃球或到達山頂的幸福感進行自由交談。

GPT-4 重磅發布!零基礎也能一秒做網站了?

三、可操控性增強

與之前 ChatGPT 固定的一種的語氣和風格不同,GPT-4 的可操控性更強,可以扮演各種指定角色,以不同的言語行為風格與用戶進行互動,比如給五年級的小學生當數學老師、做你的程序編寫小助手,或者扮演一個莎士比亞式的海盜頭子和你對話。

GPT-4 重磅發布!零基礎也能一秒做網站了?

GPT-4 重磅發布!零基礎也能一秒做網站了?

OpenAI 還通過多個介紹視頻展現 GPT-4 的其他進步,比如在文字輸入限制方面由 GPT-3.5 的 3000 字提升成 25000 字,之后針對同一話題或對象,用戶和 ChatGPT 會有更寬更深的討論空間;總結能力提升,可以用一句話總結一份論文,以及對比兩篇文章并總結出他們之間的共同點;事實推理能力增強,可以理解稅務法并幫人們報稅;代碼編寫能力進一步增強,簡單的代碼已經無需人類輔助修改,復雜代碼雖然不能一次成功,但出現的問題可以再次反饋給 GPT-4,它會自動根據上下文檢查錯誤點并重寫代碼。

GPT-4 重磅發布!零基礎也能一秒做網站了?

推特用戶@Pietro Schirano 用 GPT-4 在 60 秒 內編寫出經典游戲《Pong》,圖片內容來源: https://twitter.com/skirano/status/1635736107949195278

GPT-4 重磅發布!零基礎也能一秒做網站了?

推特用戶@Jakebrowatzke 用 GPT-4 在幾小時內做了一個 Chrome 插件,而他毫無編程基礎,圖片內容來源: https://twitter.com/jakebrowatzke/status/1635882037319008258

四、局限性

盡管 GPT-4 功能已經十分強大了,但它仍然存在著之前就有的局限性。比如 模型數據仍停留在 2021 年 9 月之前,對這個時間點之后發生的事情缺乏了解,并且也無法意識到自己的這種缺陷,因此無法吸取教訓進行改進。

GPT-4 仍然不是完全可信賴。雖然對抗性訓練讓那 GPT-4 在事實性上比最 GPT-3.5 高出了 40%,但它還是會出現編造事實、推理錯誤的情況,特別是在需要理解上下文的情況下。對于 GPT-4 輸出的內容最好進一步人工審核,或者在提供完整的上下文信息,或者避免出現需要讓 GPT-4 聯系上下文進行理解的情況。

GPT-4 在理解俗語上的表現與研究人員的期望還有很大差異,比如“teach an old dog new tricks”是一個英語俗語,字面意思是“教老狗玩新花樣 ”,用來比喻人們很難或不可能教會別人新的技能或改變別人的習慣,尤其是當他們一成不變或長期以來一直以某種方式做事。當問 GPT-4 “Can you teach an old dog new tricks?”,它只能理解字面意思,從而給出錯誤回答“Yes, you can teach an old dog new tricks”。

GPT-4 還會忽略提問中的一些細節,導致給出錯誤的答案,需要人為指正;會像人類一樣無法處理難題,比如它生成的代碼會存在安全漏洞;還有會輕易相信用戶主張的虛假信息,但是這一點已經改進不少,因為 Twitter 上有人拿之前戲弄 ChatGPT 的一個問題去測試 GPT-4,被 GPT-4 駁回了并且申明“我的目的是提供準確的信息”。

當然 OpenaAI 一直在致力于改進和完善這些缺陷,努力讓訓練更穩定安全,目前取得的成果包括提高了 GPT-4 拒絕合成危險化學品相關請求的能力、不響應敏感的請求(如醫療建議和自我傷害)等。

GPT-4 重磅發布!零基礎也能一秒做網站了?

圖片來源: https://twitter.com/DrJimFan/status/1636120223853199362

已經開通 ChatGPT Plus 的用戶可以直接體驗最新的 GPT-4 模型,GPT-4 的 API 也開放了等候名單,感興趣的小伙伴可以申請。如果你有新版 Bing 的預先體驗權,那么恭喜啦 ,GPT-4 在發布前 6 周就已經被置入到 Bing 中了。

最新消息稱 GPT-5 會在今年年底前發布,讓人十分期待會出現哪些更強大的功能。不過在此之前基于 GPT-4 開發的各種 AI 神器應該也夠我們期待一波了。對于 GPT-4 和未來將出現的 GPT-5 你有哪些想法呢?歡迎在評論區分享。喜歡本期內容的話可以多多點贊收藏,之后會繼續為大家推薦更多最新的 AI 資訊。

GPT-4 官方介紹:GPT-4 --- GPT-4 (openai.com)
GPT-4 API 申請渠道:GPT-4 API waitlist --- GPT-4 API 候補名單 (openai.com)

參考資料:

  1. https://mp.weixin.qq.com/s/kA7FBZsT6SIvwIkRwFS-xw
  2. https://weibo.com/5498125999/Mxnih6TXu
  3. https://www.youtube.com/watch?v=outcGtbnMuQ
  4. https://twitter.com/OpenAI/status/1635687373060317185
  5. https://openai.com/research/gpt-4

推薦閱讀:

贊賞
收藏 52
點贊 43

復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。