編輯:編輯部 HZj
【新智元導讀】 Day 4的演示中,OpenAI的未釋出的新模型竟然被泄露了?研究者曬出的界面中,「ChatGPT ε」一現身,就引起了網友絡繹不絕的討論。曾經很可能是GPT-4.5的「獵戶座」,終於要來了嗎?
OpenAI的新模型,竟被意外泄露了?
聖誕馬拉松第四天,網友們從OpenAI研究員Karina Nguyen介紹Canvas功能的貼文裏,發現了蛛絲馬跡。
一個名叫「ChatGPT ε」的模型,現身了。
有人猜測,這很有可能就是OpenAI的下一代模型「獵戶座」。
這個貼文很快引爆了社群,網友們經過更細致的研究,發現了新的亮點——
在Karina的瀏覽器我的最愛內,一個資料夾名為「Agents」,還有一個名為「Scientist Assistant」的分頁。
眼看引起了軒然大波,Karina旋即將貼文刪除了。
傳聞中的獵戶座,並不是GPT-5?
模型名稱中的「ε」,正是獵戶座中的那顆——參宿二(Alnilam)。
說起Orion這個名字,我們都不陌生。
此前OpenAI醞釀許久的草莓模型(推理模型o1的原型),曾引出多篇猜測。
The Information的一篇報道中曾寫道,草莓曾用來改進名為獵戶座(Orion)的新模型。具體來說,Orion的預訓練數據,正是由草莓模型生成的。
當時,有人猜測獵戶座就是下一代模型GPT-5,甚至GPT-6。
而草莓的作用,就是幫OpenAI克服獲取高品質數據的限制,從現實世界數據(如互聯網獲取的文本或影像)中訓練新模型。
草莓可以幫Orion減少幻覺的產生,因為AI模型是從訓練數據中學習的,所以它們看到的復雜推理的正確範例越多,就越好。
一個月前,The Information給出的全新曝料,也和所謂的「預訓練Scaling Law撞墻說」對上了。
據悉,獵戶座相對於GPT-4的提升,要遠小於GP4-3相對GPT-3的提升。因此,獵戶座大概不會被命名為GPT-5。
與之對應的,X上的「曝料哥」Tibor Blaho也透露說——
一些測試Orion的OpenAI員工說,在完成20%的訓練後,它就達到了GPT-4級的效能,但品質的提高小於從GPT-3到GPT-4的飛躍,這表明隨著高品質數據變得有限,傳統的Scaling Law可能正在放緩。
Orion的訓練涉及來自GPT-4和推理模型等先前模型的AI生成數據,這可能會導致它重現舊模型的一些行為。
OpenAI已經建立了一個「基礎」團隊,以開發新的方法,隨著高品質數據供應的減少,
OpenAI正在為明年初的計劃釋出完成Orion的安全測試,該測試可能會打破「GPT」命名慣例,以反映模型開發的變化
此外,還有爆料稱,OpenAI目前正在訓練一個在預訓練規模上介於GPT-4o和Orion之間的模型。
他們會先預訓練一個「基礎模型」,然後從中衍生出兩個模型:一個是傳統的聊天模型,另一個是真正的推理模型。
而Orion的訓練時間,也打破了1-2個月的常規,超過了3個月。
原因就在於,推理模型的「反饋迴圈」機制,使得這種情況發生了變化。
而Karina螢幕中透露的「Agents」,也讓人有諸多聯想。
智慧體是所有人一直期待的東西。而這次泄露是OpenAI有意的嗎?
有人猜測,Scientist Assistant可能是prompt摘要,agents folder看起來像傳統的瀏覽器資料夾
網友熱議:OpenAI明天又有大釋出?
對於ChatGPT ε,有網友猜測道:「在同一張截圖中,他們似乎正在執行某種epsilon模型——可能是GPT 4.5?」
還有網友理性分析了引起討論的分頁和資料夾,猜測「Scientist Assistant」可能是提示的摘要,而「agents」資料夾看起來像是一個傳統的瀏覽器資料夾。
也就是說,這些可能和新功能新產品沒什麽關系。
還有網友覺得無論如何,這都是「有意為之」。有可能就是一種行銷手段。
在這條Reddit貼文下,還有人總結了一下OpenAI的聖誕馬拉松規律——
看起來他們現在似乎在遵循一種「A/B模式」,交替進行「大釋出」和「小釋出」。希望明天能迎來一個「大釋出」。期待能有高級模式的視訊功能!
是的,有關視訊功能的訊息也已經初見端倪了。
ChatGPT的視覺語音模式要來了?
據悉,ChatGPT帶有視覺功能的高級語音模式(以下簡稱「視覺語音模式」)即將向付費使用者開放。
60 Minutes最近在X上釋出了一條將近3分鐘的視訊。視訊中,OpenAI總裁Greg Brockman親自向我們展示了ChatGPT視覺語音模式的能力。
它可以透過即時視訊看到視野範圍內的人們正在做什麽,並與他們進行即時的語音互動。
視訊中,ChatGPT實力變身全能老師,既當生物考官,又當數學老師——
它流暢地主持了一場解剖學測驗,能夠即時審閱黑板上的手繪答案並提供反饋;還寫了一首三角形面積公式的押韻歌,並用英式口音唱了出來。
解剖學測驗
在演示視訊中,Brockman向ChatGPT發令:「你將對他進行測試,讓他畫出你想測試的任何身體部位,並讓他標註出來。」
指令發出後,Brockman的手機網路攝影機便一直對準黑板,ChatGPT開始主持這場對Anderson Cooper的測試。
ChatGPT開考第一題:請標註心臟的位置!
Anderson在一個非常草率的人體示意圖裏,隨便畫了一個完全不圓的圈,標註出心臟的位置,GPT便成功地理解了他在做什麽。
接著,ChatGPT又請他畫出大腦的位置,Anderson準確地畫了出來。GPT毫不吝嗇地稱贊了他。
然後,ChatGPT又出了一個題,讓Anderson畫出肝臟的位置。
Anderson聽到題目後感慨了一句「這有點難」,ChatGPT立馬就捕捉到了他的輕微焦慮,並告訴他「別緊張」。整段對話流暢得像真人家教,唯一的區別是,GPT的聲音有點機器人味兒。
Anderson把肝臟畫在了錯誤的一側,ChatGPT禮貌地糾正了他。
最後,Brockman讓GPT評價了一下這張圖——
計算三角形面積
視訊中,大家還讓GPT客串了一下數學老師。一開始,它準確地說出了計算三角形面積的公式。
不過,當Khan故意指著三角形的邊問「這裏的高是這個4嗎」,AI並沒有發現錯誤。
看來,平面幾何題要比人體器官部位要難一些。