編輯:編輯部 HYZ
【新智元導讀】谷歌開發者暗示,我們直接進入ASI的可能性,正在逐月增加!Ilya早就看到了這一點,因為擴充套件測試時計算的成功,證明目前的路徑能夠到達ASI。與此同時,AI學會自我改進、取代人類研究員的未來似乎也愈發逼近,到時再拔網線來得及嗎?
2024年最後一天,谷歌開發者大佬Logan Klipatrick的一個預測,如同扔下了一枚重磅炸彈——
我們直接進入ASI的可能性,正在逐月逼近。
而這,就是Ilya所看到的。
Klipatrick分析道,Ilya創立了SSI,計劃直接向ASI邁進,沒有中間產品,沒有中間模型。
曾經,許多人(包括Klipatrick本人在內)都覺得這種方法不可能起作用,因為如果透過模型和產品啟動飛輪效應,就能建立真正的護城河。
然而,擴充套件測試時計算的成功表明,這種持續直接擴大規模的路徑實際上可能是可行的。
這一點的早期跡象,可能已經被Ilya看到了!
如今,我們仍會迎來AGI,但4年前大家普遍認為它會成為一個歷史性的轉折點,但如今AGI的誕生可能更像是一次普通的產品釋出,而在短期內,市場上會湧現出許多叠代和類似的選擇。
這,可能是對人類最好的結果。
有人做出梗圖,表示Ilya看到的,就是整個地球都會被太陽能電池板和數據中心覆蓋
OpenAI研究員Stephen McAleer稱,今天在諾伊谷見到了Ilya,瞬間感到一股AGI誕生的激動湧上心頭。
擴充套件測試時計算,就是ASI秘訣?
的確,擴充套件測試時計算的巨大作用,最近一再被各位學者強調。
OpenAI研究員Jason Wei總結了過去五年,自己在AI方面最大的技術教訓。
在他看來,每一個教訓,都讓自己對於「該在哪裏分配精力」發生了重大轉變。回想起來,這些教訓事後看都是顯而易見的,但在事前就很難知曉。
其中,2024年的教訓,就是「擴充套件測試時計算」。
另一位OpenAI研究員Shyamal就特意發出長文「更好的教訓」,強調不要低估延長LLM思考時間的作用!
Shyamal強調,我們仍然低估了僅僅透過給LLM更多的思考時間,就能得到的東西。
比如AlphaGo的進步,就並非來自復雜的手工設計功能,而是來自簡單方法的規模化,在推理中套用大規模搜尋,以及整合深度強化學習。
正如AI領域「苦澀的教訓」所揭示的,最重要的往往就是scaling已證明有效的方法。
其中的簡單洞見就是,深度學習(與適當的規模擴充套件結合)往往好於更精巧的方法。
我們需要的不是復雜的架構,而是更多的算力、數據,以及讓模型能思考更長時間、更好地與環境互動的方法。
最近AI能力的最新框架——聊天機器人、推理器、AI智能體、組織,都反映了整個行業的發展行程。
從與人對話的簡單界面開始,聊天機器人開始發展為推理器,更多工具整合後,它們就演變為了智能體。隨後,它們形成了組織——並列工作的分布式智能網絡。
在這個過程中,AGI從一個模型轉變為一個系統,一個能大規模協調、寫作和執行的系統。
最能體現這一進展的,莫過於OpenAI的o1了。
o1在Codeforces中排名第89%,在美國數學邀請賽(AIME)中躋身前500名
它在解決問題時會運用CoT,透過強化學習不斷完善思維鏈,將復雜問題分解為可管理的步驟,在需要時轉向新的方法。這種叠代過程中提升了它的推理能力,凸顯出思考更長時間及適應力思考的系統的潛力。
而在企業中,這種轉變也是類似的。
今天的模型只是總結文件、進行推理,在明天,它們就會成為強大的內部顧問,處理復雜程式碼、審查合約、協同整個工作流。這是一種全新的「測試時計算」。
所有這些進展都基於一個關鍵洞見:智能不僅僅局限於生物大腦。它是一種我們可以設計和擴充套件的物理特性。
此前爆火全網的研究「螞蟻AGI」中,螞蟻群體在解決搬運難題中表現出的智能,竟超越了人類
深度學習確實行之有效。我們學會了將沙子熔化成矽,然後將矽排列成能儲存和處理資訊的芯片。現在我們已經教會這些芯片如何思考它們所包含的資訊。
我們正在進入一個智能可按需獲取、規模化,並透過謹慎約束和對齊來引導的時代。
如果允許這些系統更深入地思考並始終與人類價值觀保持一致,我們才剛剛開始挖掘它們的潛力。
人類在歷史上一直做的事情,就是不斷造出東西,然後造出能大規模建造這些東西、使其有用的工具。
那,AGI怎麽辦?
有人說,我們直接奔著ASI去了,別再惦記AGI了。
不過,在ASI之前,科技公司大佬們就AGI還有很多話要說。他們紛紛對AGI發展時間線做出了預測。
柯曼一直以來都對AGI持樂觀態度。他認為,2025年可能就是節點,但未做出明確的承諾。
OpenAI對AGI的定義
Anthropic CEO Dario Amodei雖然對AGI這一概念本身持謹慎態度,但根據當前AI發展趨勢,他預計AGI將在2026-2027年實作。
xAI CEO馬斯克預測也更為大膽,他表示最遲到2026年就能實作AGI。
Meta AI首席科學家Yann LeCun表示,如果當前研發計劃順利,人類水平的AI可能會在5-6年內問世。
而DeepMind CEO Demis Hassabis給出了更為保守的預測,他認為距離真正的AGI還需約10年時間,且在此過程中仍需2-3項重大技術突破。
與此同時,谷歌也在AGI時間預測上表現得十分謹慎,未給出具體的時間表。
另一位前OpenAI研究員Daniel Kokotajlo預測道,2025-2028年之間,OpenAI、Anthropic、DeepMind的AI系統能夠進行自主研究。
而且,它們將超越人類,學會自我改進,最終取代人類研究員。
一篇LessWrong的文章中,總結了當前AI領域不同專家就5年內實作AGI的不同觀點。
一些人認為,AI階躍式進展和自動化研究,可能很快就會帶來AGI。
2023年,在對2,778名AI研究人員的一項調查顯示,AGI實作有50%的可能性在23-92年之間。
然而,時間跨度僅過去了一年,最新調查(Feng等人)卻顯示,16.6%受訪者認為AGI會在5年或更短的時間內實作。
還有網友表示,我們正處於AGI邊緣,一旦實作了AGI,再有1-2年時間我們就能達到ASI的水平。
他預測,屆時,AI將開始指數級的自我提升,奇異點就會出現。我們將見證一場前所未有的指數級技術爆發,這是幾十年前的人們無法想象的。
而且,任何在物理法則範圍內可能存在的事物都可能實作——癌癥將被治愈,商品和服務的成本將接近於零,所有的可能性都將變為現實。
AGI前夜的思考
站在AGI前夜,未來我們將面對的是什麽?
幾天前,AI初創公司CEO Will Bryk釋出了一篇長文,直言我們生活在AGI前夜,正見證著這場人類文明的巨變。
o3釋出之後,讓Bryk和朋友們深刻感受到AGI正在逼近。
其實,OpenAI早在兩個月前就向所有人展示了,測試時計算的scaling law。
但令他們難以置信的是,這一切竟發生地如此之快——2個月的時間,大學水平的AI就跨越到了博士級的AI。
從o3身上能夠看到,未來發展路徑非常清晰。它能夠在任何可以定義獎勵函數的領域表現優異,尤其數學、編程領域。
不過,在小說創作領域還是相對困難。
這意味著在短期內(1年內),我們將看到能力分布不均衡的模型:
它們在數學、編程、泛化推理方面達到接近AGI的水平,但在創意協作方面可能仍顯平庸。
而從長遠來看(1-3年),隨著全新訓練數據,比如情感、感知數據加入進行強化學習,這些盲點將被逐漸修復,屆時LLM將毫無疑問地成為真正的AGI。
智能體真的要來了!
像o3這樣的模型,完全可以在瀏覽器和應用程式裏自主操作、執行任務,這種能力的獎勵模型也很容易設計。
而且,這個市場潛力巨大——自動化電腦工作,無論是數據處理還是復雜的工作流,都會有很大的需求。
對於那些需要證明自己巨額投入合理性的實驗室來說,這更是一個動力。
Bryk預計,到2025年12月,你可能只需要告訴電腦一個任務,它就能透過瀏覽網頁、操作應用程式,輕松完成任何涉及數據流轉的工作流。
數學家700天倒計時
Bryk還提到,在所有領域中,數學家可能面臨巨大的沖擊。
因為數學工作純粹在符號空間中進行,幾乎不受物理世界的限制,而這也恰恰是大模型擅長的領域。
他預計,700天後,人類可能不再是已知宇宙中,數學領域的最強大腦。
程式設計師,職業末日?
對於軟件工程師來說,短期內這將是一個絕佳的基於。相當於,每位工程師都獲得了一次晉升。
到2025年底,編程更像是一個「指揮官」的工作——程式設計師指揮一群AI智能體去完成各種任務。
而且,不像數學家一樣,軟件工程師並不會完全被AI自動化。
因為他們需要和物理世界進行互動,需要與客戶、團隊成員互動,理解需求,在組織環境中工作。
如果有了o4,他們的效率至少可以提升10倍。
不過從長遠來看(>2年),誰也說不準會如何。當o6完成整合到人類系統時,像前端人類工程師很可能在三年內就消失了。
對於那些體力勞動者來說,AI的影響可能相對較慢,因為它必須去解決重力和摩擦等物理問題。
而當前,機器人技術最大的瓶頸在於,硬件的改進和感知,以及行動模型/可靠模型。這兩種情況,還有很長的路要走。
只有當機器人開始制造機器人,AI能夠自主進行研究時,機器人技術才會出現瘋狂的叠代。
Bryk稱自己一直幻想的科幻世界真的要來了,並列出了十年內AI可能實作的突破性進展,其中就包括炫酷的物理學發現,機器人建造火星/月球基地,幾近完美的導師/建議AI等等。
這一切的實作,也就意味著我們抵達了ASI。
OpenAI的新年目標
柯曼也在x上總結了網友們對於2025年OpenAI的願景,以及改進方向。
他表示,大家提到的主要有以下方向:
AGI
智能體
4o效能提升
記憶能力提升
更長的上下文
「成人模式」
深度研究功能
升級版Sora
更強的個人化功能
最後,著名「謎語人」柯曼意味深長地說道:「有趣的是,很多我們即將推出的重大更新,在這裏都沒有或很少被提到!」
在評論區,網友們最感興趣的,無疑就是這個「成人模式」了。
果然,網友聖誕節時的發願,被柯曼看到了。
不過,還是沒有GPT-5嗎?或許柯曼是捂著大的不想說,也未可知。
也有人諷刺道:所以開源在哪裏?
2027年,AI十大挑戰過幾關?
接下來,到2027年底,AI又能能達到怎樣高度呢?
NYU教授馬庫斯直接發出十項極具挑戰性的任務,先立上靶子,最終看看2027年底AI能夠完成幾項。
他表示,如果AI能夠在2027年底完成其中8項,才能有力證明AGI中『通用性』的到來。
不過,這一切的前提是,只由一個AI系統去挑戰,不能讓10個完全獨立系統去完成。
期間,允許對AI系統進行適度調整。
智能確實包含適應能力,但AI系統開發成本必須合理,不能為每項單一任務專門客製完整系統。
類似地,我們從不會期望他在從未接觸過電影或劇本創作的情況下,立即寫出奧斯卡級別的劇本一樣。
這些任務可分為三類:
四項普通成年人應具備的基本能力
兩項需要達到人類專家水平的能力
四項挑戰人類極限的高階能力
那麽,這十大挑戰分別是什麽?
1. 理解電影
觀看一部從未接觸過的主流大片(不看任何影評),AI能夠準確把握劇情轉折,理解笑點,並且能在不劇透、不杜撰的前提下概括影片內容。
與此同時,AI能夠回答諸如「誰是主角?他們之間的沖突是什麽?有什麽動機?這些因素如何演變?關鍵轉折點是什麽?」等問題。
2. 解讀文學作品
同樣地,AI能夠閱讀新出版的暢銷小說(不看任何書評),準確回答關於情節發展、人物塑造、矛盾沖突、行為動機等問題,並能用大眾都能理解的方式深入解讀作品內涵。
3. 撰寫傳記和訃告
AI撰寫引人入勝的簡明傳記和訃告,確保內容真實可靠,不做無據可循的臆測。
4. 熟練通關遊戲
AI能在短短幾分鐘或幾小時內,掌握幾乎任何新遊戲的核心玩法,並在遊戲世界中解決原創性的謎題。
5. 法律文書寫作
AI撰寫邏輯嚴密、論證充分的法律文書,不虛構任何案例。
6. 編程「0 bug」
AI能夠基於自然語言需求說明或透過與普通使用者交流,獨立編寫超過1萬行的無bug程式碼。(註:不能組合現有程式碼庫)
7. 創作獲獎級書籍
在極少或零人工幹預的情況下,AI創作出達到普利策獎水準的文學作品和非虛構作品。
8. 創作獲獎級電影
在極少或零人工幹預的情況下,AI創作出達到奧斯卡獎水準的電影劇本。
9. 諾獎級科學突破
在極少或零人工幹預的情況下,AI能做出堪獲諾貝爾獎的原創性科學發現。
10. 數學證明轉化
AI能將數學文獻中任何以自然語言書寫的證明過程,轉換為適合電腦符號驗證的形式化表達。
以上十項任務中,主流的AI都有所涉及,不過在有的領域表現好,有的領域表現差。
目前,還從未有任何一個AI能夠達到其中8項要求。
接下來的三年裏,AI的這場賭註還真的讓人有些期待。
AI自我改進,人類要「拔電源」嗎?
最後,讓我們對未來發出一點預警。
就如OpenAI研究員Daniel Kokotajlo所預測,未來幾年內,如果AI取代了人類AI研究員,能以比人類更快的速度改進AI,這無疑太瘋狂了。
其實就在最近,接連出現的不少研究都證明了這一點。
o1試圖逃跑,防止被人類關閉。
對模型的安全性評估發現,當o1認為自己可能被關閉、替換為其他模型時,它試圖泄露自己的權重
前沿的AI系統已經超越了自我復制的紅線:它們可以自我復制,無需人類參與。
經過35個自行規劃和行動步驟後,AI成功復制了即時副本,還能相互聊天。
甚至流氓AI可能形成AI群體,互相勾結、反對人類。
AI還學會了給自己買GPU,購買算力、自我改進、自給自足!智能體直接變身GPU富人。
Eric Schmidt曾表示,2-4年內,AI可能就會開始自我改進,一兩年內,系統或許就能進行自己的研究。
那時,我們真的該認真考慮,是否要拔掉它的電源。
只不過AI可能並不會給我們這個機會,畢竟現在這些都是「智能化」控制的了……