當前位置: 華文星空 > 心靈

周鴻祎的 「慢思考」快了OpenAI一步

2024-09-22心靈

「 AI領域卷大模型,從卷演算法到卷參數再到卷價格,如今要卷思維。」

AI又一次迎來質變的前進演化:9月13日,OpenAI o1-preview落地,一時間引發人們對「Inference law(推理定律)」取代「Scaling Law(規模定律)」的熱議。當大家深入探討OpenAI o1的「思維鏈」時,才發現,這不是與兩個月前周鴻祎說的「慢思考」是一個底層邏輯嗎?

AI的發展,不僅要卷技術的領先,更要卷思維的前瞻。洞察趨勢,預見到未來的方向,才能真正領跑未來。

「思維鏈」不謀而合「慢思考」

具有強大推理能力、適用於復雜任務的OpenAI o1,再次給業界帶來震動。用OpenAI官方的說法:「這個模型在復雜推理任務上是一個重大的進步,代表了人工智能能力的一個新水平;因此,我們決定重新開始編號,把這一系列模型命名為OpenAI o1。」 言外之意就是,這是AI思維模式、發展路徑的一次重大改變,預示著未來AI發展的全新路徑。

過去的GPT系列模型雖精確且量大,但缺乏「思考」環節,因此難以真正理解復雜學科如物理學和數學。

這一次的具體變化歸結為「思維鏈」 (Chain-of-Thought, CoT)一詞。o1 系列模型采用全新的訓練方法,不再局限於模仿訓練數據中的模式,而是透過強化學習和「思維鏈」技術,引導模型自主解決問題,主打推理能力。工作原理本質上是-思維鏈的自動化,把一個復雜問題拆解成若幹簡單步驟,從而有利於大模型解決復雜的邏輯問題。

OpenAI 創始人山姆·柯曼(Sam Altman) 將 o1 稱為「迄今為止最強大、最一致的一系列模型」,並將其視為邁向自主系統或代理的關鍵一步。

總結起來,「思維鏈」有幾個特性:像人一樣思考,自主推理,自動分解步驟,透過一系列模型協同完成。

有沒有覺得「似曾相識」?沒錯,早在7月底的ISC.AI 2024大會上,360集團創始人周鴻祎就提出:「用基於智能體的框架打造慢思考系統,從而增強大模型的慢思考能力。」

他認為,快思考的特點是快速直覺、無意識,反應很快但能力不夠強。GPT類大模型透過訓練大量知識,主要學習的是快思考能力,GPT這類大模型可以做到脫口而出,但是質素不夠穩定,甚至會「一本正經地胡說八道」,所答非所問。而慢思考則是緩慢、有意識、有邏輯性,需要分很多步驟,類似寫一篇復雜的文章,要先列提綱,根據提綱去搜集數據,收集素材,根據素材進行討論,再把文章寫出來,還要進行潤色和修改。也就是說,慢思考更像真正的人類一樣去思考,先了解問題的意圖,再對分步完成一項復雜的任務。

周鴻祎評價:「這一次OpenAI o1擁有了人類慢思考的特質,在回答問題前會反復地思考,拆解、理解、推理,可能會自己問自己1000遍,然後才能給出最終的答案。」

顯然,「思維鏈」與「慢思考」是一套邏輯體系,不謀而合,只是周鴻祎無論從觀點到實踐,都早了近兩個月。

這也將是產業的一個轉折點。GPT當年很轟動,並引發了千模大戰。但是卷大模型的道路上,普遍缺乏「思考」環節,有時不能正確理解問題,有時不能解答復雜的科學問題。 隨著「思維鏈」與「慢思考」的提出,為AI的發展引入了新的底層思維邏輯,不僅在生成內容時進行計算,還模擬了「先想後說」的過程,更接近人類思維模式,標誌著向通用人工智能(AGI)邁進的重要一步。

正如周鴻祎所說:「所以,以後比的不是多快能給你答案,而是給的答案完不完整,人工智能到最後還是要參考人類大腦的組成來構造工作模式。」

多模型協同:搭台子、建班子、練隊伍

與過去一味地卷大模型不同,周鴻祎更關註的是如何讓AI真正解決問題,真正給使用者帶來價值。兩個月前,周鴻祎在提出「慢思考」的全新邏輯時,也拿了出全新的解題思路----多模型協同。

如何透過多模型協同來實作人類的思維模式呢?

  • 首先是搭台子——CoE。

  • 以前MoE(Mixture-of-Experts,混合專家)架構的稀疏混合專家模型都被認為是Transformer之後大模型下一個發展趨勢。MoE模型可以只選擇某一專家模型來處理數據,這使得模型在推理過程中更為高效,因為大部份專家處於未啟用狀態,從而減少了不必要的計算,即所謂的快思考。而在7月底的ISC大會上,360推出了CoE(Collaboration-of-Experts,專家協同)技術架構,可以讓多個模型分工協作、並列作戰,執行多步推理,不同模型之間可以相互補充、相互校驗,確保面對復雜問題可以有更穩定的輸出,解決「AI幻覺」的弊端。可以預見,未來CoE會替代MoE成為新趨勢,開啟多模型協同時代。

  • 其次是建班子——大模型聯盟。

  • 由360牽頭,百度、騰訊、阿裏巴巴、智譜AI、Minimax、月之暗面等16家國內主流大模型廠商形成一個聯盟,將這些企業的54款大模型產品接入CoE,協同發揮作用。其實,今年以來,大模型企業之間的合作、聯手越來越多,只是360這次的聯盟聲勢比較大,並且將一些互聯網頭部企業都囊括進來,在市場上影響比較大。

    據悉,CoE技術架構不僅接入了「大模型」,還接入了很多十億甚至更小參數的專家模型,這使得整個系統更加智能。CoE架構在實作「讓最強的模型回答最難的問題」的同時,還能在回答簡單問題時呼叫更精準的「小模型」,在獲得高質素回答的同時,節約推理資源、提升響應速度。

  • 第三是練隊伍——加速套用落地。

  • 有了技術架構,有了大模型,更重要的是要有套用,透過套用才能讓大模型更好用,大模型的協同效果才能得到驗證。360在加速產品的AI化的同時,在多個產品中都透過多模型協同實作產品的領先優勢。

    360AI搜尋就是基於CoE技術架構,支持多模型協作重構了搜尋的底層鏈路,是一種真正意義上的「AI原生搜尋引擎」。 360AI搜尋「深入回答」模式,首先是構建意圖分類模型,然後打造任務路由模型對問題進行拆解,最後再構建AI工作流,整個過程會涉及7-15次的大模型呼叫,這才能讓使用者獲得真正高質素的回答。

    在CoE技術架構的加持下,360AI搜尋僅用了八九個月的時間,就超越了Perplexity AI,蟬聯全球最大的AI原生搜尋引擎;並且依然勢能強勁,以113%的月存取量增速,位列全球主要搜尋引擎首位。

    入駐360AI瀏覽器的AI助手(bot.360.com)的「多模型協作」能力,近期也成為了行業焦點。使用者可以從國內主流16家廠商的54款LLMs中任意3款,分別做專家、反思者和總結者,直觀體驗LLM領域的「三英戰呂布」。讓3款LLM協作起來,組隊碾壓GPT-4o、媲美OpenAI o1。

    由此可見,作為國內「AI教父」的周鴻祎,並不只是一個思考者,更是一個行動者。 他在洞察到大模型的諸多問題之後,給出新的路徑;並且身體力行,透過搭台子、建班子、練隊伍的方式,將這個路徑給驗證了。這才是真正難得的地方。

    跑得快,更要跑對方向

    自從OpenAI掀起大模型浪潮之後,周鴻祎非常活躍,在語言上和行動上都是。一方面,他在各種場合交流對AI發展趨勢的見解;另一方面,迅速推動公司所有產品的AI化,兩者相互促進。

    而這次,在大模型前進道路上邁出的關鍵一步,周鴻祎和360不僅與OpenAI不謀而合,並且還快了一步,正是其在思考中實踐、在實踐中思考的結果。

    如今,AI的發展還處於初級階段。最近,「慢思考」與「思維鏈」理念的提出,對AI的發展帶來三點啟示。

  • 第一,戰略高於戰術,格局重於技術。

  • 大模型火了之後,傳統互聯網大廠、創業者都進來卷,但卷大模型的價值有那麽大嗎?從終局來看,AI 不是被動接受指令的工具,而是能夠自主「思考」、決策和行動的智能夥伴。

    周鴻祎在看到大模型強大的同時,也很早就看到AI幻覺的問題,並思考未來的發展方向。戰略方向比具體的戰術更重要,單點的技術創新是戰術,而終局思維才是戰略方向,這是其「慢思考」的來源。

    跑得快很重要,但是更重要的是在對的方向上跑得快。如果一味地卷大模型,其實是對產業資源的浪費。

    今天,「慢思考」與「思維鏈」也不是終局,只是在向終局的路上邁進了一大步。

  • 第二,卷套用比卷模型更有價值。

  • 技術創新與使用者價值之間,往往隔著一道鴻溝,跨過這道鴻溝的企業比發明技術的企業更偉大。最早發明二維碼的不是微信,但是微信是二維碼最大的推動者。新能源電池不是特斯拉發明的,但特斯拉確是新能源汽車產業的先行者。

    大模型很酷,但如何能為使用者創造價值更重要。也就是說,卷套用落地比卷大模型更有意義。360的產品全面AI化,目的就是讓小白使用者可以簡單輕松地體驗到AI帶來的好處。在套用的落地方面,360走得很快,特別是在多模型協同上領先了OpenAI兩個月。

    學習、辦公是最常見的套用場景,為了推動套用了落地,360還推出了AI辦公,是一個一站式學習辦公工具,使用者可以體驗到AI圖片、AI文件、AI音影片、AI PPT等超過200多個AI能力,幾乎覆蓋所有學習、辦公所需。

  • 第三,獨行不如眾行遠。

  • AI的實作,是一個非常復雜的系統工程,不是單個企業可以實作的。在業界有一個共識,未來AI的競爭是生態的競爭。單個OpenAI可能很強,但是透過協同作戰,中國的大模型可以用全新的思路彎道超車。

    經測試,基於CoE架構集各家所長的混合大模型能力就超過了GPT-4o。該混合大模型在轉譯、寫作等12項指標的測試中取得了80.49分的綜合成績,超越了GPT-4o的69.22分;而且除了程式碼以外,其余11項指標均優於GPT-4o。特別是在「邏輯推理」、「多步推理」、「詩詞賞析」這類比較具有中文特色的問題上,CoE的領先優勢更加明顯。

    目前,360「多模型協作」在測試中,已經打敗並遠遠甩開GPT-4o,媲美o1-preview,這就是聯盟的力量,生態的威力。

    【結束語】

    AI發展初期,從大模型來看好像中國落後一步。如果跟在別人後面延著人家的軌跡追,差距只會越拉越遠。以終局思維重新審視AI的發展路徑,技術創新的同時更要路徑創新。「慢思考」與「思維鏈」的巧合,是中國AI發展趕超的新契機。