當前位置: 華文星空 > 心靈

追 OpenAI 的人

2024-10-21心靈

智譜對OpenAI的追趕,至少持續了4年。這是人工智能大模型爆發的4年。

智譜,是中國的大模型創業公司之一,也是截至目前,從技術、產品到生態全面對標美國OpenAI的公司。當人工智能大模型的熱潮襲來,熱錢卷入,這條賽道迅速變得擁擠,大家普遍都在焦慮,那款super App到底在哪裏?商業化怎麽做?能不能賺到快錢?像尋找武林秘籍一樣,於是,江湖中出現了「百模大戰」、降價之爭……

智譜的CEO張鵬倒不太焦慮,有人形容他「情緒穩定得像一個AI機器人」 。智譜現在做的,就是全力在技術上追趕世界頂級的OpenAI,至於商業化,那就「沿途下蛋」。

大模型相當於給這個世界在換引擎,這是一場巨大的、未知的變革。這個變革需要漫長的時間,不會是要麽速勝,要麽速亡。

很多時候,答案要靠時間一點一點揭曉。這同樣也是張鵬冷靜的原因。如果不是把大模型壓在一兩年的時間密度裏,很多事情會看得更清楚。

文| 鄭思芳

編輯| 李天宇

圖| (除特殊標註外)尹夕遠

生死決策

一個決策會,能如此輕描淡寫。

要不要做千億參數的大模型?要在2021年12月的一天定下來。這是智譜自創業以來的第一件大事,事關生死的那種。

在公司CEO張鵬的印象裏,「我們那天覺得必須討論一下這件事」。來討論的是這家創業公司的技術委員會成員。

決策會開了多長時間,具體多少人參加,張鵬都記不清了。他記得的場景是,沈默占據了決策會的大多數時間。「對於工程師來講,不說話已經是最大的反抗了。」

反抗源自風險。投入至少是千萬元人民幣量級,想做成,至少八九個月。舉全公司之力,把所有時間、資源都砸進去。

如果沒幹成呢?這家成立剛兩年多的創業公司「就啥也剩不下了,可能就掛了」 。

如果幹成了呢?「那至少證明中國的大模型公司,技術能力也能達到世界級水平。」清華大學電腦系教授、智譜創立發起人唐傑說。

決策會最終全票透過:幹。

為啥要幹?「刺激」源於這家公司1歲生日那天。智譜創立於2019年6月11日,創立之初想法很明確,做下一代的人工智能,也就是清華大學人工智能研究院名譽院長、中國科學院院士張鈸所說的,要發展第三代人工智能——認知智能。

2020年6月11日,智譜1周歲生日,美國人工智能公司OpenAI上個月剛剛釋出了GPT-3大語言模型。這個大語言模型如同一個巨人般出現,轟動了全球人工智能的產學研各界。它的參數規模達到了驚人的1750億個。此前兩年流行一時的BERT模型,有3億個參數;輝達的Megatron-BERT,80 億個參數;同年2月釋出的微軟Turing NLP,也只有170 億個參數。

參數規模,決定了大模型的智能能力。通俗地說,這個自然語言處理模型中的「龐然大物」,不僅能做語言生成,而且閱讀理解能力有了很大提升,能讓人聯想起學生時代【語文】課本裏的一幕:「閱讀全文,並總結段落大意。」這一點GPT-3能輕松自動完成。

GPT-3還能生成新聞報道的樣本,人們很難區分這文章是機器寫的,還是人類寫的。

在智譜1歲生日這天,大家都在研究著這個龐然大物。當天,張鈸院士也在智譜的慶生會上組織討論:「GPT-3為代表的大模型,是不是我們所追尋的認知智能可能的解決方案?」

張鈸院士出席2021年北京智源大會。

圖源視覺中國

GPT-3的出世,把生成式AI帶入了全新的時代。從學術界或者產業界的角度來看,2020年可以稱之為大模型元年,標誌著大模型的研究進入到全新的階段。

可這個時候,中國人工智能大模型的技術水平,與GPT-3有相當大的差距。但如果大方向是對的,無論差距多大,都要追趕。

1歲的智譜邁開了追趕的步子,當時,張鵬還是這家創業公司的CTO(技術長)。在一年半的時間裏,他帶著智譜先後做出了十億、百億級參數的模型,這還不夠。要不要把稠密的語言模型再擴大10倍,做一個對標GPT-3的千億級參數模型?但是從百億到千億參數的研發,難度不是乘10倍那麽簡單,財力、資源的投入,對中國當時任何一家獨立創業的AI公司都可以用傾家蕩產來形容。所以才有了這次事關生死的決策會。

張鵬說,「不做,不追,你永遠不知道你能跑多快,跑多遠。」 智譜董事長劉德兵也支持這個冒險,「如果明擺著資源來做,哪裏還輪得到你來做?」智譜選擇在最艱難的時間開始全身心投入到大模型的研發中。國外已經做出來了,但在國內,智譜即將踏入的是無人區,一旦踏進去,將會完全改變智譜的發展軌跡,甚至命運。

決策會後的第九個月,2022年8月,智譜聯合清華大學打造了高精度雙語千億模型GLM-130B,參數規模1300億。在GPT-3釋出26個月之後。

說到研發的困難期2020年年底、2021年,張鵬說,算力就像糧草,是最大的資源。算力不夠,我們就只能東一家西一家地去借,借到的算力,要一點一點摳出來,省吃儉用地分給工程和研究。

「窮人的孩子早當家。」張鵬說,要加快訓練大型深度學習模型的速度,最快的辦法就是用上高端的GPU芯片。GPU是專門用於高效處理影像和圖形的處理器。2020年時,智譜終於等來了一批GPU芯片。這批芯片的參數和張鵬的需求相差了10%左右,但也能幫上大忙,原本是給影片遊戲公司提供算力的芯片,被智譜以「撿漏」的方式得到。

為了更省,工程師們把模型壓縮、量化、加速,讓模型可以在更低的成本下執行。張鵬曾經算過一筆賬,一項計算任務原本需要8張高端GPU卡,總價約100萬元人民幣,經過工程師們的努力,只要10到20萬元的硬件就能同等效率地跑起來。正是這樣的精打細算,讓智譜挺過了創業早期的困難時刻。

理工男的記憶裏,對重要時刻的印象,遠不如技術指標的曲線來得深刻。張鵬說,他人生很多非常重要的決策都是這麽過來的,平靜,沒有爭吵,沒有「激情澎湃」,甚至當時「沒什麽感受」,回頭去看,哦,這件事情還是一個非常關鍵的點。

當然決策會上也有人在問,現在(在GPT-3釋出一年半之後)才去做這麽一件事情有沒有意義?

千億參數的大模型,放在2024年的今天,能跑出來的機構也非常少,在張鵬和智譜起跑追趕的時候,國內甚至還沒有多少人知道OpenAI,更少有人知道大模型是什麽。

人工智能大模型,是2023年的年度十大科技熱詞,指擁有超大規模參數、復雜計算結構的機器學習模型。它能夠處理海量的數據,完成各種復雜任務,如自然語言處理、影像辨識等。張鵬篤信大模型能改變人們的生活,改變世界。這是他和智譜當初選擇追趕的意義。

大模型的出現,真的改變了普通人對人工智能的認知。以前是人想讓機器學什麽技能,就教它什麽技能。教過的有可能會,沒教過的就不會。現在,以前沒教過的技能,它也開始「無師自通」了。有研究機構認為,在未來10年,知識工作者的效率可以提高4倍。你可能永遠不知道,將有哪一篇文章、圖片、報表、影片,是出自大模型之手。

創業初期近百人團隊的智譜,人員構成也很「質樸」,以工程師居多,都是「技術特種兵」,其他部門的配置還不完備。GLM-130B釋出會前,這個研發團隊幹了不少雜活兒:新聞傳播稿是研發人員自己寫的;產品需要一個logo,沒這方面的專職人員,一位工程師就找了自己的女朋友代勞,臨時設計出來一個。釋出會當天,張鵬也沒有和團隊一起慶祝這重要時刻,他在深圳出差,因為疫情隔離沒能回到北京,釋出會也是線上上。

GLM-130B釋出至今,收到了70余個國家、1000多個研究機構的使用需求,也成了全亞洲唯一入選史丹佛評測的主流大模型。更大的意義在於,它擁有與國際頂級機構不一樣的技術路徑——GLM(General Language Model通用語言模型),一個獨屬於中國的自研路徑。自成一派,不會被「卡脖子」。

就在GLM-130B釋出的三個多月後,2022年11月30日,又一枚「炸彈」來了,投放者還是OpenAI。

圖源視覺中國

大模型的「核彈」

有必要介紹一下智譜追趕的對手,OpenAI。

它是當今人工智能領域的領頭羊,歷史上崛起速度最快的初創企業之一。這家美國公司於2015年12月成立,最初是一家非營利組織,創辦者包括今天大家熟知的埃隆·馬斯克。後來隨著馬斯克的結束以及大模型對資金超預期的需求,2019年3月,公司的性質從非營利性轉變為「封頂」的營利性。

人工智能大模型太燒錢了。根據Tracxn(初創企業投資分析平台)的數據,截至2024年,OpenAI已經完成了7輪融資,累計籌集超過110億美元。僅在人工智能訓練方面,OpenAI的投入就達70億美元,另外還有15億美元用於人員配備。

公開資料顯示,至2023年,智譜獲得了累計25億元人民幣的投資,不及對手的1/30。一位中國的投資人透露,現在中國在人工智能投入的資源,可能都不如美國的一家公司多。

但它取得的成績和這25億,也足以讓智譜成為當下中國的明星企業。投資者名單上,集合了一眾互聯網大廠,還有紅杉資本、高瓴資本、啟明創投、君聯資本等。

在中國人工智能領域的新晉勢力中,有著大模型「四小龍」的說法:智譜、月之暗面、百川智能、MiniMax。2024年2月,月之暗面獲得了目前國內大模型公司單輪最大金額融資,超10億美元,由阿裏領投。市場估值上,智譜和月之暗面率先進入了「200億人民幣俱樂部」。同期,OpenAI的估值是800億美元。

成為明星企業的智譜,卻沒有像其他「小龍」一樣,CEO也有明星的光環加持。百川智能創始人兼CEO王小川,互聯網江湖中的「大咖」,曾任搜狐CTO、搜狗CEO,後憑借技術實力和昔日積累的人脈,開始獨自創業,百川智能的最大能量,來自王小川本人;月之暗面的楊植麟也是明星創始人,出生於1992年,是「四小龍」的CEO中最年輕的,他此前就在AI學術圈很有名氣,清華90後學霸、AI天才這些標簽,也讓他成為大模型創業者裏的新銳代表。

相比於這兩位的名氣和個性,張鵬顯得很普通。清華本、碩、博出身,很多熟識的人對他的第一印象,是「沒什麽印象」。「從他的臉上,你看不到什麽喜怒,情緒穩定得像AI機器人一樣。」一位熟悉他的人說。

就連OpenAI投出那顆炸裂的「核彈」,張鵬的臉上也沒見太大變化。2022年11月30日,OpenAI釋出ChatGPT,這個全新聊天機器人模型,是一款革命性的產品,剛一上線便引爆全球,成為使用者破億速度最快的消費級套用。僅僅兩個月,ChatGPT的月存取量就超過了6.7億次。

ChatGPT的出現,標誌著人工智能大模型在全球範圍內真正「出圈了」,它從研發實驗室或行業領域,跳躍到了普通大眾的消費套用範疇。在行業裏一直以來看不清前路的商業化,也在模糊中有了方向。

圖源視覺中國

對於OpenAI投出的這枚「核彈」,人工智能領域一位專家的震驚在於,以前是猴子爬樹,ChatGPT突然出現,讓「猴子不知怎麽就爬到月亮上去了」 。

張鵬的反應倒出奇地平淡,「技術不是魔法。對於做技術的人來說,沒有什麽震驚的」 。連「好神奇啊,怎麽做到的」都不會有,技術都是有跡可循的,都是從以前積累下來的。

當然,ChatGPT剛出現時,張鵬和技術人員也會問它一些問題,常識性的、專項能力,甚至是很荒誕的問題,比如問它「太陽有幾只眼睛?」主要觀察它對人意圖的理解,以及邏輯性。

智譜最初的研發重點是資料探勘與科技情報分析。其實在ChatGPT出現之前,團隊就做過預測,預計未來的3到6個月內,OpenAI會拿出一些東西來。「具體拿出來啥我們不知道,因為它那段時間動靜就很少,資訊保密已經很嚴格了。」張鵬說。

ChatGPT產生的爆炸力和之後產生的影響力,張鵬和團隊也預測到了。於是,第二次追趕也開始了。

立刻集結隊伍,調動所有的研發資源,把力量全部集中在這件事上。研發時團隊的緊張程度,張鵬沒有過多描述,只說「團隊連年都沒有過」。2個多月時間,智譜的對標版本就已經出現,可以對外去做測試了。在ChatGPT釋出後的4個半月,智譜千億基座的對話模型ChatGLM釋出。

和「上一次GLM-130B釋出會」一樣,張鵬又沒有和同事們一起,共同感受這重要時刻,他正在河北,從機場往高鐵站的出租車上,趕著回北京。而此前的一天,他還在南京,去見自己的一位師弟——李智星。從CTO變成CEO,角色的轉換意味著張鵬需要為團隊挖掘更多獨當一面的人才。

李智星,現任智譜政府客戶事業部技術副總裁,為了延攬這位師弟,張鵬花了5年時間,可以說是三顧茅廬。

兩人相識於2012年,李智星在清華攻讀博士後,在東主樓的205實驗室第一次見到張鵬。那時都是理工男,兩人一起出國做專案,穿著都很隨意,餓了就買三明治頂饑,吃膩了就買罐辣椒醬,自己煮飯拌著吃。張鵬是湖北人,愛吃辣,腸胃又總不太好。從實驗室走出來之後,李智星先是在重慶的一所高校教人工智能,後又任職互聯網大廠的部門負責人。

張鵬第一次找李智星,是在智譜剛創立的2019年,當時李智星回絕了。第二次是在2021年,李智星從阿裏離開,原本是加入智譜的最好時機,當時張鵬和智譜的創立發起人唐傑還和他吃了一頓飯,連待遇都談好了,但想到家人還在杭州,李智星又一次拒絕了。第三次是在2023年的3月13日,那天是周一,李智星在南京的一家咖啡廳裏見到了從深圳趕來的張鵬。

「喲,你這穿的。」李智星和張鵬打招呼。南京的3月還有點涼,那天,張鵬穿著一件商務夾克,連頭發都打理得很精致。第二天他計劃要趕回北京參加ChatGLM的釋出。

「其實不用他說,我也早就想來了。」李智星在等待一個時機,現在,時機到了。

這是李智星看到的第三波機會。第一波是21世紀初前後的互聯網興起,只要會寫一個GSP(Generalized Sequential Pattern,一種常用的序列模式挖掘演算法)或是ASP(Active Server Pages,動態伺服器頁面),入門網站就起來了,所有的草根都有機會。第二波是二零一幾年,那時都在說「大眾創業、萬眾創新」,流動互聯網開始爆發,資訊科技、電腦技術滲透到生活的方方面面。大模型對他來說就是第三波機會,而這次,機會正好被擺在了他的眼前,之前也有過很多人臉辨識、智能客服的小創新,但都不像大模型這樣滲透到生活的方方面面。

「對於我們做 AI 的人來說,這其實是一個非常積極的訊號。以前我們覺得這個天花板非常矮,很快就觸碰到了,也就變成了傳統工程的東西了。但是ChatGPT出來之後,我們發現大模型的天花板一下子被提得很高。這中間有很多事可以做了,那這個時候肯定要上嘛。」李智星說。

和以前的待遇比,是降薪,原本近在身邊的妻子和女兒,也變成每半個月從北京飛杭州才能見到一次,但李智星還是來了,重新回到了曾經求學時的北京五道口,隨張鵬一起,在大模型這個時勢下,尋找更大的空間。

像這樣懷揣著技術理想主義的人,智譜還有很多。

受訪者供圖

「爆發後」的大模型江湖

彼時正處在ChatGPT釋出後的震動期、中國的大模型熱潮之前。

回顧人工智能的發展史,從20世紀50年代人工智能技術誕生至今,先後四次引發大規模的關註,分別是專家系統時代、機器學習時代、深度學習時代和大模型時代。前三個時代,由於數據、算力、場景落地和投資回報等方面的原因,沒能形成AI產業的商業閉環。到了現在的大模型時代,基於通用性、湧現性、強算力的特征,大模型時代最有望形成商業閉環,有技術的可行性和未來巨大的想象空間,眾多玩家湧入大模型賽道。

ChatGPT更是給這個賽道朝天空打響了訊號彈。正是在2023年,大模型熱潮席卷全國,也被媒體稱為「百模大戰」。

億歐智庫釋出的【中國「百模大戰」競爭格局分析報告】顯示,截至2024年,國內公布的大模型數量已經超過300個,一個顯著特征是:各互聯網大廠紛紛擠上賽道。百度的文心一言、阿裏的通義千問、騰訊的混元大模型、抖音的雲雀大模型、美團大模型……不但自己的大模型產品落了地,而且在投資市場上,也對AI創業公司廣撒網。

以大模型「四小龍」為例,智譜的投資方有阿裏、騰訊、美團,百川智能背後站著阿裏、騰訊、小米,月之暗面是阿裏、美團,MiniMax是騰訊。

一個背景是,由於近兩年的經濟形勢,投資市場相比於幾年前更加謹慎,大模型突然間成了所謂的「風口」,也迅速卷進來熱錢。如同其他行業的風口一樣,各大公司想迅速彰顯影響力,搶占市場。「百模大戰」越來越熱衷於「刷榜上位」。

「從數量上說,國內的基礎大模型研發機構已超過全球其他國家的總和,但在『質』的飛躍上與世界級產品還有很大距離。」王延峰說。

王延峰是上海市人大代表、上海交通大學人工智能研究院副院長。2024年5月,他對媒體說出了當下中國大模型熱潮中的「水分」。幾個月前,中國人民大學與伊利諾大學厄巴納-香檳分校的研究揭露了大模型評測中的漏洞,即一些模型在訓練過程中直接使用「測試集的數據」進行訓練,導致評測分數的虛高和直接「通關」。

「這種五花八門的測試方法可能會導致技術的過度包裝,進而造成市場化的混亂。」王延峰接受媒體采訪時說。

「競爭亂戰之下,整個行業都非常焦慮。」 在【人物】訪談中,多位大模型業內人士都表達了類似觀點。

張鵬覺得,「其實沒必要那麽焦慮。讓子彈再飛一會兒吧,剛剛出槍膛的,你說它能不能打中那個目標?」

張鵬對焦慮有著不一樣的理解。他把焦慮分為外源性和內源性兩種。「內源性的壓力來自對自己更高的期待,我有沒有找到正確的方向?有沒有找到正確的路徑和節奏?離目標是不是越來越近?」張鵬確信他和智譜走在自己的步調上,這樣的壓力不至於讓他焦慮。外源性焦慮是來自大環境變化給的壓力,情緒的波動也主要來自外界各種資訊的幹擾。這時候即便大模型一般的大腦,也會有人體生理上的局限。「人的大腦強就強在是一個物理整體,不能切割,弱也弱在這兒,很容易受到其他東西的幹擾。」

技術的迅速演進,吸引了原本不在這條道路上的人湧入,同時影響著整個行業的風向、資源。事實上,在「百模大戰」開始之前,融資就是智譜的一大挑戰。後來關註的人多了,可以融到錢的機會也更多了,張鵬要找的是信念、認知一致的同行者,他們要攜手一起長期奮鬥。

最頻繁的時候,張鵬一天要見三四位投資人。最開始,他和團隊需要和對方解釋大模型到底是什麽。ChatGPT出現之後,所有人都看到了它比以前的任何人工智能都更接近一個「人」。他不是蘋果Siri、微軟小冰或者天貓精靈,而是可以實作多輪對話的聊天機器人,可以寫程式碼、寫行銷文案甚至生成圖片和影片,雖然並不完美,但看起來無所不能。這也減輕了張鵬的溝通成本,他不用再和所有人解釋什麽是大模型了,只需要說,「我們要做的事情就是和OpenAI對標。」

後來,投資人問得最多的問題則是「大模型怎麽掙錢,商業化怎麽做?」有的投資人問得更直接:「OpenAI一年要虧50個億(美元),你虧得起嗎?」張鵬回答:「那你先給我50個億。」

對大模型這件事情,長期的確定性,大家是一致的,沒有人質疑這是一件革命性的事。但對於短期的確定性,大家是不一致的。很多人都想透過它賺快錢。如果沒有實作賺一票就走,他們自然會更焦慮。

於是出現了很「分裂」的場景:投資人開會,主題是長期主義,但是同時也在催企業去掙錢。這樣矛盾的事情在這個領域裏經常出現。張鵬理解這種分裂,「時間是容易被很多人忘記的尺度。過去可能需要花10年甚至20年來投入的事情,在大模型這件事情上被壓縮到了兩三年,大家很難不焦慮。」

比消除焦慮更要緊的是,怎麽能夠在有限的時間尺度裏把認知的差距拉齊。2023年下半年,一些消極的聲音開始出現,爭論「到底需不需要通用大模型」。這樣的聲音越大,越是擠壓了大模型領域的空間。在一次公開場合,張鵬也發表了大模型走向分層的看法。沒多久,張鵬在機場的擺渡車上,接到了一通老熟人的電話,對方正是有段時間沒聯系的王小川。電話裏,王小川贊同了他那次公開的言論,「他說這個挺好的,大家應該一起來推這樣的事。因為他可能也碰到了這樣的一些問題,市場的聲音很雜亂,大家認知不一致,其實對於我們這種大模型創業公司來說,是不太友好的」 。兩人都希望,能夠從創業者的角度統一一個專業的認知,把明顯看起來有問題的概念驅逐出去,不要讓劣幣驅逐良幣。

一邊清除「雜音」,一邊全力追趕,剛剛花4個半月標齊ChatGPT的智譜,在ChatGLM釋出會的當天,就遭遇了「暴擊」,這條跑道上,對手又一次「提速」了。

更重大的命題

也就相差幾個小時。

2023年3月14日,智譜釋出千億基座的對話模型ChatGLM。深夜,張鵬還在出租車上,用手機刷著關於智譜ChatGLM的動態。15日淩晨一點,OpenAI釋出了GPT-4。訊息瞬間淹沒了手機,按美國當地時間算,釋出日期和ChatGLM(釋出)都是在14日。

不只如此,就像事先約好了一樣,Anthropic也釋出了對標ChatGPT的Claude,谷歌推出對抗OpenAI和微軟組合的PaLM API服務(Bard)。這一天堪稱「大模型裏程碑日」。

回到那天,出租車在高速公路上飛馳,暗夜裏,手機螢幕的一點光亮把張鵬臉上的表情照得清晰可見,看著GPT-4的技術報告,張鵬苦笑著自言自語,「我們好不容易花了幾個月,年也沒過,把這事弄出來了,結果『砰』一下,人家又放這麽一個東西出來。」

「我們甚至還沒來得及慶祝,對手就又給你立了一個更大的目標。」

要繼續往前看,智譜又開啟了第三次追趕。

2024年1月,智譜叠代新一代基座大模型GLM-4。同樣對標OpenAI的GPT-4。

今年1月,智譜釋出基座大模型「GLM-4」。

3和4兩代大模型,GLM對GPT的追趕,從26個月縮短到了10個月。至於那款ChatGPT核彈級套用的追趕,則是4個半月。

追趕的同時,張鵬也背負著一個更重大的命題——公司的商業化。2023年3月,智譜開始組建商業團隊。

現在,張鵬的很大一部份精力,都花在公司的商業化上。這是一個CEO必須做的。但在最初,他的理想只是做一名工程師。參與創辦智譜之前,張鵬已經在實驗室裏待了15年。

那是清華大學電腦系知識工程實驗室(KEG實驗室),成立於1996年,是張鵬的老師王克宏從國外回來後,力主建設的。清華本科畢業後,張鵬作為碩士研究生進入了KEG實驗室,他也是後來才知道,自己研究的知識圖譜,祖師爺是美國國家科學院院士、圖靈獎得主、入選IEEE智能系統首屆「人工智能名人堂」的愛德華·費根鮑姆。那時,他就感受到國內外人工智能領域的巨大差距。

導師王克宏很務實,比如,他在1996年就給實驗室的所有學生提出了「P to P」的理念,「Paper to Project」(從論文到專案)。「單純做理論研究不做工程,這件事情是沒有未來的。」導師的話,他到現在都記得。

那時,張鵬性格有點內向,不善於跟大家打交道,他喜歡實驗室清靜的氛圍和環境,天天跟聰明的人在一起,接觸世界最頂級的研究成果和資訊,對於工程師來講,這是最好的地方。

爬山時的張鵬

受訪者供圖

李智星也記得實驗室裏的張鵬。話不多,對生活上的要求更不多,但他有自己的執著。實驗室開發了XLORE和AMiner兩套系統,前者是一個跨源的知識圖譜,後者是一個科技知識挖掘平台。很多時候實驗室的產品和工程可能由學生來開發,張鵬作為實驗室老師,只需要設計架構和定期規範,但當學生開發得不盡如人意時,張鵬什麽也不會說,直接下手親自搞定。

實驗室不是完全「閉關」,也會承接一些社會上的專案,比如政府側的需求和企業客戶的訂單,到後來,實驗室不但自給自足,而且有了盈利。可以說,智譜商業化的資源,最初是從實驗室積累的。2019年公司成立,算是AI創業公司的先行者。

工程師和CEO的不同?2024年8月,在接受【人物】訪談時,張鵬笑了,比如,做技術的人和外人講起本行來,可能很少考慮對方聽不聽得懂。最開始,解釋這個工作讓張鵬很不適應,「這都不是常識嗎?」很快他就感知到,聽完他探討技術,對面的眼神中都充滿了迷茫。「有九成以上的人聽不懂,但又對此充滿好奇」,他意識到,這就是AI真正走進人們生活中的認知差距。

一個工程師,一個搞技術出身的人,很多時候相當理想化。「你說讓我拿個半成品跟客戶去講,嗯,根本做不到,我一定要基本上是 perfect 這個狀態才可能拿出來去說。」可問題是,技術等不到(perfect)那一天,技術也在不斷演進。當下的市場環境也等不到那一天。「只能一邊追趕,一邊沿途下蛋。」

沿途下蛋,也是智譜的商業化策略。因為畢竟不是純研究機構,而是創業公司,從這個角度講,與工程師相比,CEO做的事可能更復雜。「賺錢這件事情是很復雜的。」

一家創業公司會議室的樣子,大概能體現這個公司的風格,比如傳媒公司會把會議室叫 「百萬+」,新聞機構給會議室起名「光明頂」,智譜的會議室名稱,是以AI歷史上關鍵的產品命名,其中兩間是以智譜最重要的兩個產品GLM和ChatGLM命名。和公司裏其他科技感、未來風的透明辦公室相比,這兩間會議室都有深褐色的木質長桌,同色系的木質椅子,椅座配有黑色皮質靠墊和坐墊,會議室的裝修風格沈穩厚重。訪談當天,其中一間會議室被預留,客戶是政府部門的。

全方位地認知市場和客戶的需求,也要時刻判斷哪些是有問題的,或者是偽需求,是張鵬作為CEO的必修課,有時他會引導客戶用更好的方法解決問題。

有一次見客戶,飛機落地時就已經是晚上八九點,張鵬拉著行李箱直接殺到了客戶的辦公室,客戶也很熱情地準備了咖啡、蛋糕、水果,看這架勢張鵬知道,客戶不會那麽早就放他走。深夜,在辦公室的白板上,張鵬畫了一圈又一圈的演示圖,解釋為什麽要有一個基礎設施,再有一個平台,才能賦能所有的業務。又講到大模型和傳統智能模型之間的差異,它最大的特點是泛用能力比較強,如果不利用這種特性的話,ROI(投資回報率)是一定不好的。

客戶卻並不這麽認為,對方並不想一開始就有太多投入,只想讓張鵬先做一個東西來驗證。張鵬知道客戶的顧慮,但也提醒一點,驗證是可以,但做出來的東西僅限於驗證,驗證出來ROI也是不通的。最後客戶還是同意了張鵬的方案。

如果從客戶合作案例觀察,智譜明顯是一個to G、to B的企業,在業內人士看來,它在to C端的產品,還沒建立起明顯的有利競爭。有人認為,「智譜從出生的那天起,好像就缺乏to C的基因」 。在國際上追趕OpenAI,並不代表他們在國內就一騎絕塵。眾多大廠擠進賽道,一邊成為智譜的投資方,一邊又成了他的競爭對手。這些大廠,擁有雄厚的資金實力和廣泛的C端基礎。這些巨頭對任何一家創業公司來說,都是一個危險的存在。

面向C端,智譜也早就建立了智譜清言APP,截至目前,C端使用者在智譜清言上的套用,大多是免費的。

智譜並沒有公布C端的使用者數量。但有另一個數據可以參考,Questmobile的AI智能體套用洞察半年報顯示,今年7月,豆包占據AIGC APP月活躍使用者規模榜首,而智譜清言以245萬月活使用者排名第八。

「to B和to C之間的界限已經被打破了。」張鵬說,企業無非兩大部份組成:人和組織。服務好企業裏的每個人其實就是在服務這個企業。組織跟個人不一樣的地方是多了流程、協作和組織架構,其實也是人和人之間的關系。

每一次釋出,智譜都會優先把產品放到清言這個平台來讓使用者體驗,第一個目的就是能夠快速讓大家可用。釋出即可用,這是張鵬一個很重要的理念。後來他在分享的內部文章中寫了一句話:不完美但可用的東西,比完美但不可用的東西更有價值。這是張鵬在成為CEO之後的一個最明顯的變化。

大模型技術的創新依舊突飛猛進,而飛速變化的不只是技術,還有價格。智譜也成了今年最早一批降價的大模型創業公司之一。

5月11日,智譜宣布入門級產品 GLM-3 Turbo 模型呼叫價格從5元/百萬 Tokens 降至1元/百萬Tokens,降至原本的1/5。3天之後,OpenAI釋出最新模型GPT-4o,定價比GPT-4 Turbo減半,並且套用端向所有C端使用者免費開放。實際上,每次推出新模型都比上一代模型價格減半,幾乎是OpenAI的固定操作,不過這一次常規降價,卻成了國內大模型價格戰的一個引子。整個5月份,不下7家大模型企業加入到這場混戰中,包括字節跳動、阿裏雲、百度、騰訊雲等互聯網大廠以及垂直賽道頭部玩家科大訊飛,降價動作最接近也就相差幾個小時。

「降價是智譜持續在做的,不是為了應對市場壓力,或者跟競爭對手打價格戰。」張鵬表示,「作為一家初創企業,我們燒的是投資人的錢,我們沒有資本去打價格戰。所謂的價格戰不是我們發起的,我們只是正常地根據技術進步叠代把價格往下放,因為我們的成本已經降下來了,就不用堅持原來比較高的門檻。」

「把它秒了」

2024年9月初,智譜剛剛完成最新的一輪融資,金額數十億元,領投方為中關村科學城公司。

在接受【中國企業家】的訪談時,張鵬介紹了這輪最新融資。他說,「我們有自己的融資節奏,在不同階段為不同目標去融不同的錢,跟不同類別的投資人接觸。這次融資由中關村牽頭,也有一些其他的投資方,因為到了現在這個階段,需要各方的支持,包括市場化的基金和官方(資金)。」

和世界頂級大模型公司的追趕和比拼,讓張鵬意識到,「我們面臨著可能是一個跨階梯的階段。我們可能要把自己的整個能力提升到另外一個level上去,這個時候可能就不是單純靠技術,或靠自己自然增長的產品能力,去做(成)的一件事情。」

「沿途下蛋」,是商業化策略,但張鵬站在全域的戰略思考是:需要更多撬動戰略性力量來參與這件事,因為它已經上升到更高層面。

「百模大戰」仍在持續,有風口就會有人跟風,有跟風就會有搖擺。哪怕是一個小小的震蕩,也會引發蝴蝶效應,去年,ChatGPT的流量增速出現下滑,國內立刻出現悲觀的論調,很多企業融資隨即遇到困難。截至目前,全球範圍內,對大模型還沒摸索出一套成熟的、行之有效的商業模式。這個突破口,至今沒有找到。中間會發生什麽樣的變數,不知道。

對於張鵬和智譜而言,外界也有一些疑問:和OpenAI的實力差距是多少?還需要追趕多久?

張鵬會想起小時候玩過的一個遊戲,打磚塊:螢幕上端是堵磚墻,下端是一個小球和擋板。

用擋板攔住小球,彈射磚塊,目標是把磚墻全部擊碎。隨著關卡難度的上升,磚墻越來越厚,這時候需要找到突破口,一旦小球進入突破口,就會加速破壁。

在張鵬看來,創新這件事和打磚塊一樣,先易後難,關卡的障礙越來越多,突破口也越來越小,有時只是一條縫隙。難就難在很少有人去真正地找那個縫隙。或者像挖井一樣,挖了幾鍬,走了,其實水就在下面。

對於差距的問題,張鵬說,「工程師就這麽討厭,需要特別講邏輯,盡量保持嚴謹。就看你從哪個層面上說。單從技術上說,我覺得這種代差或者時間差上,我們已經追到非常接近了,半年到一年」。

智譜的科學家許斌,更願意把兩家公司做的事比喻成登山。就像南北兩面攀登珠穆朗瑪峰的兩支登山隊,不同的是,有人提前用自己堅信的技術路線登上了珠峰的山頂,而有的人還在山腰上,山腰上的人已經知道自己不是攀上珠峰的第一人了,雖然遺憾,但同時還有一種訊號被釋放出來,珠穆朗瑪峰不是真的高不可攀,人類可以攀登上去。

至於是不是第一名,當然很重要,但更重要的是,在過去幾十年裏,期待和失望反復交替出現在人工智能歷史中,現在反而讓他們能百分百確定,現在是認知智能登頂的時刻了。

智譜有著自己的定力和底氣,它和其他公司最大的不同就是:「含清率」。

當年高考,張鵬沒有跟家人征求意見,只填報了一個誌願:清華大學。他和公司創立發起人的唐傑、科學家許斌、董事長劉德兵、投資人李家慶、師弟李智星,都是出自清華。

現在,智譜也有很多畢業於清華大學的員工。如果你來到智譜位於11樓的辦公室,可能會看到這樣一幕:一個男生穿著睡衣和拖鞋,從你身旁慢慢走過,晃晃悠悠像是在夢遊。隨便一問,這個年輕人可能就是一個研究員,再問履歷,不是哪個省的高考狀元,就是哪個地區的高考第三名。

著裝對這些年輕人來說不重要,重要的是:把它秒了。

這是這家公司的專屬語,通常語境是,哪個技術難關需要攻克,有人頭都不擡應一句:「哦,那把它秒了吧。」年輕人晚上睡不著覺聊天,聊出好點子,「明天把它秒了」,第二天就能見成果。外面的人們看不到的是,但凡遇到重大的挑戰,這些年輕人,大年三十也會在工位上「秒」。

在這些年輕人中間,你可能聽不見有什麽多余的話,但是張鵬說,這裏的所有人心裏都有技術理想,也相信總有實作的那一天。「理想」這兩個字大家嘴上從來不說。任何行業都不缺理想,但這裏的每個人都見過清華大禮堂前日晷上的四個字,「行勝於言」。現在出了校園,銘言也在智譜出現,只不過換成了「do it now」。

團隊中極少有人見過張鵬發火,唯一的一次,是一件事情大家在猶豫做不做,放在時間維度上,還真的不是所有事都能「do it now」。那次,張鵬這個身材清瘦的CEO氣得直接拍了桌子,在他的邏輯中,一件事要麽做,要麽不做,但是不能在團隊裏出現內耗。

其實公司離校園並不遠。2024年1月,智譜搬了新家,在搜狐網絡大廈,辦公區占據大樓7—11層的空間,離清華大學不到3公裏。這原本還是搜狗公司的總部。大廈正好站在一個「AI的十字路口」,原本王慧文的光年之外占據了大樓的三層,路的另一側有 「清華系」 代表團隊聆心智能和深言科技。

站在智譜7層的落地窗前,往西遠眺能看見頤和園的萬壽山,往北366米是清華大學FIT樓,也就是清華大學資訊科技研究院院樓。張鵬在清華度過了將近20年的時間,FIT樓建成以後,他的時間基本是在這裏度過。現在,智譜GLM大模型的圖文介紹被張貼在FIT三樓的宣傳欄中。

某種程度上,清華大學撐起了當下人工智能大模型的「主力陣容」。

有一次張鵬和幾個師兄一起吃飯,琢磨這一波技術浪潮裏面清華做對了什麽,讓清華這一批人能夠在AI這件事上占得這麽多先機。討論來討論去,都沒討論出什麽新的東西,最後大家還是回歸到最原始的本質,清華的環境培養了一撥踏實務實又具有創新精神的人,他們覺得這個是最關鍵的。「人工智能的創新,首先它不是一個純學術的東西,它是學術、工程、市場化方方面面綜合起來的事情,所以你要成功,不是一兩個人就能做成的,得有這麽一幫人有同樣的信念、價值觀、行事的方式,而且都要高度一致。符合這些要求你才能成功,而這些恰恰是清華這個環境造就的。」

就像張鵬和他的夥伴們回憶起當年做決定的那一刻,張鵬承認,「也是腦子一熱」。這是積累多年的相互信任,也是對技術最原始的相信。

理想和支點

2024年7月26日,智譜的產品版圖中增加了對標OpenAI影片生成模型Sora的一員:支持文生和圖生的影片生成產品「智譜清影」。

這是智譜對OpenAI的第四輪大規模技術追趕。從GLM-3、ChatGLM、GLM-4到如今,這家中國的大模型獨角獸,幾乎每釋出一次技術重大突破,都和OpenAI的舉動密切相關。

但今年,這場賽跑似乎進入到一個新的拐點,張鵬說,「OpenAI公布的技術細節越來越少,但好處是,我們不可能永遠跟在它後面,總有一天要用自己的路徑跑到前面。」

OpenAI不是目標,而是賽道裏身位靠前的那位選手。「創業是一場馬拉松,不是沖得越快越好,你是需要堅持的。」張鵬說。

那目標到底是什麽?

智譜把2024年定義為AGI元年。AI技術增長進入到了一個全新的階段,「技術曲線的陡峭與讓更多人享受到AI強大的生產力之間還有非常大的差距」,如何把強大的大模型能力真正用來幫助人們的工作、學習和生活,其中還有很多工作要做。

AGI,全稱為Artificial General Intelligence,通用人工智能,它被認為是AI的更高層次,可以實作自我學習、自我改進、自我調整,進而解決問題,而這個過程中,不需要人為幹預。通俗地說,AI有自我意識,可以自主行動了,真正的從工具轉變成生命。

讓機器像人一樣思考,是智譜的創業理想和目標,是這場比賽的終點,也是他們一直追趕的支點。

圖源視覺中國

智譜的投資人、君聯資本總裁李家慶也意識到了這個節點,「當數據量、算力、大模型達到一定程度的時候,就會發生一些我們意想不到的東西」 。

3年前,君聯資本領投智譜,開始時李家慶不是奔著大模型去的,而是智譜早期研究的知識工程,他對這件事本身充滿了興趣,當時投資的報告書上也幾乎都是和知識工程、技術資訊、知識圖譜相關的內容,對大模型的描述反而沒有什麽篇幅。李家慶只是知道,張鵬及團隊已經在探索和研發一些跟基礎預訓練大模型相關的東西了。「但那件事到底有多大,是不是完全能夠走得通,我們並不清楚。當時只是看見在碗裏的東西,但大模型就像是種在田裏。」

而僅僅是3年過去,技術的爆發,行業的巨變,反而讓李家慶更冷靜,他把今天看成白堊紀時代,「行業的整個地殼都在發生變動,所有人看到的都是陸地上的一角,當有人覺得地殼穩定下來了就馬上開始跑馬圈地蓋房子,結果海平面一上來就把地殼頂掉了,現在的當務之急是觀察地殼的運動趨勢和規律」 。

他又打了一個比方,大模型相當於給這個世界在換引擎,這是一場巨大的、未知的變革。這個變革需要漫長的時間,他說,不會是要麽速勝,要麽速亡。

很多時候,答案要靠時間一點一點揭曉。這同樣也是張鵬冷靜的原因。如果不是把大模型壓在一兩年的時間密度裏,很多事情會看得更清楚。

不穩定的地殼上還是有堅定的理想主義者。李智星更願意用一句古話來形容對AGI的期待——「朝聞道,夕死可矣」。他想起劉慈欣的小說【朝聞道】裏,有一群知識分子,他們在宇宙排險員到來後,願意以死換取自己研究領域的終極真理。AGI對李智星來說就像終極真理一般的存在,「以前不溫不火,現在突然有一個東西給推上了潮頭。我現在跟著張鵬站在潮頭上,雖然要維持平衡保持方向還是挺累的,但是你站在上面還是很刺激的」 。

張鵬也表達了同樣的感慨,「能生在這個時代很幸運,一輩子幾十年的時間,可能就趕上這麽一波技術的潮流。」

在這波潮流之上,張鵬變得比以前更忙了,他一度每天只睡5個小時,身邊人總能看到他濃濃的黑眼圈。後來聽從醫生的建議,才保證每天7小時的睡眠。可睡眠之外的時間,是高速運轉的。多年的好友兼同事何蕓想要向張鵬請教技術上的問題,都要「插隊」搶在其他人前面才有機會見上一面。

偶爾也有停下來的時候。他給初中的女兒講功課、習題,有一次把女兒「講哭了」,從習題本身,到原理,到道理,不厭其煩地全講了個遍,而女兒有點不耐煩,她只想知道答案,最後心急得哇哇大哭。第二天,女兒從學校回來以後,走到張鵬近前:「爸,你說的那個確實有道理,我突然一下子就通了。」

可在自己的事業中,有些事情,沒辦法那麽快得出標準的正確答案。

他心目中那個理想,實作之後,是什麽樣的狀態?

張鵬願把AGI做一個更簡單的描繪:拿人做對比。像圖靈測試,透過行為學的定義,用對話的方式讓人分辨機器和人,如果人分辨不清哪個是機器,哪個是人,那就表明機器透過了測試。

在現實生活中,他的理想抵達的狀態是:人感受不到機器的存在。

張鵬曾看過一部電影,【her】,2013年上映的,斯派克·瓊斯編劇並執導。

該片講述了狄奧多離婚後,偶然接觸到最新的人工智能系統OS1的化身薩曼莎,發現彼此如此投緣,而且存在雙向的需求與欲望,人機友誼最終發展成為一段不被世俗理解的奇異愛情。

「這怎麽可能是一部愛情電影?」在張鵬眼中,主人公和人工智能的交流、互動是無比自然流暢的,也沒有區分工作狀態、生活狀態或是娛樂狀態,「我可以跟你是工作的同事,下班之後,我們倆可以一起去酒吧,或者去餐廳吃飯」 。 他不認為這是一部機器,而是親近的朋友。

張鵬覺得,他離這樣的世界越來越近了。