如果給中國大模型企業的創業圖譜建立一個座標系,位於清華大學東門外十字路口一側的搜狐網絡大廈或許是最合適的座標原點。張朝陽可能也沒想到,昔日互聯網風水寶地,如今承接了新的技術使命。
2023年4月6日,美團聯合創始人王慧文在朋友圈發文稱:「新辦公室第一天,切個蛋糕。」事實上,距他廣發英雄帖招兵買馬到正式成立這家AI公司「光年之外」,只不過短短兩月。而這條朋友圈也恰好曝光了辦公室的位置——光年之外就潛伏在搜狐網絡大廈的三樓。
4天後,搜狗創始人王小川在搜狐網絡大廈的二樓創立了「百川智能」,旗幟鮮明地對標OpenAI。巧的是,大廈的7樓到11樓,是另一家人工智能公司「智譜AI」的大本營。大廈不遠處,分布著聆心智能、深言科技、瀾舟科技等一眾大模型先行者。
盡管成立的時間與契機各不相同,他們卻都共享著同一個標簽——清華系AI公司。
這些公司的主導者,都出自清華大學。論輩分,王小川算是王慧文的師兄,兩人分別畢業於清華的電腦和電子工程專業;智譜AI的當家人則是智源研究院學術副院長、清華大學教授唐傑;聆心智能由清華大學電腦系副教授黃民烈創辦;深言科技創始人兼CEO豈凡超為清華大學電腦系博士,聯合創始人兼COO李瀟翔則是清華大學電子系博士……
清華大學人工智能研究院常務副院長、歐洲科學院外籍院士孫茂松同時擔任著深言科技的首席科學家,豈凡超曾說,想和教授交流時,只用走幾百米回學校。
作為中國人工智能教育的起點之一,清華大學為國內大模型行業培養了眾多中流砥柱。除上述企業,冪律智能、面壁智能、生數科技、月之暗面、銜遠科技、一流科技等公司也紛紛帶著清華血統,同樣具備著強大的技術基因和「產研投」一體化優勢。
新興技術一般存在兩種發展路徑,分別是TPF(Technology Product Fit)和PMF(Product Market Fit),TPF註重發揮技術優勢,PMF主張重視市場需求。「大模型本身更傾向於TPF,所以擁有雄厚研究資源的清華大學,在大模型理論創新和基礎研究上占據天然優勢。」AI分析師張翊珺告訴時代周報記者。
國家知識產權局和全球科學引文數據庫數據顯示,出自清華大學的大模型相關論文數量位列前三。「在大家公認擁有自研底座的企業裏,超過一半都有清華系學者的背景。一方面是因為他們本身在技術路線上積累深厚,另一方面也是因為從學者、創業者到投資者,清華系相對抱團。」啟迪國際技術轉移有限公司副總經理衛冕表示。
雖說將某一群體冠以簡單化標簽不足以反映復雜的現實,但標簽往往強調著特殊性。對內而言,這種特殊性在發揮集群優勢的同時,也會階段性地呈現由「群體規範」「群體壓力」衍生的問題;對外來說,特殊性又代表著競爭格局分化和大眾註意力的搶奪。
國內的人工智能研究晚於國外20年,不同於國外Open AI、Anthropic雙寡頭格局,國內大模型行業仍處於群雄割據時代,相互間緊密又割裂。
一方面,這些明星大模型公司背後站著重合的投資者;另一方面,攜帶不同基因的派別林立,大家在開源與生態、技術信仰等問題上喋喋不休,各執一詞。行業分散,時刻面臨洗牌,「清華系」這一標簽帶來的問題也呼之欲出:
他們之間能否實作有效、有序協同,在容錯率較低的行業中一榮俱榮?當下國內絕大多數大模型公司還未經受深度洗禮、無法明晰產品優劣,清華系一脈在有限的資源爭奪中,是否會加劇市場的馬太效應?
抱團關鍵詞:技術、資金與人才
清華系大模型公司抱團,表現在稀缺資源的價值取舍裏,最直觀的就是「錢」。
2024年年初,來自月之暗面的Kimi智能助手高舉「200萬字長文本處理能力」大旗率先出圈,完成10億美元新一輪融資,投資人包括阿裏、美團、小紅書、紅杉等大廠和頂級機構。此番融資後,月之暗面估值超百億人民幣,躋身「AI新五小龍」序列。
一位投資人士向時代周報記者稱,月之暗面的融資離不開前金沙江創投管理合夥人張予彤幫忙牽線搭橋。巧的是,作為金沙江創投主管合夥人的朱嘯虎曾不止一次公開表示對大模型的質疑:「我就不看好大模型。」
該投資人告訴時代周報記者,目前張予彤已從金沙江創投離職,但並未像外界所傳的那樣加入了月之暗面。
與月之暗面創始人楊植麟一樣,張予彤也是清華學子,其最受關註的兩例投資是小紅書和深鑒科技。實際上,作為楊植麟的師姐,張予彤早在2019年就投資了楊植麟擔任CTO的AI銷售中台公司、智能銷售系統、AI對話分析公司迴圈智能。
此次楊植麟的大模型創業,從組建團隊到尋找投資人,張予彤也在背後提供了諸多支持。有投資人評價:「說服巨頭轉變戰略大手筆支持你,並想出一個理想的交易結構都不是一件容易的事。」
在這些大模型初創公司背後的投資方中,「清華系」的創投者也充當了重要角色。圖靈創投、卓源資本、清華控股、水木清華校友種子基金、無限基金SEE Fund等清華系創投機構頻頻出手,如圖靈創投投了聆心智能、智譜AI,起源於清華大學FIT樓實驗室的卓源資本投了生數科技。
「清華系大模型公司的抱團建立在信任基石上。」北京資訊化局專家庫資訊化專家、工信部人工智能內容創作師認證主講人李楨告訴時代周報記者。
「開源大模型並不意味著百分百開源,且這些開源的程式碼背後都暗藏著模型公司自己的技術邏輯和訓練方法。而這些非公開資訊會導致基座模型與巢狀模型間出現一些無法適配的情況,需要雙方配合在基座模型上進行調整,這是業內非常基礎的問題。」
「解決這項難題需要開源團隊提供技術支持,但往往會面臨技術泄漏的風險。在清華系大模型公司間,這種相互幫扶卻很常見。」李楨補充道。
「可以想象到,未來清華系大模型公司間的抱團是更多維的。」張翊珺稱,當各公司的業務逐漸跑起來,有關產品的排程與供給和交易賬期等問題會更加靈活。
巧妙化解「重復造輪子」
清華系創業者似乎傾向於關註本質,對於競爭的思考不多。
清華校友王興曾說:「太多人關註邊界,而不關註核心。」清華大模型創業者身上也有類似的氣質,他們將競合視作常態。
從「百模大戰」時期不難看出,國內大模型產品已陷入同質化。據時代周報不完全統計,截至2023年底,國內大模型數量不下200個。
百度CEO李彥宏曾公開表示:「國內200多個大模型其實都沒有什麽呼叫量,要開發好用、可用的大模型,存在很高的技術和成本門檻。」在他看來,「重復造輪子」是對社會資源的極大浪費。
「李彥宏的擔憂不無道理,雖說對大模型的衡量標準很復雜,且各家產品落地場景也不同,但目前通用大模型在消費端的表現主要還是聚焦在內容問答、推理、總結上,並且模型能力的差異不大。」張翊珺表示,由於語料庫的局限,模型提供的即時性內容太過幹癟,邏輯推理層面也並未達到預期。
2023年11月,在新華社聯合北大釋出的【人工智能大模型體驗報告3.0】中,按照基礎能力指數、智商指數、情商指數、工具提效指數四大測評維度進行設計,測評出綜合能力排名第一的是科大訊飛旗下的星火大模型。
而基於語言理解與生成、知識理解與套用、專業能力、環境適應與安全性等標準的中文通用大模型綜合性評測基準SuperCLUE,則在同期給出了以下排名:百度的文心一言4.0位居榜首,月之暗面的Moonshot、零一萬物的Yi-34B-Chat、vivo的BlueLM、騰訊的混元、阿裏雲的通義千問2.0、智譜AI的ChatGLM3以及字節跳動的雲雀、訊飛星火紛紛緊隨其後。
「在測評標準一定重合的情況下出現並不統一的排名,說明在模型的實際表現中,大家沒有太大差距。」張翊珺告訴時代周報記者。
事實上,國內大模型公司采用同樣的數據集,相似的訓練方法,對標同樣的物件,確實難以產生多樣化的有利競爭。這對於師承一脈的清華系大模型公司而言,按照常規路線發展無疑會使問題加劇。
「目前來看,清華系大模型公司的格局是以智譜AI為中心,布局人工智能的上下遊。」關註硬科技賽道的投資人張巍向時代周報記者稱。
時代周報註意到,2024年3月底,致力於打造智能芯片系統的清程極智完成數千萬元人民幣首輪融資,中金、中關村智友領投,智譜AI、北京國管順禧基金、中關村科學城基金等跟投。智譜AI持股比例為2.1673%。
此前,智譜AI還投資了清程極智的友商——AI大模型軟硬件協同最佳化平台公司無問芯穹。這兩家企業同屬清華系,清程極智出身清華電腦系,無問芯穹出身清華電子系。
「行業競賽已經角逐到推理方向,大模型公司都很需要訓練與推理系統的國產化推進,以及技術自主與創新。」張翊珺表示,智譜正在不斷完善自己的生態圈。
被稱作全線對標Open AI的獨角獸企業,智譜不僅在技術和產品上向其看齊,邊融資邊對外投資的思路也如出一轍。智譜AI CEO張鵬此前曾表示,希望打造一個大模型生態。把生態圈越做越大,實作更長遠的商業化目標。
據時代周報不完全統計,截至目前智譜AI已經投資了十多家AI相關創業公司。
會對「非清華系」造成排擠嗎
清華系大模型公司之所以形成圍繞智譜發展上下遊的有序格局,實則是被動的。張巍稱,各公司間資金實力懸殊,他們普遍囿於資本市場的投資邏輯和有限的資金中。
「大模型的開發成本是十分昂貴的。主要開銷是人力成本、獲取數據以及清洗費用、電費和硬件費用。」長期關註AI的投資人陳緯表示。
近日,史丹佛 HAI 研究所釋出了第七個年度的AI Index報告。報告稱,人工智能效能的提高是有代價的。報告發現,前沿人工智能模型的開發成本正變得越來越高——Gemini Ultra 消耗了價值 1.91 億美元的計算資源,而 GPT-4 的開發成本估計為 7800 萬美元。
該報告還顯示,過去一年AI 行業吸引了252億美元的投資,幾乎是2022年投資的9倍,是2019年投資額的約 30 倍。
「即便行業內聚集了巨額的資金,但對於大模型這項龐大的工程來說依舊捉襟見肘。」陳緯補充道。她還表示,當大模型訓練完畢流向使用者,模型廠商還需要承擔使用者產生的算力成本。
「技術巨頭可以依靠其他業務輸血,創業公司就相對危險了。但一般來看,資本市場能養活的公司往往只有2個,參照網約車、本地生活這些賽道,最後只能留下2家巨頭。這也是風投機構為什麽不願意廣撒網的原因,押註過多籌碼意味著未來難以結束。」
「此外,由於行業發展太快,投資視窗期和投資門檻過高也是資金短缺的重要因素。當資本和技術巨頭們都已經選定了合作夥伴,留給其他公司的錢就不多了。」陳緯補充道。
智譜與MiniMax因成立較早,在資金上拿下了先發優勢,隨著其估值水漲船高,多位投資人向時代周報記者表示,等想要出手的時候,投資門檻已經相當高了,結束可能需要5年以上,大家都不敢冒著整支基金回報的風險去投大模型。
同樣成立較早,分別背靠微軟,Google與亞馬遜的OpenAl和Anthropic,前者當下估值超800億美元,後者估值為150億美元,而其他AI獨角獸的估值都在百億美元之下。
顯然,在有限的資源下,清華系的有序分工實則是聰明的做法。
一位苦融資久矣的大模型企業創始人向時代周報記者稱:「在技術差距沒有那麽大的情況下,投資人在選擇標的的時候更看中背書、成功經驗。‘清華系’模型公司一直是投資人的優先選擇物件。」他認為,有標簽,總歸比籍籍無名好。
「對於‘清華系’大模型企業和其他企業的資金競爭關系上來看,我認為應該站在更宏觀的角度。」李楨表示,「清華系」大模型企業不會對「非清華系」企業造成擠壓。
他稱:「國外大模型的開源比較徹底,國內企業在國外模型的基礎上自建模型也可以做出非常高質素的模型。」他認為,國內大模型企業可以分為很多派別。一類是以阿裏,字節,百度為代表的技術公司系,一類是具備學術基礎學院派,還有具備獨特行業內容的類似華為系等等。
「事實上,每家公司都可以因為社會因素、市場因素被劃分至不同的派系,大家都擁有同等的發展機會,都面臨著與國外在數據質素和算力上的差距。」李楨補充道。
面壁智能CEO李大海向時代周報記者稱:「百花齊放才是春,相較於標簽或許會產生的‘群體規範’,企業更關註整體環境的競爭壓力。」
實際上,市場上一直存在稱「清華系」大模型企業「象牙塔味兒」太重的聲音。這種聲音來自於各家企業拋開使用者增長與商業拓展,過度地在關鍵數據指標上掰手腕,過多地強調在某些參數和指標的全球排行榜名次,片面依賴論文等學術成果和開源社區表現。
「判斷大模型企業的商業化是否有前景,要從其產品定價策略、客戶付費能力、產品行銷推廣、人員構成以及收入規模來判斷。」張巍告訴時代周報記者。
據了解,智譜雙語千億級超大規模預訓練模型ChatGLM-130B定價120萬元/年,ChatGLM-66B 100萬元/年,ChatGLM-32B 50萬元/年,ChatGLM-12B 25萬元/年。智譜CEO張鵬此前表示,截至2023年11月,公司研發相關人員大概占百分之六七十。研發人員裏包含數據、產品、解決方案等等。「市場人員後續會增加多一些。銷售幾十個人,占比百分之十幾左右。整體上,還是保持研發人員占大比例。」他稱。
張翊珺表示:「B端使用者的付費意願要優於C端,智譜主要面向B端,預計會比C端產品更容易落地。大模型的競爭力在於好用和便宜,美國解決了第一點,而國內目前兩個都沒有解決。」
但好在,競爭壓力會時刻提醒駕馭著學術航母的清華系新秀們,商業的戰場不會優待文質彬彬的學者,此消彼長的參數最終還是要用人民幣做計量。