智東西
作者 | 三北
編輯 | 漠影
大模型進入創業爆發期,來自全球大廠的離職AI大牛成為一大主力軍,近期圈內熱門的階躍星辰是一個典型代表。
成立於2023年4月的階躍星辰,是由原微軟全球副總裁、微軟亞洲互聯網工程院首席科學家姜大昕創辦的通用大模型創業公司。
這是一個「臥虎藏龍」的團隊:創始人、CEO姜大昕是自然語言處理領域的全球知名專家,也是階躍星辰的演算法負責人;系統負責人朱亦博曾在谷歌、字節和微軟等公司就職,擁有多次單集群萬卡以上的系統建設與管理實踐經驗;數據負責人焦斌星此前擔任微軟必應引擎核心搜尋團隊負責人,負責利用資料探勘和NLP演算法最佳化索引和搜尋品質……基於這樣的團隊背景,階躍星辰僅花了一年時間就憋出「大招」。
今年3月23日,階躍星辰推出Step系列通用大模型,打響國產玩家進擊萬億參數規模通用大模型的響亮一槍。
同時,階躍星辰的兩款C端產品——效率工具「躍問」和AI開放世界平台「冒泡鴨」已經全面開放,在巨頭雲集的「百模大戰」中撕開一道新口子。
創業一年來,階躍星辰對大模型產業有什麽獨到見解?其推出的大模型的實際體驗效果如何?智東西來與讀者一起一探究竟。
躍問體驗地址:https://stepchat.cn/chats/new
冒泡鴨體驗地址:https://maopaoya.com/discover
一、微軟大牛下場創業,「鐵人四項」進擊AGI
按照階躍星辰的理念,大模型的演化路徑會經歷「從各模態獨立發展、到融合統一、再到主動探索物理世界」的三個階段。
姜大昕在此前的媒體溝通會上表示,階躍星辰正處在多種模態走向融合的第二階段。
姜大昕認為,多模理解和生成的統一是通向AGI的必經之路。原因有兩個:第一,多模理解是多模生成的堅實基礎。Sora在視訊生成領域的驚艷表現,正是因為OpenAI有非常出色的多模理解模型GPT-4V。第二,多模理解做得好,也證明了模型在LLM方面的能力優秀。正如GPT-4V的基礎是GPT-4。
Scaling law是階躍星辰在追逐AGI路上與多模態齊頭並進的方向,為此其提出「鐵人四項」,算力、系統、數據和演算法四大要素缺一不可。
在姜大昕看來,能夠自己從頭訓練千億參數模型已經是個不低的門檻,而在千億之後,每增長一個數量級,面臨的挑戰卻是幾十倍的增長。
因此,能否對這四大要素進行綜合布局,非常考驗一家創業公司的能力,也決定了這家公司能走多遠。
▲階躍星辰創始人姜大昕在講解攀登Scaling law所需的要素
二、左手效率神器、右手開放世界平台,實測兩款AI產品
基於多模態和Scaling law兩大路線,階躍星辰推出了Step系列大模型。
Step-1千億參數語言大模型於2023年8月底訓練完成。經過充分準備,Step-1大模型的進展非常快,用時2個月一次性訓練成功,綜合效能超過GPT-3.5。
Step-1V千億參數多模態大模型於2023年11月訓練完成。Step-1V在多個主流評測集上效能指標比肩GPT-4V。特別是在多模理解能力上達到全球領先水平。Step-1V大模型可以精準描述和理解影像中的文字、數據、圖表等資訊,並根據影像資訊實作內容創作、邏輯推理、數據分析等多項任務。
Step-2萬億參數語言大模型采用MoE架構,每Token啟用兩千億以上參數,聚焦模型深度智慧水平的探索,綜合體感對標GPT-4,目前已釋出預覽版。
圍繞Step-1和Step-1V千億參數大模型,階躍星辰的產品和生態已經初步打磨成熟。
以躍問為例,其在影像理解、內容創作、邏輯推理、指令跟隨等方面的能力,使其成為一個出色的「個人效率助手」。
比如,當智東西發給躍問一篇報道連結,躍問立馬為我提煉了報道中的關鍵數據和資訊點。
當智東西給它一張關於「A公司營業收入與毛利、凈利」的統計圖,並要求其「將圖中的內容轉成表格形式,並計算每年凈利增長率」。躍問迅速生成了表格,並算出了9.54%、2.72%兩個圖中沒有直接給出的答案,體現了強大讀圖、數學、組建聯動能力。
透過點選展開「程式碼執行完成」,智東西追溯了計算過程,確認兩個數值計算正確。
當智東西給躍問一張菜肴的圖片,躍問則準確地辨識了這是一道經典的湖南菜「辣椒炒肉」,並給出了烹飪所需的材料和烹飪步驟。可見躍問的常識知識還是很豐富的,可以做不錯的日常助手。
再看看冒泡鴨,這是一個由劇情和角色組成的AI開放世界平台,能滿足多種娛樂和社交需求。
以逃離精神病院Agent為例,這是一個有趣的心理學遊戲,我需要透過與「兔子醫生」的對話,找到逃離精神病院辦法。而逃出這裏的唯一方法,是成為一個真正的病人。這一遊戲獲得了超5.6萬的熱度。
躍問和冒泡鴨只是Step系列大模型的小試牛刀。為了促進Step系列大模型套用生態的繁榮,在生態布局方面,階躍星辰與合作夥伴共同探索面向C端使用者的創新套用,API開放平台目前已開放體驗。
結語:大廠牛人紛紛「下海」,掀起AI創業潮
縱觀產業,當下大廠牛人紛紛「下海」投身大模型創業,掀起一波新的AI創業潮。
創業方向也展現出百花齊放的態勢,通用大模型創業成為一個值得關註的前沿方向。尤其是今年Sora的出現,讓我們看到基座模型在叠代細分模型套用上的效率和效果,堅定了通用大模型創業的發展路徑。