日前,在re:Invent大會上,亞馬遜雲科技接連釋出六款大模型,讓2024年的大模型浪潮有了更加驚艷的壓軸表現。
作為全球互聯網、雲端運算和AI行業的領導者,亞馬遜雲科技連發六款大模型、全新AI伺服器、芯片以及一攬子新技術,同時推出了任意轉任意(Any-to-Any)萬能模型, 徹底改變了生成式AI的遊戲規則,也前所未有地強化自身在AI領域的存在。
祭出「六脈神劍」,亞馬遜雲科技還有更大殺招
2020年GPT-3的面世正式引爆生成式AI浪潮,至今四年多時間過去,各類大模型層出不窮,但依然無法滿足各行各業日益強勁、日益復雜的AI工業化需求。
亞馬遜雲科技釋出的六款大模型分別面向不同場景、不同領域、不同使用者:
Nova Micro:文本生成模型,效率高、延遲低、占用資源少,具有極高的經濟性,適合純粹的文字工作者;
Nova Lite:低成本多模態模型,具有30萬token上下文視窗,可處理大約22.5萬個單詞、1.5萬行電腦程式碼,或者30分鐘視訊素材,兼顧成本與功能,適合大多數普通使用者;
Nova Pro:功能與Nova Lite相同,也擁有30萬token上下文視窗,支持圖文、視訊素材分析,但效能和成本更加均衡,適合要求相對專業的廣大使用者;
Nova Premier:Nova系列效能最強的多模態模型,但定位是「教師」而非獨立使用模型,可透過知識蒸餾技術來指導和提升一個更簡單、更易於部署的學生模型的效能與精度。
Nova Canvas:圖片生成模型,支持生成和編輯圖片,提供配色方案和布局控制項,適合圖片設計師或圖文工作者,其內建的安全控制項能夠生成可追溯性浮水印,從而限制使用者利用Nova Canvas生成有害內容;
Nova Reel:視訊生成模型,現已支持生成時長6秒的視訊,即將推出可生成2分鐘視訊的版本。
這六款大模型覆蓋了文字、圖片、視訊等主要內容生成領域。在2024年的最後一個月,祭出六款大模型的亞馬遜雲科技,讓我們看到了這位全球科技巨頭的AI實力與野心。
(圖源:re:Invent大會)
相較於「人有我有,人有我優」的6款大模型而言,我最期待的是亞馬遜雲科技計劃明年中期推出的「大家夥」:一款語音轉語音模型,以及一款任意轉任意(Any-to-Any)萬能模型,可輸出、文本、圖片、音訊、視訊等任何模態的內容。
亞馬遜雲科技AI和數據副總裁Swami Sivasubramanian曾表示,暫時沒有任何一款大模型可以統治世界,亞馬遜雲科技一半以上的客戶,會針對不同套用場景選擇不同的大模型。
的確,一款能夠完成任何任務的萬能模型,不論是訓練還是推理,所需算力都將無比龐大。從技術難度與成本兩方面考慮,放眼整個AI大模型行業,也沒有多少企業能夠構造出「萬能模型」。可一旦真的有企業成功打造出這樣一款萬能模型,能夠一站式輸出全模態內容,無疑也將徹底改變AI行業的秩序。
萬能大模型的到來,將徹底釋放人類的創意,所有個體與組織都可在萬能模型的幫助下任意自由創作圖文、視訊、音樂,基於萬能大模型也將出現萬能AI套用,一款大模型統治世界也就不再遙不可及。
有實力打造萬能大模型的巨頭有且只可能是世界級科技巨頭,而亞馬遜雲科技正是其中之一。
亞馬遜雲科技吹響了「萬能模型」的集結號
算力是大模型的基礎,能輸出任意內容的萬能大模型,所耗算力將遠超所有,這正是亞馬遜雲科技打造萬能大模型的底氣。作為世界雲端運算的開創者、領導者與AI技術的佼佼者,亞馬遜雲科技擁有龐大的算力規模和雄厚的技術底蘊。
在re:Invent大會上,亞馬遜雲科技推出了由Trainium2芯片驅動的Amazon EC2 Trn2例項(可理解成AI雲服務),其專為大語言模型和潛在擴散模型的生成式AI高效能深度學習而打造;而整合了64顆Trainium2芯片的AI伺服器Trn2 UltraServer,則能支持萬億參數的AI大模型即時推理。相較於當前由GPU驅動的EC2例項價效比提升了30%-40%。
亞馬遜雲科技還釋出了新一代AI訓練芯片Trainium3,其基於3nm制程工藝,實作了效能翻倍,能效提升40%;搭載Trainium3芯片的UltraServer ,效能預計比Trn2 UltraServer高出4倍。亞馬遜雲科技正在不斷強化AI芯片布局,成為打破輝達算力霸權的實力挑戰者。
(圖源:亞馬遜雲科技)
亞馬遜雲科技還與Anthropic洽談合作,正在構建名為Project Rainier的Trn2 UltraServers EC2 UltraCluster,芯片規模可達數十萬顆,將成為世界上最大的AI計算集群。
(圖源:亞馬遜雲科技)
眾所周知,雲端運算具有顯著的規模效應,AI計算也是如此。從AI伺服器到AI芯片再到超級計算集群,亞馬遜雲科技正在努力打造巨量規模的AI算力基礎設施,顯著提高AI計算效率、顯著降低AI計算成本,給萬能大模型構建了算力基座。
要打造萬能大模型,不能只靠算力,AI技術同樣重要,不只是大模型演算法,還有適配AI大模型的網路、儲存、調優、工具等技術,而亞馬遜雲科技,早已擁有領先的全棧AI技術。
在這一次在re:Invent大會上亮相的Trainium2 UltraServer采用的就是新一代AI網路結構tnp10,為數千台伺服器提供數十PB網路容量的同時,延遲僅為10微秒,給執行參數量龐大的萬能大模型提供了可能。
亞馬遜雲科技還在re:Invent大會上推出了自動推理檢查、多Agent協作、模型蒸餾三大新功能,其中自動推理檢查可驗證大模型生成結果的準確性,提高推理結果的精度。
(圖源:亞馬遜雲科技)
多Agent協作則面向企業使用者,企業可在Bedrock上建造母計畫,再將子計畫分配給其他Agent推理計算,最終將不同Agent生成的內容整合輸出。原先可能需要1周時間才能完成的任務,在多Agent協同功能的加持下,1個小時內就能完成推理。
模型蒸餾功能主要用於訓練小模型,盡管小模型的精度和功能性會失真失,但是參數量大幅減少,可節省一定的資源,提升響應速度,更適合邊緣計算、端側AI、智慧制造等特定場景。
亞馬遜雲科技還升級了Amazon Q Developer輔助編程平台、與NVIDIA聯手打造Blackwell架構P6例項、升級數據管理系統,並推出了全新數據中心元件。
一切的一切,都在給萬能大模型的到來打好基礎。萬事俱備只欠東風,面向下一個生成式AI階段,亞馬遜雲科技已經準備好了。亞馬遜雲科技這家全球AI科技巨頭的雄心壯誌,已然浮出水面:探索AI的終極形態。
Any-to-Any將是通用AI大模型的終極形態
大模型當前百花齊放,有開源與閉源區別,有不同規模區別,還有通用型大模型和垂類大模型的劃分,其中垂類大模型是指標對特定場景和用途訓練的大模型,僅能解決對應性問題。我們日常所談的頭部大廠的大模型屬於通用大模型,比如文心、豆包、通義、星火等等。
國內外諸多AI巨頭在結束「大模型卷參數」後,已將重點放在大模型落地上,比如Apple Intelligence以及國內手機廠商的AI Agent,就是AI大模型在硬體產業的落地形態。
至於說大模型本身,當前很多科技巨頭認為技術已經差不多了,很少有巨頭提出要打造萬能大模型的想法,甚至部份玩家如百度還明確提出了不做視訊大模型——自然也不可能做萬能模型了。
不過,也有不少玩家在豐富大模型的多模態能力,比如華為的盤古大模型,OpenAI的GPT-4等,都在豐富功能向「更全能」方向發展。
亞馬遜雲科技誌向更加遠大,在透過更高價效比的算力方案助推大模型落地套用的同時,積極探索萬能大模型這一終極形態,讓「輸入任意模態資訊與輸出任意模態結果」的超級AI成為可能。
其實很多科技巨頭不是不想做萬能大模型,而是不能。 在技術能力、算力資源的掣肘下,大多數通用型大模型甚至不支持輸出音訊和視訊,但亞馬遜雲科技這一次推出的六款大模型,就已實作多模態內容輸出,比如Nova Reel模型,生成視訊長度即將達到2分鐘,在行業屬於領先水平。亞馬遜雲科技的AI算力與技術實力,足以讓大多數AI公司艷羨。
(圖源:亞馬遜雲科技)
如今,亞馬遜雲科技已吹響萬能模型大戰的集結號。25年,AI世界也將迎來革命性的Any-to-Any時刻。相信更多企業會加入萬能模型的戰爭,而不是坐等亞馬遜雲科技的萬能模型「統治世界」。
只剩不到一年的時間,讓我們一起靜候AI大模型的「超級大家夥」。
免責聲明:前述特定亞馬遜雲科技生成式人工智慧相關的服務僅在亞馬遜雲科技海外區域可用,亞馬遜雲科技中國僅為幫助您發展海外業務和/或了解行業前沿技術選擇推薦該服務。
#亞馬遜雲科技 #re:Invent2024 #2024亞馬遜雲科技re:Invent全球大會