當前位置: 華文星空 > 心靈

AI-Native的路要怎麽走?一群技術「老炮兒」指明了方向

2024-12-21心靈

上世紀70年代,沃茲尼克、賈伯斯、費爾森史坦、比爾·蓋茲、約翰·德雷珀等人成立了名為Homebrew Computer Club的組織,他們在聚會中展示創意、交換想法,希望開創一個每個人都有電腦的世界。

後來的故事大家都很熟悉,沃茲尼克和賈伯斯在Homebrew Computer Club的會議上展示了Apple I,並在第二年成立了蘋果公司。同時推動了開源文化的興起、個人電腦的普及,成了科技史上最具影響力的技術社群之一。

當世界進入到智慧化時代,創新的種子在全球遍地開花,類似Homebrew Computer Club的社群也開始在更大範圍內萌芽。

其中就有2020年12月30日成立的創原會,由CNCF執行董事Priyanka Sharma、中國信通院雲大所副所長栗蔚和華為雲CTO張宇昕作為創始會員構建的全球技術創新交流平台,希望透過探索前沿的雲原生、AI等技術,共享產業落地實踐經驗的方式,共創技術與業務融合的無限可能。

經過四年時間的發展,創原會已經吸納了來自學術研究、汽車出行、能源制造、互聯網、金融投資、貨運物流等行業的三百多位技術骨幹,不乏銜遠科技創始人周伯文、面壁智慧CEO李大海、吉利汽車數位中心主任鄭金偉、小紅書雲原生基礎平台負責人黃玉奇等懂行的技術「老炮兒」。

正是在這樣的背景下,每年一次的創原會年度技術峰會,作為會員們年度相聚、思想碰撞、互動交流的「舞台」,已成為洞察行業創新趨勢、落地實踐經驗的風向標。

比如剛剛結束的2024創原會年度技術峰會,達成了「全面擁抱AI-Native」的共識,並為AI-Native的落地指明了方向。

01 走向AI-Native,先要解決算力資源的挑戰

根據咨詢機構Gartner的預測,2026年將有超過80%的企業在生產環境中落地大模型或呼叫API,並部署啟用生成式AI套用。

比研究報告更加直觀的,是創原會年度技術峰會上的熱烈討論: 技術「老炮兒」談論的不再是「怎麽使用AI」,而是怎麽將AI作為業務和生產的核心支撐,用AI重塑流程與創新產品,實作更高效與智慧的運作。

創原會的會員們一致認為,算力挑戰是普遍現象。

大模型的訓練和推理,都需要強大的算力資源,而國內的很多企業無力承擔龐大的硬體采購成本。即使有了算力,由於大規模分布式計算、彈性擴充套件和模型調優等技術的要求較高,常常出現算力浪費或利用率不足的問題。

圖:華為雲CTO、創原會榮譽理事長張宇昕

華為雲CTO、創原會榮譽理事長張宇昕在演講中表示:「我們期望每個企業都能即時按需獲取AI算力,構建彈性、高效、多元算力的AI-Native基礎設施是關鍵。」

傳統的數據中心是CPU為中心的主從架構,所有資源的互動和資訊傳遞都以CPU排程為主,CPU效能提升和網路頻寬等都成為瓶頸。比如在AI訓練推理的場景中,CPU為中心的架構無法完全滿足業務所需的超大網路匯流排頻寬、記憶體頻寬和視訊記憶體容量,直接限制了訓練推理效率,並導致NPU算力和其它資源的閑置。

華為雲的解題思路是將數據中心演進到多元算力對等全互聯的架構,透過高速互聯網路協定,將CPU、NPU、記憶體等算力資源全部互聯,實作資源全池化、全對等互連、資源按需組合,從單體算力前進演化到矩陣算力。

張宇昕舉了一個真實的例子:在使用萬億參數的盤古S模型執行訓練任務時,采用多元算力對等架構的華為雲CloudMatrix,計算效率比傳統架構提升了68%;千億參數的盤古U模型的推理效率提升了30%。

解決算力瓶頸只是第一步,儲存也是制約AI發展的關鍵要素:32GB的視訊記憶體僅能裝下70億參數的模型,且隨著模型參數規格的增長,推理的視訊記憶體需求並行變大。

針對AI落地套用過程中遇到的儲存、數據等問題,華為雲早已給出了一整套成熟的解決方案:

透過用池化架構來擴充套件視訊記憶體的方式,解決了推理過程中的記憶體墻限制;透過將KV計算任務解除安裝到虛擬視訊記憶體和CPU上,讓單卡的並行數大幅提升;透過資料庫領域大模型+場景小模型的多模型協同,打造了智慧的資料庫引擎,並利用智慧開發助手和智慧運維助手,全面提升開發和運維效率;以及在安全合規、私密保護、可靠可控等方面的全盤布局。

走向AI-Native的過程,也是重新定義基礎設施的過程。就像開啟水龍頭時,我們不需要知道水是從哪條河裏來的;當我們呼叫AI算力的時候,不需要知道算力是怎麽來的,背後的技術和運維有多復雜。

02 AI原生套用開發,有了「流水線」般的新範式

回答了算力資源的問題後,AI-Native就不再是一道選擇題,而是千行萬業數智化轉型升級的必答題。

華為雲副總裁、戰略與產業發展部總裁黃瑾講述了自己的判斷:

相對歷史上所有重大技術變革和創新,不管是雲端運算、行動網際網路時代,其商業生態鏈都呈倒金字塔結構——套用和內容為王。同時坦言AI正在重塑IT的方方面面,包括重新定義基礎設施、重塑軟體開發過程、重塑軟體互動體驗,甚至在重塑軟體生態。

圖:華為雲副總裁、戰略與產業發展部總裁黃瑾

新的時代序幕已經拉開,身在局中的創原會會員們感同身受,他們的態度體現在討論的議題上:【根據企業自身業務需求,如何辨識和選擇AI在開發領域的價值場景?】【如何選擇智慧化研發相關的關鍵技術?】【AI時代下的效能雙引擎聯動,如何實作確定性增長?】

面對如何高效打造AI原生套用的疑問,張宇昕結合華為雲將大模型落地到30多個行業的400多個場景的經驗,給出了三個建議:

第一,企業套用要基於AI-Native的雲服務來開發和構建。

每個企業都需要持續思考如何把AI能力融入到自己的產品和套用中去,透過用以知識為中心的數據湖來構築數據底座,用自主智慧的工具鏈來開發套用,用AIGC+CG融合的數位內容生產線來創作內容等等。這樣的產品和套用將具備自主學習、持續叠代、適應變化的能力。

第二,用基礎大模型+工具鏈+企業經驗,構建企業自己的專屬模型。

大模型落地套用的過程中,也產生了「不可能三角」問題——需要在專業性、泛化性、經濟性三者中做好權衡:通用大模型缺乏行業Know-how,在專業性上無法勝任企業的業務需要;訓練大量專業數據,又會引發大模型的泛化能力下降;模型參數規模越大,效能和精度效果越好,但是訓練成本會很高。

張宇昕的答案是:「模型不是越大越好,也不是一個大模型可以打遍天下,企業要結合自身經驗和行業Know-how來打造自己專屬的模型。」

比如將不同行業專屬的高品質數據,結合行業Know-how訓練通用大模型,並針對不同行業對模型能力的偏好進行通用數據增強,打造行業場景的大模型。各個企業在行業大模型的基礎上,增訓自己的私有數據、企業Know-how,排程企業專用工具和外掛程式,構建出企業自己的專屬模型。

第三,用大模型系統構建AI原生套用,實作企業智慧升級。

大模型的訓練不應該重復造輪子,大模型的落地也不應該一次次從0到1,而是將模型與工程化能力相結合,實作模型接入與對外介面標準化,開發者可以按照相應的規則呼叫,直接建立AI原生套用。

相對應的正是華為雲的大模型系統,包含行業數據和知識組成的知識中心,企業專屬大模型、開源大模型以及傳統小模型構成的模型中心,搜尋引擎、程式碼執行器整合而成的元件中心等等。

開發者可以透過大模型系統的增強外掛程式,譬如安全護欄保障模型的安全性、RAG檢索增強來消除大模型幻覺,利用標準的API介面,協同配合多種模型,以取長補短的方式快速實作企業的智慧化升級。

打一個比方的話: 如果說傳統的套用開發是「手工作坊」,有了完善的工具鏈、大模型系統和獨立處理復雜任務的AI Agent,AI原生套用的開發已經進入到了「流水線生產」的模式,為數智化轉型按下了「加速鍵」。

03 大模型平民化,在場景中看見新質生產力

當AI-Native的路徑被跑通,大模型不再是少數頭部企業的「特權」,AI將和千行萬業的真實場景碰撞出什麽樣的火花?

就歷史經驗來看,相較於數據上的宏觀論述,可以觸摸的落地案例更有說服力。2024創原會年度技術峰會上有一個特別的環節,評選出了「2024年度AI-Native十大先鋒實踐」,也為外界提供了窺探落地現狀的視窗。

圖:「AI-Native十大先鋒實踐」案例

我們篩選出了三個有代表性的例子。

一是借助AIGC最佳化內容生產流程的喜馬拉雅。

作為國內規模領先的線上音訊分享平台,喜馬拉雅在2023年專門成立了「珠峰實驗室」,著手研發了「珠峰音訊AI模型」。

為了解決大模型訓練和推理的算力需求,喜馬拉雅構建了自建AI基礎設施與公有雲AI資源池的混合架構,讓資源利用效率提升了20%、資源成本降低了10%。目前「珠峰音訊AI模型」已經生產了數萬本有聲書,包括模仿單田芳聲音的AI合成音訊專輯,極大降低了平台的成本投入。

內容生產的流程被重塑後,喜馬拉雅進一步研發了AI智慧推播系統、國內第一個全內容智慧AI音箱小雅等產品,不僅提升了內容推播精準度和效率,也為聽眾帶來了更加沈浸式、客製化的音訊體驗。

二是用AI大模型打造零售智慧體的美宜佳。

深耕零售行業近30年的美宜佳,開啟了創辦以來「最具創新」的一次轉型,聯合華為雲盤古大模型打造了AI+IoT+美宜佳業務平台的零售智慧體,並將其落地到3.7萬家門店,探索零售行業的新業態。

數位店員可以隨場隨身解答顧客的問題,播放音樂緩解顧客的壓力,像一座智慧化的「城市燈塔」,點亮了深夜歸家的路。

值得一提的是,美宜佳的智慧化探索,不僅為品牌商、門店店主、消費者提供了服務成本更低、效率更高、體驗更好的整合生態服務,沈澱下來的經驗和能力還將外溢到整個行業,驅動零售行業服務升級。

三是北京市政一卡通的人工智慧創新實踐。

基於華為雲的AI原生基礎設施,北京市政一卡通依托AI技術完成了一卡通支付的智慧化改造,有效支撐了一卡通公司在公共交通、商業消費、政府管理、創新套用4大領域28個行業的廣泛落地。

目前北京市政一卡通已經覆蓋國內330多個城市,每天為數千萬使用者提供持續、穩定、高效、安全的支付服務。同時人工智慧還在用卡安全等方面發揮了重要作用,為公共服務與社會治理提供了創新示範,連續多年被列入北京市政府「為市民辦實事工程」。

正如張宇昕所說:「中國的AI產業有著巨大的機遇,我們可以充分發揮在行業場景和行業數據領域的優勢,讓AI深入到企業核心生產系統,真正發揮產業價值和商業價值,推動產業升級和轉型。」

三個跨越互聯網、零售、政企的例子,僅僅是AI原生套用圖景的一隅,卻用事實印證了張宇昕的判斷,讓外界看到了實實在在的新質生產力,看到了行業生產力的躍遷。

04 寫在最後

Homebrew Computer Club在50年前點燃了個人電腦革命,為人類的生活和工作方式產生了顛覆性改變。

承襲了這種精神的創原會,為技術先鋒和產業創新者搭建了溝通的橋梁,正在將創新的力量擴散到更多的行業和場景中。

也許多年後再來審視2024創原會年度技術峰會,人們會驚訝地發現:解答了AI原生的算力困境、疏通了原生套用的開發路徑,照亮了一個個創新案例後,AI-Native的「星星之火」從此刻開始燎原。