AI 時代，套用創造世界？

2024-11-16心靈

AI 套用時代，真的來了嗎？

今年的百度世界大會主題是「套用來了」——截至 11 月初，百度文心大模型的日均呼叫量已經超過 15 億，相較一年前首次披露的 5000 萬次，增長約 30 倍。李彥宏表示，「這條陡峭的增長曲線，代表著過去兩年中國大模型套用的爆發。」

而智慧體作為 AI 套用的最主流形態，即將迎來爆發點，李彥宏強調，「它將成為 AI 原生時代，內容、資訊和服務的新載體。」

這是因為，「一方面，做智慧體的門檻足夠低；另一方面，智慧體的天花板又足夠的高，可以做出功能非常強大的套用。多個智慧體的協作，還可以解決更加復雜的問題。」

李彥宏在會上展示了 4 種不同型別的智慧體，包括公司類智慧體，角色類智慧體，工具類智慧體和行業類智慧體。其中，公司官方智慧體很可能替代官網，成為最直接面向消費者的界面。

「公司類智慧體相當於 AI 時代的公司官網。傳統官網具有的那些能力，比如公司介紹、產品圖片和參數展示、線下門店位置等等，公司類智慧體都有。而傳統網站沒有的主動推薦、及時響應和一對一服務能力，公司智慧體也有。」

李彥宏還釋出了無程式碼工具「秒噠」——一個由大模型和智慧體組成的、不需要寫程式碼就能夠實作任意想法的軟體，包括無程式碼編程、多智慧體協作以及規模化地呼叫各種工具等能力，是「迄今為止人類歷史上最復雜的多智慧體協作工具」。

借助「秒噠」，使用者可以透過自然語言互動完成整套系統的搭建，還可以做任意場景下的各種套用，隨著基礎模型能力提升，以及秒噠本身技術能力的演進，未來可以做更多、更復雜的事情，「這意味著，你不需要去招募計畫經理、設計人員、開發人員、測試人員等等，自己就可以指揮多個智慧體來協同完成任務」，一個人可以是一整支隊伍。

用李彥宏的話來說，有了秒噠，將迎來一個「只靠想法就能賺錢的時代」。

文庫與網盤融合：更自由地創作

繼 9 月百度網盤的 C 端業務重新劃歸移動生態事業群組（MEG），並由百度副總裁、百度文庫&百度網盤負責人王穎接手管理後，在本次世界大會上，百度網盤和文庫又有了進一步融合。

王穎在大會上分享了百度在內容生產和消費方面的一些新變革。她談到，當前內容創作和消費面臨諸多挑戰，如工具繁雜、制作周期長和消費效率低。為此，百度文庫和網盤引入了 AI 技術，旨在打破工具束縛和模態邊界，實作更自由、高效的內容體驗。

百度文庫推出的智慧 PPT 生成、AI 論文創作、AI 畫本制作、AI 搜尋能力和 AI 小說漫畫生成等功能顯著提升了內容生產的效率和品質；同時，在內容消費方面，百度網盤推出了簡單掃描、簡單聽記和 AI 視訊摘要等工具，極大地方便了使用者處理和理解資訊。

具體來看，在辦公場景中，百度文庫提供了智慧 PPT 和智慧研報功能，百度網盤則具備簡單聽記等功能；在學習場景下，使用者可以使用百度文庫的智慧畫本和拍圖搜題功能，百度網盤則提供視訊解讀和盤盤單詞等輔助學習工具；在娛樂方面，百度文庫提供智慧小說和智慧漫畫，百度網盤則具備 AI 修圖等功能。百度文庫與網盤的融合拓寬了使用者的套用場景，實作了內容的智慧化和多樣化，進一步提升了使用者體驗。

自由畫布功能｜圖片來源：百度

此外，百度文庫與網盤聯合推出了全新的內容作業系統——自由畫布。這一系統可以幫使用者完成從找資料、到編輯、再到生成和分享的全部任務，不僅支持全格式輸入和多種模態的輸出，還能實作元素級別的內容利用，豐富了創作和分享的自由度。

用李彥宏的話說，「自由畫布就是一個由文心多模態大模型加持的萬能白板」。這些創新不僅展示了 AI 技術在內容領域的巨大潛力，也預示著內容生產和消費未來有更多可能性。

智慧雲：從技術變革走向產業變革

在大會上，百度集團執行副總裁、百度智慧雲事業群總裁沈抖分享了百度智慧雲在大模型和 AI 原生套用方面的最新進展。沈抖稱，大模型技術正在從技術變革走向產業變革，重新定義人與數位世界及物理世界的互動方式，成為企業提升競爭力的關鍵要素。

沈抖重點談到了千帆平台，這是一個大模型精調和套用開發的平台，提供豐富的工具鏈，顯著降低了 AI 原生套用開發的門檻。千帆平台不僅滿足了企業級套用的高度可客製化、大規模、高可用性和高安全性需求，還釋出了工作流 Agent。這一創新利用大模型的意圖理解和泛化能力，將復雜的工作流程變成靈活的智慧體，大幅提升企業效率。例如，太平洋保險利用千帆平台生成「金牌銷售」智慧體，顯著提升了車險續保的服務效率和使用者體驗。

百度智慧雲千帆｜圖片來源：百度

此外，百舸平台提供高效的大模型相關算力服務，從集群建立到模型訓練和推理，確保穩定、極速的效能。該平台解決了大規模集群部署中的關鍵難題，支持高效執行，滿足不同客戶的算力需求。

沈抖還展示了千帆平台在多個行業中的套用案例，包括全診醫學透過精調模型提升病歷生成準確度，節省醫生時間；國家電網基於文心大模型探索電力行業的 AI 套用，取得顯著成果。此外，曦靈 4.0 平台的升級使其能夠生成 3D 數位人形象並制作專業視訊，大幅降低了短視訊制作成本。

百度智慧雲透過千帆和百舸平台，構建了新型 AI 基礎設施，推動了大模型技術在各行各業的套用，以提升企業的智慧化水平胡效率。

小度 AI 眼鏡：首搭中文大模型

除了套用，百度這次在硬體上也有所釋出。在會上，百度集團副總裁、小度科技 CEO 李瑩釋出了「首款搭載中文大模型的原生 AI 眼鏡」——小度 AI 眼鏡。

小度AI眼鏡｜圖片來源：百度

李瑩稱，AI 眼鏡作為人類的第一視角裝置，其捕捉視覺、聲音、位置等資訊的能力，將給人們帶來前所未有的感官延伸，也一定會成為更高效、便捷的人機互動入口。

基於文心大模型和 DuerOS AI 原生作業系統，小度 AI 可實作備第一視角拍攝、邊走邊問、卡路裏辨識、識物百科、視聽轉譯、智慧備忘等功能。

透過端雲結合大模型，小度 AI 眼鏡可以獨立使用也可以搭配 APP，眼鏡內建中文單行，可即時回復使用者的提問。

硬體方面，小度 AI 眼鏡搭載四麥克風陣列辨識聲音，采用開放式防漏音喇叭設計，搭載 1600 萬像素超廣角鏡頭和 AI 防抖演算法；30min 即可充滿電，實作 56 小時待機，超 5 小時連續聆聽；整機重量僅為 45 克，低於行業平均的 49 克。

預計小度 AI 眼鏡將在明年上半年上市銷售，售價尚未公布，不過展台工作人員表示，價格可能在 2000 元左右。

AI 套用的繁榮時期即將到來?

李彥宏在會上談到，在過去 24 個月裏，AI 行業發生了顯著的變化，其中最為突出的是大模型基本消除了幻覺現象。這一變化使得 AI 從最初的「一本正經的胡說八道」變得可用且可信賴。大模型本質上是一個機率模型，其生成的內容具有一定的不確定性。然而，透過采用 RAG 技術，大模型能夠利用檢索到的資訊來指導文本或答案的生成，從而顯著提高了內容的品質和準確性。

為了解決影像生成中的幻覺問題，百度在今年年初開發了一項技術——iRAG（Image based RAG），即檢索增強的文生圖技術。在此之前，完全基於大語言模型的文生圖系統生成的圖片往往品質低劣，甚至邏輯不合常理。百度的 iRAG 技術結合了百度搜尋的億級圖片資源和強大的基礎模型能力，能夠生成各種超真實的圖片，整體效果遠超文生圖原生系統，消除了機器生成的痕跡。

隨著 AI 生成圖片的可用性大幅提高，其套用空間也得到了極大的拓展。例如，在品牌宣傳場景中，以前制作一組海報可能需要投入數十萬元，而現在創作成本幾乎為零。簡而言之，iRAG 的商業價值體現在無幻覺、超真實、低成本和即時可得等方面。

李彥宏在大會現場｜圖片來源：百度

當基礎模型能力成熟時，AI 套用的繁榮時期也即將到來。那麽，AI 套用從何而來，又將走向何方？主要有兩大方向：一是智慧體，二是產業套用。

在未來，或許當 AI 套用的繁榮時期真正到來時，AI 也能真正實作它「產業革命級機會」的使命，為社會經濟帶來生產力的無限擴張。