當前位置: 華文星空 > 心靈

AI 時代,套用創造世界?

2024-11-16心靈

AI 套用時代,真的來了嗎?

今年的百度世界大會主題是「套用來了」——截至 11 月初,百度文心大模型的日均呼叫量已經超過 15 億,相較一年前首次披露的 5000 萬次,增長約 30 倍。李彥宏表示,「這條陡峭的增長曲線,代表著過去兩年中國大模型套用的爆發。」

而智能體作為 AI 套用的最主流形態,即將迎來爆發點,李彥宏強調,「它將成為 AI 原生時代,內容、資訊和服務的新載體。」

這是因為,「一方面,做智能體的門檻足夠低;另一方面,智能體的天花板又足夠的高,可以做出功能非常強大的套用。多個智能體的協作,還可以解決更加復雜的問題。」

李彥宏在會上展示了 4 種不同類別的智能體,包括公司類智能體,角色類智能體,工具類智能體和行業類智能體。其中,公司官方智能體很可能替代官網,成為最直接面向消費者的界面。

「公司類智能體相當於 AI 時代的公司官網。傳統官網具有的那些能力,比如公司介紹、產品圖片和參數展示、線下門店位置等等,公司類智能體都有。而傳統網站沒有的主動推薦、及時響應和一對一服務能力,公司智能體也有。」

李彥宏還釋出了無程式碼工具「秒噠」——一個由大模型和智能體組成的、不需要寫程式碼就能夠實作任意想法的軟件,包括無程式碼編程、多智能體協作以及規模化地呼叫各種工具等能力,是「迄今為止人類歷史上最復雜的多智能體協作工具」。

借助「秒噠」,使用者可以透過自然語言互動完成整套系統的搭建,還可以做任意場景下的各種套用,隨著基礎模型能力提升,以及秒噠本身技術能力的演進,未來可以做更多、更復雜的事情,「這意味著,你不需要去招募專案經理、設計人員、開發人員、測試人員等等,自己就可以指揮多個智能體來協同完成任務」,一個人可以是一整支隊伍。

用李彥宏的話來說,有了秒噠,將迎來一個「只靠想法就能賺錢的時代」。

文庫與網盤融合:更自由地創作

繼 9 月百度網盤的 C 端業務重新劃歸移動生態事業群組(MEG),並由百度副總裁、百度文庫&百度網盤負責人王穎接手管理後,在本次世界大會上,百度網盤和文庫又有了進一步融合。

王穎在大會上分享了百度在內容生產和消費方面的一些新變革。她談到,當前內容創作和消費面臨諸多挑戰,如工具繁雜、制作周期長和消費效率低。為此,百度文庫和網盤引入了 AI 技術,旨在打破工具束縛和模態邊界,實作更自由、高效的內容體驗。

百度文庫推出的智能 PPT 生成、AI 論文創作、AI 畫本制作、AI 搜尋能力和 AI 小說漫畫生成等功能顯著提升了內容生產的效率和質素;同時,在內容消費方面,百度網盤推出了簡單掃描、簡單聽記和 AI 影片摘要等工具,極大地方便了使用者處理和理解資訊。

具體來看,在辦公場景中,百度文庫提供了智能 PPT 和智能研報功能,百度網盤則具備簡單聽記等功能;在學習場景下,使用者可以使用百度文庫的智能畫本和拍圖搜題功能,百度網盤則提供影片解讀和盤盤單詞等輔助學習工具;在娛樂方面,百度文庫提供智能小說和智能漫畫,百度網盤則具備 AI 修圖等功能。百度文庫與網盤的融合拓寬了使用者的套用場景,實作了內容的智能化和多樣化,進一步提升了使用者體驗。

自由畫布功能|圖片來源:百度

此外,百度文庫與網盤聯合推出了全新的內容作業系統——自由畫布。這一系統可以幫使用者完成從找資料、到編輯、再到生成和分享的全部任務,不僅支持全格式輸入和多種模態的輸出,還能實作元素級別的內容利用,豐富了創作和分享的自由度。

用李彥宏的話說,「自由畫布就是一個由文心多模態大模型加持的萬能白板」。這些創新不僅展示了 AI 技術在內容領域的巨大潛力,也預示著內容生產和消費未來有更多可能性。

智能雲:從技術變革走向產業變革

在大會上,百度集團執行副總裁、百度智能雲事業群總裁沈抖分享了百度智能雲在大模型和 AI 原生套用方面的最新進展。沈抖稱,大模型技術正在從技術變革走向產業變革,重新定義人與數碼世界及物理世界的互動方式,成為企業提升競爭力的關鍵要素。

沈抖重點談到了千帆平台,這是一個大模型精調和套用開發的平台,提供豐富的工具鏈,顯著降低了 AI 原生套用開發的門檻。千帆平台不僅滿足了企業級套用的高度可客製化、大規模、高可用性和高安全性需求,還釋出了工作流 Agent。這一創新利用大模型的意圖理解和泛化能力,將復雜的工作流程變成靈活的智能體,大幅提升企業效率。例如,太平洋保險利用千帆平台生成「金牌銷售」智能體,顯著提升了車險續保的服務效率和使用者體驗。

百度智能雲千帆|圖片來源:百度

此外,百舸平台提供高效的大模型相關算力服務,從集群建立到模型訓練和推理,確保穩定、極速的效能。該平台解決了大規模集群部署中的關鍵難題,支持高效執行,滿足不同客戶的算力需求。

沈抖還展示了千帆平台在多個行業中的套用案例,包括全診醫學透過精調模型提升病歷生成準確度,節省醫生時間;國家電網基於文心大模型探索電力行業的 AI 套用,取得顯著成果。此外,曦靈 4.0 平台的升級使其能夠生成 3D 數碼人形象並制作專業影片,大幅降低了短影片制作成本。

百度智能雲透過千帆和百舸平台,構建了新型 AI 基礎設施,推動了大模型技術在各行各業的套用,以提升企業的智能化水平糊效率。

小度 AI 眼鏡:首搭中文大模型

除了套用,百度這次在硬件上也有所釋出。在會上,百度集團副總裁、小度科技 CEO 李瑩釋出了「首款搭載中文大模型的原生 AI 眼鏡」——小度 AI 眼鏡。

小度AI眼鏡|圖片來源:百度

李瑩稱,AI 眼鏡作為人類的第一視角器材,其捕捉視覺、聲音、位置等資訊的能力,將給人們帶來前所未有的感官延伸,也一定會成為更高效、便捷的人機互動入口。

基於文心大模型和 DuerOS AI 原生作業系統,小度 AI 可實作備第一視角拍攝、邊走邊問、卡路裏辨識、識物百科、視聽轉譯、智能備忘等功能。

透過端雲結合大模型,小度 AI 眼鏡可以獨立使用也可以搭配 APP,眼鏡內建中文單行,可即時回復使用者的提問。

硬件方面,小度 AI 眼鏡搭載四麥克風陣列辨識聲音,采用開放式防漏音喇叭設計,搭載 1600 萬像素超廣角鏡頭和 AI 防抖演算法;30min 即可充滿電,實作 56 小時待機,超 5 小時連續聆聽;整機重量僅為 45 克,低於行業平均的 49 克。

預計小度 AI 眼鏡將在明年上半年上市銷售,售價尚未公布,不過展台工作人員表示,價格可能在 2000 元左右。

AI 套用的繁榮時期即將到來?

李彥宏在會上談到,在過去 24 個月裏,AI 行業發生了顯著的變化,其中最為突出的是大模型基本消除了幻覺現象。這一變化使得 AI 從最初的「一本正經的胡說八道」變得可用且可信賴。大模型本質上是一個概率模型,其生成的內容具有一定的不確定性。然而,透過采用 RAG 技術,大模型能夠利用檢索到的資訊來指導文本或答案的生成,從而顯著提高了內容的質素和準確性。

為了解決影像生成中的幻覺問題,百度在今年年初開發了一項技術——iRAG(Image based RAG),即檢索增強的文生圖技術。在此之前,完全基於大語言模型的文生圖系統生成的圖片往往質素低劣,甚至邏輯不合常理。百度的 iRAG 技術結合了百度搜尋的億級圖片資源和強大的基礎模型能力,能夠生成各種超真實的圖片,整體效果遠超文生圖原生系統,消除了機器生成的痕跡。

隨著 AI 生成圖片的可用性大幅提高,其套用空間也得到了極大的拓展。例如,在品牌宣傳場景中,以前制作一組海報可能需要投入數十萬元,而現在創作成本幾乎為零。簡而言之,iRAG 的商業價值體現在無幻覺、超真實、低成本和即時可得等方面。

李彥宏在大會現場|圖片來源:百度

當基礎模型能力成熟時,AI 套用的繁榮時期也即將到來。那麽,AI 套用從何而來,又將走向何方?主要有兩大方向:一是智能體,二是產業套用。

在未來,或許當 AI 套用的繁榮時期真正到來時,AI 也能真正實作它「產業革命級機會」的使命,為社會經濟帶來生產力的無限擴張。