記者觀察：大模型逐鹿下半場，超級套用仍未「敲門」

2024-07-08財經

中新經緯7月6日電 (常濤)以按下套用加速鍵為標誌，大模型競爭進入下半場。

在流動互聯網時代，App成為超級套用。在大模型時代，會不會出現新的超級套用？超級套用又可能是什麽？這一問題，或特許以從2024世界人工智能大會(下稱大會)上找到答案。

2024世界人工智能大會7月4日-6日在上海舉行。中新經緯攝

中新經緯記者在大會展覽館走訪後發現，相比於去年觀眾們普遍關註「大模型能幹什麽」，今年觀眾們對於大模型的關註也漸入「深水區」。「這個圖生影片結果真不真？」「虛擬口語教練以前也有，基於大模型做的有什麽不一樣？」他們在關心，大模型未來將以怎樣的形式影響他們的生活。

類比於使用者透過App享受流動互聯網帶來的便利，各大模型廠商也在積極探索大模型時代「App」。

去年，以ChatGPT、文心一言為代表，大模型「內卷」的主戰場是圖文問答，今年以來，大模型文、圖生成影片受到關註。

大會期間，快手影片生成大模型「可靈」展示了其圖生影片的能力。上傳蒙娜麗莎圖片後，記者輸入「蒙娜麗莎用手戴上眼鏡」文字後，不久後就可生成5秒鐘蒙娜麗莎戴眼鏡的影片，讓名畫中的人物活了起來。

7月6日，可靈AI網頁端上線，可靈AI基礎模型也迎來升級，推出更加清晰的高畫質版，以及首尾幀控制、鏡頭控制等全新編輯能力，同時，創作者單次生成的文生影片時長增加至10秒。

與人進行即時、準確互動，也是目前大模型在套用側瞄準的場景。

7月5日，商湯科技釋出了所見即所得模型「日日新5o」，帶來一種全新的AI互動模式，即即時的流式多模態互動。

比如對著它隨手畫一只小兔子，「日日新5o」能很快辨識「這是一只可愛的兔子」，工作人員又畫了一個微笑表情，它從這個平靜的表情中捕捉到了笑意，工作人員又改了一筆把嘴巴畫大增添了舌頭，「日日新5o」看到後立馬說道「這表情開心多了」。

據商湯科技介紹，它就如同真人聊天一樣在交流對話，這種互動模式特別適用於即時對話和語音辨識等套用。

在大會展覽館，隨處可見的還有基於大模型的各種數碼人，這也有可能是大模型時代的超級套用。

騰訊展示了基於優圖實驗室自研演算法打造的有智能、有形象、可互動的「數智分身」，其中在醫療行業數智人展台，騰訊把AI技術充分融入就診全流程，在診前為患者提供智能導診、預問診；在診中模擬醫生形象，提供即時互動，實作線上問診；在診後為患者提供合理的用藥提醒和智能隨訪。

今年「618」期間，京東發起了一場特殊的「總裁數碼人直播」活動，多位企業創始人或CEO透過京東雲言犀化身數碼人下場直播。

京東雲言犀相關負責人在大會期間接受中新經緯采訪時說，大模型的顛覆性套用，不可能從通用大模型的最佳化中產生，必然是技術進步與產業積累的結合，數碼人可能成為AI時代的顛覆性產品。團隊在京東「618」的數碼人直播中，發現觀眾接受程度很高：不僅已經跨過了「恐怖谷」效應，而且人均觀看時長接近2分鐘。這意味著大部份觀眾已普遍接受了數碼人主播。

「618期間數碼人直播時長超40萬小時，觀看人次超1億、互動超500萬次，這給了我們很大的信心。」上述負責人說。

不過，在討論大模型時代的超級套用是什麽時，也不要忽視硬件，硬件本身就是最直接的套用。

大會期間，有些廠商也展示了一批裝配了大模型的硬件產品。例如，聯想AI PC中的「天禧」個人大模型，是基於阿裏通義千問等通用大模型打造；有道詞典筆X7內建了子曰教育大模型的兩大原生套用——虛擬人口語私教Hi Echo和AI全科家庭教師小P老師；小米旗下的人工智能助手「小愛同學」與阿裏雲通義大模型展開合作，強化其在圖片生成、圖片理解等方面的多模態 AI 生成能力，並在小米汽車、手機等多類器材落地。

在各廠商積極探索大模型時代的超級套用可能是什麽時，與會企業負責人也給出了一些前沿的思考。

對於未來的AI套用長啥樣，百度創始人李彥宏最看好的方向是智能體，因為「開發最簡單」。

李彥宏表示，隨著基礎模型的日益強大，開發套用也越來越簡單，其中，最簡單的就是智能體，只要用「人話」把工作流說清楚，再配以專有知識庫，即可做出一個很有價值的智能體，「比互聯網時代制作一個網頁還簡單」。

李彥宏認為，醫療、教育、金融、制造、交通、農業等各領域，未來都會依據自己的場景和特有經驗、規則、數據等，做出各種智能體，將會出現數百萬量級的智能體，形成龐大生態。

螞蟻集團董事長兼CEO井賢棟持相似觀點。他認為，為了破解通用大模型落地嚴謹產業面臨的三個「能力短板」，即領域知識相對缺乏、復雜決策難以勝任、對話互動不等於有效協同，螞蟻選擇了構建專業智能體生態的路徑，「從我們的實踐來看，專業智能體是大模型落地嚴謹產業的有效路徑。」

井賢棟還指出，未來智能化的使用者體驗，一定不是只靠一個大模型，而是需要全行業深度協作，需要很多的專業智能體共同參與、各司其職。

對於智能體，騰訊雲副總裁、騰訊雲智能負責人、騰訊優圖實驗室負責人吳運聲表示，智能體的本質回歸了大語言模型的初衷——人類輸入不精確的自然語言，大模型能夠用統一的方式去應對，而智能體提供的正是端對端的解決方法。吳運聲說：「這是一種可以解決廣泛問題的技術路線，所以業界對智能體的研究非常多。」

獵戶星空董事長傅盛表示，人工智能的套用是核心，套用就是真正幫助人們解決各種實際問題、以各種AI技術為底層的App、硬件、軟件。「只靠使用者和大模型去聊天，並不能解決我們的大多數問題，這就是為什麽所有人都在談套用。」

在7月5日舉辦的騰訊論壇上，騰訊集團副總裁蔣傑在發言時表示，套用場景是未來大模型決戰的必然戰場。但當前大模型的落地主要集中在生產工具和提效方面，距離真正的業務創新還有一定距離，缺少殺手級的套用。

(更多報道線索，請聯系本文作者常濤： [email protected] )(中新經緯APP)

(文中觀點僅供參考，不構成投資建議，投資有風險，入市需謹慎。)