當前位置: 華文星空 > 財經

記者觀察:大模型逐鹿下半場,超級套用仍未「敲門」

2024-07-08財經

中新經緯7月6日電 (常濤)以按下套用加速鍵為標誌,大模型競爭進入下半場。

在流動互聯網時代,App成為超級套用。在大模型時代,會不會出現新的超級套用?超級套用又可能是什麽?這一問題,或特許以從2024世界人工智能大會(下稱大會)上找到答案。

2024世界人工智能大會7月4日-6日在上海舉行。中新經緯 攝

中新經緯記者在大會展覽館走訪後發現,相比於去年觀眾們普遍關註「大模型能幹什麽」,今年觀眾們對於大模型的關註也漸入「深水區」。「這個圖生影片結果真不真?」「虛擬口語教練以前也有,基於大模型做的有什麽不一樣?」他們在關心,大模型未來將以怎樣的形式影響他們的生活。

類比於使用者透過App享受流動互聯網帶來的便利,各大模型廠商也在積極探索大模型時代「App」。

去年,以ChatGPT、文心一言為代表,大模型「內卷」的主戰場是圖文問答,今年以來,大模型文、圖生成影片受到關註。

大會期間,快手影片生成大模型「可靈」展示了其圖生影片的能力。上傳蒙娜麗莎圖片後,記者輸入「蒙娜麗莎用手戴上眼鏡」文字後,不久後就可生成5秒鐘蒙娜麗莎戴眼鏡的影片,讓名畫中的人物活了起來。

7月6日,可靈AI網頁端上線,可靈AI基礎模型也迎來升級,推出更加清晰的高畫質版,以及首尾幀控制、鏡頭控制等全新編輯能力,同時,創作者單次生成的文生影片時長增加至10秒。

與人進行即時、準確互動,也是目前大模型在套用側瞄準的場景。

7月5日,商湯科技釋出了所見即所得模型「日日新5o」,帶來一種全新的AI互動模式,即即時的流式多模態互動。

比如對著它隨手畫一只小兔子,「日日新5o」能很快辨識「這是一只可愛的兔子」,工作人員又畫了一個微笑表情,它從這個平靜的表情中捕捉到了笑意,工作人員又改了一筆把嘴巴畫大增添了舌頭,「日日新5o」看到後立馬說道「這表情開心多了」。

據商湯科技介紹,它就如同真人聊天一樣在交流對話,這種互動模式特別適用於即時對話和語音辨識等套用。

在大會展覽館,隨處可見的還有基於大模型的各種數碼人,這也有可能是大模型時代的超級套用。

騰訊展示了基於優圖實驗室自研演算法打造的有智能、有形象、可互動的「數智分身」,其中在醫療行業數智人展台,騰訊把AI技術充分融入就診全流程,在診前為患者提供智能導診、預問診;在診中模擬醫生形象,提供即時互動,實作線上問診;在診後為患者提供合理的用藥提醒和智能隨訪。

今年「618」期間,京東發起了一場特殊的「總裁數碼人直播」活動,多位企業創始人或CEO透過京東雲言犀化身數碼人下場直播。

京東雲言犀相關負責人在大會期間接受中新經緯采訪時說,大模型的顛覆性套用,不可能從通用大模型的最佳化中產生,必然是技術進步與產業積累的結合,數碼人可能成為AI時代的顛覆性產品。團隊在京東「618」的數碼人直播中,發現觀眾接受程度很高:不僅已經跨過了「恐怖谷」效應,而且人均觀看時長接近2分鐘。這意味著大部份觀眾已普遍接受了數碼人主播。

「618期間數碼人直播時長超40萬小時,觀看人次超1億、互動超500萬次,這給了我們很大的信心。」上述負責人說。

不過,在討論大模型時代的超級套用是什麽時,也不要忽視硬件,硬件本身就是最直接的套用。

大會期間,有些廠商也展示了一批裝配了大模型的硬件產品。例如,聯想AI PC中的「天禧」個人大模型,是基於阿裏通義千問等通用大模型打造;有道詞典筆X7內建了子曰教育大模型的兩大原生套用——虛擬人口語私教Hi Echo和AI全科家庭教師小P老師;小米旗下的人工智能助手「小愛同學」與阿裏雲通義大模型展開合作,強化其在圖片生成、圖片理解等方面的多模態 AI 生成能力,並在小米汽車、手機等多類器材落地。

在各廠商積極探索大模型時代的超級套用可能是什麽時,與會企業負責人也給出了一些前沿的思考。

對於未來的AI套用長啥樣,百度創始人李彥宏最看好的方向是智能體,因為「開發最簡單」。

李彥宏表示,隨著基礎模型的日益強大,開發套用也越來越簡單,其中,最簡單的就是智能體,只要用「人話」把工作流說清楚,再配以專有知識庫,即可做出一個很有價值的智能體,「比互聯網時代制作一個網頁還簡單」。

李彥宏認為,醫療、教育、金融、制造、交通、農業等各領域,未來都會依據自己的場景和特有經驗、規則、數據等,做出各種智能體,將會出現數百萬量級的智能體,形成龐大生態。

螞蟻集團董事長兼CEO井賢棟持相似觀點。他認為,為了破解通用大模型落地嚴謹產業面臨的三個「能力短板」,即領域知識相對缺乏、復雜決策難以勝任、對話互動不等於有效協同,螞蟻選擇了構建專業智能體生態的路徑,「從我們的實踐來看,專業智能體是大模型落地嚴謹產業的有效路徑。」

井賢棟還指出,未來智能化的使用者體驗,一定不是只靠一個大模型,而是需要全行業深度協作,需要很多的專業智能體共同參與、各司其職。

對於智能體,騰訊雲副總裁、騰訊雲智能負責人、騰訊優圖實驗室負責人吳運聲表示,智能體的本質回歸了大語言模型的初衷——人類輸入不精確的自然語言,大模型能夠用統一的方式去應對,而智能體提供的正是端對端的解決方法。吳運聲說:「這是一種可以解決廣泛問題的技術路線,所以業界對智能體的研究非常多。」

獵戶星空董事長傅盛表示,人工智能的套用是核心,套用就是真正幫助人們解決各種實際問題、以各種AI技術為底層的App、硬件、軟件。「只靠使用者和大模型去聊天,並不能解決我們的大多數問題,這就是為什麽所有人都在談套用。」

在7月5日舉辦的騰訊論壇上,騰訊集團副總裁蔣傑在發言時表示,套用場景是未來大模型決戰的必然戰場。但當前大模型的落地主要集中在生產工具和提效方面,距離真正的業務創新還有一定距離,缺少殺手級的套用。

(更多報道線索,請聯系本文作者常濤: [email protected] )(中新經緯APP)

(文中觀點僅供參考,不構成投資建議,投資有風險,入市需謹慎。)

中新經緯版權所有,未經書面授權,任何單位及個人不得轉載、摘編或以其他方式使用。