當前位置: 華文星空 > 知識

王者絕悟:一顆通用人工智慧的種子

2021-07-12知識

作者 鐘文

7月8日下午,2021世界人工智慧大會的展區裏舉行了一場「特殊」的王者榮耀表演賽:比賽的一方是職業人氣選手,另一方則是王者榮耀與騰訊AI Lab在遊戲場景下研究的成果,策略協作型AI王者絕悟。

王者絕悟隊伍的5位英雄,走位風騷、技能精準,做到了真正意義上的「順風不浪、逆風不慫」,完美預判了對方的預判。騰訊公司董事會主席、執行長馬化騰在開幕式中預告這場比賽時,用的形容詞是「最高水平的AI競技」。不過,這並不是從電競的層面來說,而是從技術的層面來說 —— 王者絕悟,已經達到了全英雄職業電競水平。

那麽,王者絕悟到底是什麽,它到底有什麽價值,值得騰訊大力支持?

一顆「技術」的種子

2019年,王者絕悟團隊在接受采訪時表示:和業內所有研究機構一樣,他們追求的目標都是「通用人工智慧」。

這是一個近乎「科幻」般的追求,因為要實作「通用人工智慧」並不是一件易事。畢竟,真正理想化的通用人工智慧,不僅需要有堪比人類的智力水平,而且需要具備能夠同時協調處理多件任務的成熟技術。

值得驚喜的是,從早期的深藍,到16年名聲大振的AlphaGo,再到2021年世界人工智慧大會上的王者絕悟,很明顯地發現,在任務處理的技術層面,人們正在朝著理想化的方向行進:從「單體智慧」,逐漸過渡到了王者絕悟這種擁有更前沿創新價值以及套用價值的「多智慧體」。

「多智慧體」的研究並不簡單。騰訊互動娛樂天美L1工作室總經理、王者榮耀執行制作人黃藍梟曾表示,環境的不確定性、獲取資訊的局限性、個體目標與全域目標一致性的差異、高算力要求等原因,是如今研究「多智慧體」技術上面臨的挑戰。

因此,王者絕悟的出現,就顯得尤為關鍵。

一方面,王者榮耀這種多人競技策略遊戲,解決了「多智慧體」研究場景缺失的問題。在遊戲場景內,英雄選擇、技能套用、路徑探索、團隊戰略…預計有高達 10 的 20000 次方種操作可能性,AI需要在不透明、高度復雜的環境下快速做出決策。這是一個極佳的,模擬現實環境,甚至比現實環境還要復雜的「技術培養皿」。

另一方面,從結果導向上來說,王者絕悟的「多智慧體」研究成果,是可以遷移、套用到其他遊戲,甚至是現實套用場景中的。因為,所謂的「多智慧體」,研究的是參與物件的決策與行動,環境的變量是動態的。只要參與物件夠「聰明」,那麽就能夠根據環境變化,即時作出反應。

以當下火熱的自動駕駛為例,引入多智慧體的概念之前,傳統的自動駕駛系統將所有「其他車輛」和裝置視作敵對者,這在很大程度上降低了行駛效率。當所有汽車被納入到多智慧體生態中後,大家被允許協調地擦肩而過,進而才能形成真正有效率的「智慧交通」。

甚至,在社會場景下,王者絕悟背後的「多智慧體」還能透過模擬社會中人和動物的決策,來達到一個預測的效果,在區域經濟、劃分城市群等方面起到關鍵性作用。

所以說,王者絕悟的科研價值與未來潛力,並不是我們眼中看到的「戰勝職業人氣選手」那麽簡單。對於整個通用人工智慧的發展而言,王者絕悟更像是一顆在培育著「技術」的種子,一張沒有刮開的彩票。

技術的發芽

如今,王者絕悟其實已經取得了相當不錯的成績。

在技術的成長上,它經歷了監督學習、深度強化學習,以及進一步參照了多輪組合賽局和層次化的強化學習演算法等等,在王者榮耀場景內已經成為了一個所向披靡的「戰將」。

而在套用層面,王者絕悟對遊戲和整個電競行業的價值是直白且明顯的:在數值平衡性測試中,王者榮耀的數值平衡性調整偏差從1.05%,降低到了0.68%,相對縮小35%,保證了英雄不會存在大規模超模的情況,進一步提升遊戲品質與玩家體驗;

而對整個電競行業來說,王者絕悟還能夠為職業選手提供數據、戰略與協作類實分時析與建議,以及不同強度與不同級別的專業陪練,最佳化電競訓練模式,進而促進電競專業化的發展。

但是,正如上文所言,「王者絕悟」追求的終極目標,是 「通用人工智慧」。這也就決定了,其價值並不僅僅局限在遊戲、或者電競層面,而是對整個通用人工智慧行程上的推動作用。

其一,王者絕悟的研究方向,是符合整體通用人工智慧前進趨勢的。前幾年人工智慧的研究熱點還圍繞著「感知智慧」。但是,隨著神經網路的技術突破,「感知智慧」已經日趨成熟,因此越來越多的研究者開始關註「智慧決策」,從AlphaGo的單體決策,到如今王者絕悟的群體決策。

換言之,只要是在這個趨勢上持續深耕,那麽路徑上的任何一個技術突破點,都有可能加快通用人工智慧的整體研究行程。

畢竟,幾十年來,遊戲一直是人工智慧領域研究的重點,是邁向更廣泛套用的基石。像王者榮耀這類多人競技性的戰略遊戲,由於具有賽局理論性強和涉及領域復雜的特點,更適合用於人工智慧的技術研究。業界有一種說法:「下一個 AI 裏程碑,可能會在復雜策略遊戲中誕生」。

因此,在通用人工智慧技術突破的探索上,王者榮耀這塊試驗田的價值,以及王者絕悟的研究必要性不言而喻。

其二,王者絕悟所最追求的,並非單一領域的「專才」研究,而是更大範圍的「通才」研究。

如今行業裏看到的,或者是常常討論到的套用人工智慧,大多是針對於某一個具體領域的研究,比如說機器視覺、語音智慧等等。這種專一的人工智慧領域,是實作商業化的最快路徑。比如,語音辨識能夠快速套用到智慧音箱中,智慧導航也能夠植入到掃地機器人裏,從而標出更高的賣價。

但是,所謂的通用人工智慧,指的讓機器像人一樣思考,像人一樣能夠結合周圍情況,從而進行決策和行動,從事多種工作。這就意味著,通用人工智慧註重的不應局限在單一的套用領域。這樣的研究,是需要持續的投入、測試,並且很可能需要拋棄階段性商業收益的。

而回看王者絕悟幾年來的舉措,便能發現短期收益並非是其追求;長線的技術壁壘突破和更大範圍的落地測試、技術提升才是其所向往的目標。

據騰訊AI Lab高級研究員、王者絕悟AI模型負責人邱福浩介紹,如今王者絕悟擁有了可遷移性,可以套用於足球、FPS、RTS遊戲,並且都達到了國際領先水平。這就意味著,王者絕悟,或者說底層的技術擁有了更多的實驗田,以及更豐富的測試數據與技術沈澱。

另一方面,作為國民數位IP,王者榮耀也在主動承擔科技責任,與騰訊AI Lab一同打造了人工智慧研究平台「開悟」,開放數據與技術資源,並且聯合高校、研究機構,探索「開悟」在多智慧體人工智慧研究技術教學和科研領域的可能性,讓更多相關領域的人士和學者一同參與到推動通用人工智慧發展的研究上來。

王者絕悟這種長遠性的目光,以及王者榮耀本身的開放態度與舉措,無疑在通用人工智慧行程上是一大助力。

寫在最後

現階段,逼近人類大腦的「通用人工智慧」也許仍是一個構想,即便有科學家預測其能夠在二三十年間出現,想必也不會像電影裏那樣唯美。

在這個過程中,與其將王者絕悟定義為人們解決通用AI挑戰的一個裏程碑,倒不如說王者絕悟給通用人工智慧的發展提供了一個更有價值的行進思路 —— "AI+遊戲"。利用王者榮耀這塊絕佳的技術實驗田,積極聯動產學研各方,儲備人才與技術資源,深耕底層技術發展,埋下未來有可能會「智慧爆炸」,實作自我升級、自我前進演化的通用人工智慧的種子。

數據積累和技術革新,最後會讓一個成熟的大腦走出培養皿,走出電子世界,走向菜市場或寫字樓,讓所有人獲益。

在遊戲【底特律變人】中描繪了這樣一個場景:未來,每個人家庭裏都有一個AI助手,她能夠幫你處理家務、陪伴孩子、像人類一樣無障礙的溝通,甚至能夠借助數據分析,聰明到幫助人類調查刑事案件。

這種對通用人工智慧的更具體、更現實的想象,也許就是黃藍梟心裏所期待的,那個「令人神往的數位未來」。

· 文章版權歸品玩所有,未經授權不得轉載。