當前位置: 華文星空 > 心靈

具身智慧需要什麽?一場學術年會的討論給出了一些思考

2025-01-04心靈

作者 | Li Yuan

編輯 | 鄭玄

最近幾個月,中國機器人的進展引起了全世界的關註。

先是 11 月的珠海航展,無人機、無人車、機器狼引起了全球「極客」的討論,就連馬斯克都忍不住轉發無人機蜂群表演並評論載人裝備已經過時;最近幾天,他又點贊了宇樹科技新釋出的 B2-W 機器狗,火遍全網的視訊中,這只中國機器狗各種體操動作、上下坡飛躍不在話下,人們紛紛驚嘆這家成立剛滿八年的中國公司已經超越了波士頓動力。

從「靠開源吃飯」到「遙遙領先」,技術的不斷叠代,讓市場有了態度鮮明的轉變,這似乎也讓我們窺視到了中國機器人賽道彎道超車的可能。

不過,在最近在參加一些專業活動和業界學界進行交流時,筆者總能聽到一些新的共識:機器人的未來,技術決定產業的下限,「場景+需求」是未來的上限。

01

一場挑戰賽看到未來人的期待:

極限猶可突破,至真亦不可止

上周五,美團機器人研究院在深圳舉辦了學術年會。

會上,一個細節讓筆者印象深刻:一支叫做「參與就很棒」的隊伍獲得了一項專業獎。頒獎嘉賓調侃道:「隊伍的名字還是要好好起,說不定獲獎了就要『社死』。」不過,這個名字或許比在場的許多其他隊伍的名字,更貼近比賽的本質。

低空經濟是當前機器人套用的重要領域之一,也是國家重點發展的領域,潛力毋庸置疑。對於無人機的學術研究,尤其是對於有想法的在校生而言,能夠在落地場景驗證想法十分重要,但多數的現實是技術找不到場景去驗證。

透過美團的低空經濟智慧飛行管理挑戰賽,學生們獲得了難得將想法在大範圍場景驗證的嘗試機會——大賽提供美團研發的仿真環境,可模擬多架無人機在城市及無人機機場環境中同步執行。

模擬的基礎,同時也是這家公司搞挑戰賽的底氣,就是近年來的海量投入和套用:比如無人機套用,一個典型的場景來自「低空之城」深圳:今年在深圳,官方統計數據是 1-11 月市內低空無人機載貨飛行 62.6 萬架次,同期美團無人機的數位是送了近 20 萬訂單,飛行架次接近 40 萬架次。不難計算,在深圳的天空,每 3 次送貨飛行,大約會有 2 次需要美團無人機完成,這家公司的飛行總量是其他公司總和的兩倍。

訂單背後意味著數據,在數據獲取難度遠超其他的當下,吸重力不言自明:一場挑戰賽,其實是一次真正的「參與」就很棒的機會。

此次低空經濟挑戰賽議程設定,也十分有趣。整個比賽分成效能賽和創意賽兩大部份:效能賽中參賽隊面對確定地圖環境下的配送場景,物流訂單需求會在地圖上隨機產生。選手開發並送出規劃演算法,高效、安全完成機場地面排程、起降、城市配送任務,並避免碰撞等極端情況。創意賽則鼓勵參賽者設計創新型無人機套用及飛行管理方案,激發技術在前沿場景中的潛力。

王健丞所在的 nROS 團隊是效能賽的獲勝冠軍。

為了獲得效能賽的勝利,nROS 團隊設計出了一張「蒙娜麗莎」拓撲圖。

「我們選用了拓撲圖作為我們的高效的地圖表征方式,並添加了許多功能節點作為交通管理的模組。透過周期推演來計算出了最優的拓撲地圖的降落點的位置。」王健丞介紹道。「為了獲得更高的分數,我們最後的送餐航線是選擇最短路徑,而返航航線選擇的則是較為安全的航線。」

圖片來源:網路

在一次次的演算法最佳化中,nROS 團隊學到了在課本上學不到的許多知識:例如,他們發現無人機進出工作台時,如果路線垂直,協同作業的 AGV 小車會延遲約 4 秒才能進入工作台。基於這一觀察,他們調整了裝貨方式,提高了效率。

「當我們拿到 1 萬分的時候,我們曾以為這就不錯了;後來拿到 13,000 分,我們覺得這可能是極限;再到 15,000 分時,我們幾乎不敢想還能再往前走 。但最終,我們沒有停下腳步,突破了 17,000 分。」 王健丞認為這是他們隊訓「極限猶可突破,至真亦不可止」最好的詮釋。

創意賽的表現同樣精彩,SkyMinds 天馬行空隊 憑借一套面向全流程無人配送場景的系統設計奪冠。

在無人機配送的最後 100 米的難點配送環節,SkyMinds 天馬行空隊使用了團隊自己的雙臂機器人,使用視覺傳感的方法自主導航到使用者的指定地點,使用端到端模仿學習的演算法實作復雜場景的打包操作,並對弱光環境進行了最佳化。這種成熟的方案令人難以相信是由在校生完成的。

「你們為什麽不把線上系統多開三個月?」比賽結束後,這幾乎成為參賽者們的統一呼聲。3 個月的時間讓他們意猶未盡,許多團隊希望能夠有更多機會深入最佳化和測試自己的方案,龐大的真實場景需求,第一次讓技術從生活中來,到生活中去。

為了留住人才,美團機器人研究院自然響應呼聲,從明年的比賽開始,系統開放時間延長至 6 個月。同時,表現優異的隊伍還將獲得參與線下實際飛行操演的機會,進一步檢驗他們的技術在真實場景中的表現。

02

具身智慧,

真正缺的是產業化的場景

當然,如果說年輕人的挑戰賽,比拼的是潛力和想象力,那會上「老炮」們的討論,可能關乎的是當下探索者們發展路徑的選擇。

毋庸諱言,2024 年,機器人領域細分出的具身智慧,已經成為當前科技領域的一個大熱詞。無論是從學術的快速發展,到產業的融資落地,具身智慧都開始表現出極大的潛力。

會上,銀河通用創始人王鶴、星海圖首席科學家趙行、清華大學交叉資訊研究院助理教授吳翼等正在學術和產業交叉領域進行探索的前沿專家,進行了觀點的碰撞。

在一年的產業狂奔後,被問到機器人行業目前最大的卡點是什麽,各位的答案出乎意料地一致:不是機器人本體,不是智慧演算法,而是商業落地,是需求和場景。

正如前文所述,商業落地會帶來真實世界的數據。在人工智慧的賽道上,有真實世界的數據,才能讓演算法更好地叠代,獲得進一步的智慧。

王鶴用了一個很好的對比:「自動駕駛和具身智慧在技術上很接近,但是在商業上,則完全不同。自動駕駛是一個典型的熱啟動。你把車賣出去以後,有使用者替你開。每一個能賣出去車的車企,後續都能獲得海量數據,進一步最佳化自動駕駛演算法。機器人,則完全不同。一個機器人,如果開頭不夠有能力,一開始就沒辦法賣出去,賣出去了因為能力不足,也不會有多少真實場景的數據回傳,那數據和演算法的相互驅動能力就會大大降低,閉環也無法建立。」

圖片來源:網路

如何解決,恐怕要產業和學術界一起努力。

對於學術界而言,實作商業化本身,可能有兩點比較重要:首先是讓機器人先達到一定的可用能力。銀河通用目前正在聚焦於使用合成數據,先讓機器人獲得一定的基礎抓取能力,再進入產業界。星海圖則正在聚焦少樣本的預訓練——做更大規模的預訓練,讓機器人在學習新任務的時候透過三五個樣例,就能獲取新的技能。

第二點,是安全問題。讓機器人部署到人類環境中,與人類共同進步而不產生危害,也是商業化的一個關鍵重點。

「在裝修房子的時候,我們現在都會說給洗碗機留一個空間。什麽時候,我們意識到這個地方需要有個電源留給機器人,大家願意為它留一個改造的空間,人機共生的時代可能才會真正開始。」星海圖首席科學家趙行表示。

產業界的推動也同樣重要。什麽樣的場景,才是機器人能快速落地的場景?

或許是更簡單的場景。吳翼舉了一個我們日常生活中常見的場景——在家找不到東西,給媽媽打電話確認物品位置,最後找到。「這是一個大家看起來稀松平常的事,但是如果機器人要完成的話,首先需要理解比如『東西在白色箱子後面』這個語言在現實世界中意味著什麽。同時它要能夠做到視覺上的空間理解,做到現實中的定位和導航。涉及到人機互動還需要記憶、互動能力、理解、推理,需要自主地知道問出怎樣的問題。」

圖片來源:網路

這並不簡單。

王鶴則直接指出:「現在不用看需求,直接看什麽能做就可以。我認為最快能落地的,就是做粗活。」所謂的做粗活,就是指在環境中導航、移動,抓取、放置。

「這些粗活的場景本身對成功率要求不會極為苛刻——比如自動駕駛目前仍然不能很好地套用,其中一個重要問題是,自動駕駛失敗了,是會撞死人的,但簡單的粗活,則不存在這樣的問題。」王鶴表示。

這樣的場景,剛好在我們的日常生活中就很常見。

「比如很多 24 小時業態的前置倉零售店,需求很大。它的活又很簡單,就是把一個東西從架子上抓下來,然後放在桌子上給快遞員。」王鶴表示,「這就是一個很好的場景。」

王鶴表示,銀河通用已經與一些平台達成合作,明年將在更多場景中,啟動機器人的規模化場景落地。「具身智慧現在的狀態就像 2013 年的新能源汽車。我們的目標是,在五年內實作 1 萬台人形機器人能夠自主在實際場景中工作。」

03

在學術與場景的雙向反哺中,

平台要做橋梁

一場年會,筆者看到了學術獲益於場景的同時,也在反哺場景。這或許就是機器人未來發展的路徑指引。

作為大會的東道主,每年辦一屆學術年會,美團或許也是看到了相同的未來。

據美團機器人研究院秘書長劉碩介紹,美團有很多產業界的同行,也有很多在學術界的合作夥伴。之所以成立機器人研究院,正是希望成為產業界和學術界的橋梁,為機器人科技創新與落地套用提供土壤。

「這其中有兩個意義。第一是產業界有套用場景,可以牽引學術界的定向研發;第二在於透過給學術界提供經費、場景、工程資源,讓學術成果盡快形成產業轉化。」她說。

她還分享了一個來自美團的感悟:美團無人機目前運送了超過 40 萬單的真實客戶訂單,飛行架次接近 100 萬次,已經達到了非常密集的高頻次的飛行。

這樣的成績背後,一部份原因就是「產學研用」合作,推動無人機自主避障的發展。「百萬架次的時候,挑戰場景其實在平常想都想不到的,我們見過風箏、氣球,高樓擦窗的安全繩,我們甚至見過很多好奇的遊客的消費無人機,試圖在拍攝我們自己的無人機等等。如何發現並解決這些邊緣案例?」

除了收集真實場景的數據,美團機器人研究院也在不斷發展仿真技術,並和學術界合作解決問題。

例如,在和清華大學深圳國際研究生院的丁文伯團隊的合作中,雙方就使用了一個 Multi-Game Decision Transformer 的架構,用人工智慧找到無人機飛行的邊緣案例。

「以我們現在的技術能力,一個專業測試團隊,需要用好幾個月的時間,才能找到難倒我們規劃排程系統的兩個難題。但透過人工智慧,找邊緣案例的速度提升了九倍。」劉碩介紹道,「這讓我們能更快地解決一些邊緣案例和疑難場景,更好地保障無人機的飛行。」

在自主智慧的提升下,美團無人機的技術,今年也在國際上得到了認可,首次在海外拿到了第一張在城市場景的無人機送貨的授權證。

圖片來源:網路

以管窺豹,在具身智慧賽道,需求與場景並存的美團,同樣有希望成為學術和場景雙向反哺的橋梁。

畢竟在很多與會者看來,過往觀念裏,機器人的潛力更多被放在工業領域中,視作工廠自動化的主力軍。但在人口紅利逐漸消失的背景下,人們開始希望透過它從事那些危險、重復、高強度的工作。而隨著具身智慧技術的進展,新的場景會更多出現在美團擅長的本地生活、即時配送等領域中。這些有趣有價值的套用,會讓大家的生活品質得到改善和提升,成為真實的市場需求。

「現在的市場,總在擔心機器人的安全和價格,擔心人類失去工作,擔心機器人的倫理道德……但有一天大家在生活當中真的用到了好產品、好服務,可能剩下的只會是一句,『真香』。」一位參會者道出了別樣的「真相」。

*頭圖來 源:視覺中國

本文為極客公園原創文章,轉載請聯系極客君微信 geekparkGO