當前位置: 華文星空 > 汽車

在阿裏巴巴「死磕」自動駕駛的AI科學家

2022-01-13汽車

9 月 27 日,阿裏宣布小蠻驢累計配送訂單超過 100 萬單,並表示將啟動自動駕駛卡車研發。

長久以來,這家互聯網巨頭常以自動駕駛「投資者」的身份示人,但關於阿裏自身在自動駕駛方面的踐行以及其背後的靈魂人物王剛,外界所知甚少。

王剛,阿裏集團副總裁、達摩院自動駕駛實驗室負責人,先後師從人工智慧領域頂級學者 Li Fei-Fei(李飛飛)和 David Forsyth。2016 年獲新加坡南洋理工大學終身教職。

近日,雷鋒網與王剛展開了一場對話,試圖描繪完整王剛以及阿裏自動駕駛鮮為人知的故事。

--

2017 年,王剛放棄新加坡南洋理工大學的終身教職,毅然決定從學術界邁入工業界。

阿裏,是他的第一站,這一紮下去,就是五年。

他說,自己喜歡聚焦、認準了就磕到底,不會既要、又要還要。

相比起「科學家」陽春白雪的人設,王剛身上確實透露著一股「重慶娃」的闖勁兒。

進入阿裏後,王剛作為技術負責人,與阿裏人工智慧實驗室(AI Lab)團隊一起將天貓精靈從 Demo 打造成產品。4 個月時間就成了出貨百萬規模的爆款。

而後,他又揮一揮衣袖,走了一條看似跨度極大、難度極高的路——從 0 到 1 做自動駕駛。

也因如此,阿裏的自動駕駛故事正式按下了啟動鍵。

一切都是命中註定

故事,要從 15 年前說起。

當時,王剛就讀於哈工大電子資訊與工程學院。盡管他一直對影像處理感興趣,但他從來也不會想到,自己與人工智慧結緣的方式竟然源於對一篇論文的思考。

作為非科班出身的王剛,此前已對影像處理做了不少研究,而他也比同級人更早開始關註學術界論文。

大四的某一天,人工智慧頂會CVPR中的一篇論文提到的方法與王剛的想法不謀而合,於是,他給論文作者寫了一封信,此後二者的交流越來越多,而這也成了一張開往新世界的船票,載著王剛漂洋過海來到了人工智慧領域。

2005 年,王剛從哈工大電子與資訊工程學院畢業,進入美國伊利諾大學香檳分校( UIUC )深造,並跟隨導師在電腦視覺方向上做了不少前沿研究。

UIUC 有著全球領先的電腦專業,電腦視覺之父 Thomas S. Huang 曾在這裏任教、圖靈獎唯一華人獲得者姚期智也曾在這裏求學。

至此,王剛才算是真正跨進了人工智慧領域的大門,一切都仿佛命中註定般順利。

但王剛發現,當時在 UIUC 乃至是整個人工智慧圈,很多學生做研究喜歡「刷榜」,特別在意各大賽事最後的結果。

他也清晰地意識到,頂級學者學術理念則有一個很大的共同點,就是會更關註本質問題。

於是,關註事物本身、挖掘事物背後的本質,是王剛求學以及工作期間最註重的。即便是在離開學校多年後的今天亦是如此。

在阿裏做自動駕駛,王剛一直在強調 AI 技術的本質就是更好地構建一個數據驅動系統,也就是他所理解的「第一性原理」。

在與雷鋒網交流的過程中,他一共提到了十七次「本質」、十六次「第一性原理」,邏輯縝密嚴謹。

尋找技術與生活的連線點

在自身積累了足夠紮實的科研基礎後,王剛於 2010 年開啟了一段新的旅程——入職新加坡南洋理工大學(NTU),組建了自己的研究團隊。

這一年他只有 28 歲,發表頂會論文近 10 篇,論文參照量過千。

那時,AI 圈還沒進入深度學習論文的大水漫灌時代,王剛的這份成績在青年學者當中已可圈可點。

隨著時間的推移,浸泡在新加坡 AI 圈的王剛逐漸感受到,這裏與美國的學術氛圍以及學術套用有著明顯的差異。他進一步向解釋說:

「在美國就是,兩耳不聞窗外事,一心唯讀聖賢書;包括我的導師也不太關心這些套用,更多關註的是解決 fundamental 的學術問題。但新加坡的大環境更強調與工業界結合。」

也正是在 NTU 任職的這段時間,王剛與工業界的聯系開始多了起來。

據了解,基於電腦視覺和深度學習兩大主線,他帶領團隊開發了各種 AI 技術套用,範圍覆蓋了服裝、駕駛、醫藥、安保等多個主流領域,並且將一些技術轉讓給了商業公司。

其中,他們在 2011 年研發了一個服裝檢索自動系統,是比淘寶拍立淘更早的圖搜套用;他們也曾推出過一個 3D 人類行為標準數據集 NTU rgb+d,後為學術界和工業界所用。

不僅如此,王剛還曾聯合創立了一家名為 I3 Precision 的公司,並親自出任 CTO,希望透過技術的手段來提高藥物驗證的效率。

遺憾的是,這些計畫受限於套用場景等各種原因,當時並沒有給市場帶來變革性的影響。

不過基於此類實踐,王剛也逐漸塑造一套關於「套用」的清晰認知,為其後來將能力輸出給工業界、尋找技術與生活的連線點,打下了基礎。

對此,王剛告訴雷鋒網,學術研究是百花齊放的:有人數十年磨一劍,為了科研理想甘坐冷板凳。

就像神經網路教父 Geoffrey Hinton,曾在一場長達 10 余年的電腦科學學術之爭中不占上風,有關神經網路的論文也常常被學術期刊拒收。但 Geoffrey Hinton 最終證明了自己是對的。

在此之外,同樣也要有人去關註 AI 技術的套用問題——王剛認為,自己就是一個偏向套用型的學者。

而且,相比起「科學家」,王剛更願意將自己定義為「工程師」。

在他看來,科學家要去發現新的規律、創造新的知識、構建新的準則;而工程師則是以產品的形態,讓準則能夠 work 起來。

經過多年的研究積累,王剛心中的準則已非常明確:

在如今的電腦架構下,AI 想要實作長足的發展就必須把數據驅動做好;如果沒有足夠多的養料,科學家也很難發現新的規律去推動 AI 進步。

那麽,數據從何而來?

從產品出發,或許不失為一條好路子。

2016 年,王剛獲得南洋理工大學終身教職。但僅僅在一年後,他就毅然離開了新加坡,舉家回國,從學術界邁入了產業界。

其實,對王剛關於技術套用的思考進行一番了解後,他放棄體面而穩定的高校工作也就沒有那麽難理解了。

尤其現在身處中國的人工智慧圈,王剛更加堅定了要走產業落地路線的決心。

他向雷鋒網透露,從美國、新加坡、到中國,越往東越強調產學研,國內一些教授的晉升評獎也會將工業界的成果作為參考指標。

「很多人吐槽我們太功利、不註重深層次的研究,其實不然。因為每個國家的國情不一樣,中國更註重產學研的結合,做好套用再做深也是一種途徑。」

在王剛看來,現階段只有先做到從無到有、才能慢慢再做到深、再做到優,這樣更符合發展規律。

做產品,最重要的是思維問題

阿裏,是王剛在工業界的第一個落腳點。

關於在工業界的去向,他曾給自己定下兩個基本點:

一是自己要做繼續做 AI 研究;二是團隊的 Leader 要懂業務,而不是只懂研究。

2017 年 3 月,阿裏啟動了一項代號為 NASA 的計劃,將面向機器學習、智慧芯片、生物辨識等前沿技術元件全新的團隊,並動員全球兩萬多名科學家和工程師投身新技術戰略;王剛正是其中的一員。

看起來,阿裏非常契合王剛的需求。而且阿裏是一個足夠大的舞台,能夠讓他盡情施展拳腳。

不過,王剛加入阿裏人工智慧實驗室後,並非一把上自動駕駛,而是臨危受命接過了天貓精靈的研發擔子。

根據他當時的觀察,人工智慧產品在雲上的套用已有許多案例,如人臉辨識、語言辨識等。但是端方面,還是一個相對空白的市場。

而且終端產品需要考慮到場景、計算等多方面的制約,挑戰性更大,是為自己開啟工業界入口的好機會。

幾個月後,王剛和團隊一起研發出了初代貓精「天貓精靈 X1」,天貓精靈正式從 demo 走向可以交付的量產產品,並且很快就成了出貨百萬的爆款。

眼看天貓精靈的發展越來越好,就在這時,王剛又做了一個出人意料的決定——主動請纓,帶領團隊從 0 到 1 做自動駕駛。

「這個事情是值得做的,它屬於技術套用的第一象限,既有社會價值也有商業價值。」王剛解釋道。

而他的這個決定,也獲得了阿裏高層的支持和重視。

2017 年 10 月,NASA 計劃的實體承載組織達摩院正式亮相,其中就下設了自動駕駛實驗室,隨後由王剛擔任掌舵人。

最初,由於沒有合適的場地,王剛就帶著幾個小夥伴在西溪園區的車庫邊上進行簡單改建,然後開始買車、改裝、路測。

這段車庫「創業」的歷程,就是小蠻驢的源起。

盡管進入工業界之後的一切都還算順利,但王剛也坦言,以前做的前沿研究很多都沒有用武之地了,他更多的還是給團隊上帶來思維上的轉變。

比如,無論是做 NLP 還是做視覺,無論是做天貓精靈還是小蠻驢,團隊都要思考兩個問題:

一個是怎麽獲取場景數據,一個是怎麽用好這些數據。

據王剛分享,他剛接手天貓精靈時發現語料短缺問題比較嚴重,這會直接拖慢產品化的進度,但由於還未形成產品,很難從使用者處獲取語料;相當於陷入了一個矛盾的困境。

為了解決這個問題,王剛提議花錢找誌願者編輯語料,試圖透過這種方式來弄明白使用者與智慧音箱互動的喜好,然後再把這些語料收集起來,用於演算法訓練。

另一方面王剛發現,很多工程師小夥伴習慣使用最前沿的技術去解決最簡單的問題。

比如,智慧音箱經常會接到開燈關燈的指令。

由於定向思維,很多工程師會讓智慧音箱套用自然語言理解技術去理解開燈關燈這樣的短語。但王剛認為這是一個非常樸素的問題,寫一個規則就能輕松解決。

自動駕駛也是如此。

起步做自動駕駛時,阿裏一直是以乘用車作為實驗平台來跑演算法,當時並沒有明確的產品方向。在宣布進軍末端物流賽道後,難免引起了團隊裏一些同學的心理落差。

不過,王剛堅信末端物流是一個正確的戰略選擇:

技術人員都希望做看起來更有挑戰事情(比如 Robotaxi),這種對待技術的態度應該鼓勵,但大家有時候可能被外面的噪音給幹擾了。

他進一步說道,自動駕駛系統無疑需要數據驅動,如果只有幾百輛測試車,數據量夠不夠支撐公開道路上完全無人駕駛的實作?答案是否定的,而且也沒有任何一家公司能夠負擔起幾萬、幾十萬輛路測車所需的資金。

與此同時,國內末端物流未來的市場規模預計會超過 300 萬台,市場需求是有的。

基於這樣的思考,阿裏選擇先找到一個垂直產品落地,然後再透過這個產品產生價值、推動業務發展,從而實作規模化並且學習更多的場景知識。

而末端物流與阿裏業務生態是完美吻合的,落地場景無須擔心。

開啟大小蠻驢時代

事實上,阿裏自動駕駛實驗室很少對外發聲,王剛也不喜出風頭。

「大家沒必要相互制造焦慮。只有真正做到的時候,我們才說做到。」盡管王剛這句話有些拗口,但這是他一直信奉的原則。

低調耕耘三年多,他們在去年 9 月正式推出了小蠻驢。一年後的今天,他們又迎來了一個裏程碑:

小蠻驢配送快遞突破 100 萬單。

據了解,小蠻驢已落地全國 22 個省份 52 個城市 160 個校園;北至哈爾濱、南至南寧,累計為 20 多萬人提供了快遞服務。

就目前而言,小蠻驢的車隊規模超過 200 台車,每天常態化超過 10 個小時。三年後車隊規模預計將擴容到 1 萬台。

除了規模上的擴張,在服務方面的改善王剛也進行了分享。他認為對一款新生產品來說,使用者的使用體驗尤為重要,無論是價格還是服務的效果上都需要符合使用者的預期。目前,使用者對小蠻驢的滿意度維持在 98% 。

面對這些年外界的一些質疑聲,王剛也回應表示,末端物流雖然是低速場景,但並不是「低階難度」。

技術層面。物流小車與其他自動駕駛車輛一樣涉及到演算法、算力、硬體、系統等多個維度,而且要在公開道路上行駛。

場景層面。末端物流屬於典型的非結構化場景,交通參與者除了人和機動車,還包括各種小動物、非機動車、異形路障等,並且沒有規範的車道設計和通行規則。

成本層面。以大規模套用為目標的自動駕駛產品,如果不能將成本降低到量產水平,一切都是紙上談兵。

總而言之,小蠻驢的 100 萬單只是一個起點,它為阿裏在自動駕駛技術上的進一步發展打下了良好地基礎。

「至少代表著我們看到了自動駕駛規模落地的曙光。」王剛如此評價小蠻驢的成績。

基於小蠻驢的自動駕駛技術框架 AutoDrive 以及智慧仿真平台等,大蠻驢的研發也在緊鑼密鼓的準備中。

王剛告訴我們,大蠻驢是達摩院正在研發 L4 級自動駕駛卡車,適用於城配物流,套用場景包括城市快遞網點-快遞末端節點之間的物流配送等。

據介紹,目前大蠻驢已與菜鳥開始小範圍的路測合作。預計 3 年之後,能在上萬條公開道路上見到這款無人卡車的身影。

同時也不排除阿裏日後布局乘用車的可能性。

畢竟,阿裏做自動駕駛的整體邏輯已經開始逐漸清晰——從低速到中速到高速,從垂直領域、非載人領域逐步泛化到更主流更廣泛的場景。

寫在最後

「我很愛折騰。」在交流的過程中,王剛曾這麽評價自己。

從電子資訊工程跨到人工智慧、從海外回到國內、從學術轉到工業、從天貓精靈做到小蠻驢。他確實一直在嘗試各種挑戰、不斷擴大自己的能力邊界。

「我也很幸運。」他回憶起自己的過往。

他告訴我們,當初進入工業界,太太十分支持他的決定,並與他一同回國;當初他要做自動駕駛,即便面臨巨大的不確定性,公司也非常相信他的判斷。

如果他不愛折騰,又少幾分幸運,阿裏自動駕駛的故事可能會完全覆寫。

但好在,一切都是最好的安排。

文章來源:在阿裏「死磕」自動駕駛,一個套用型AI科學家「命中註定」的故事 ——雷鋒網