正巧,我有個好朋友就是做這個純視覺演算法的博士,之前在墨爾本大學做,前年入職京東了。
他跟我說過純視覺其實是無解的,就是說必定是一條死路。
先講下純視覺演算法的難度點在哪裏:電腦得到的影像是連續的平面,必須依賴演算法從平面構建一個三維空間。
啥意思呢,相當於我給你一張房間的照片,你就把每樣東西的大小,景深,全部給搞定了。從演算法上這沒問題,但魯棒性(這詞沒法轉譯成穩定性,為了嚴謹)沒法保證。
這東西不靠譜的地方是數不勝數的,隨便說幾個:
1.現在我拍照的鏡頭稍微有一點歪,出來的照片實際數據會不會不一樣?或者我的車頭整個都歪了呢?
2.現在是深夜,能見度很低,我的鏡頭在那麽多噪點的情況下是否還支持我高速行駛?
2.5 已經出現過的純視覺車禍,一個是逆光無法辨識翻導的白色廂式貨車,一個是老舊隧道從外進入直接追尾黑色車。
3.如果現在是大霧或者下雨,我怎麽確保拍照得到的景象正確?比如一滴水在鏡頭上,導致焦距不一致。
4.純視覺演算法怎麽搞定強逆光?!
5. 現在你的車前面出現了一塊巨大的2D畫板,裏面是一比一的3D的模組屋,請問你的視覺演算法怎麽搞定這個悖論?
6.接5,現在你的車前面有一塊透明玻璃,你的純視覺演算法如何規避這一風險?
7.泥汙遮擋怎麽辦?難道開到一半突然光速讓駕駛員接手?
所以馬斯克就是成本這項打不過中國車企嘴硬而已。特斯拉現在在同價位毫無舒適感,車機也一般,智能駕駛最好肯定是激光雷達+毫米波雷達+視覺,三管齊下才能應對復雜環境。現在的純視覺方案連完全精準的泊車都做不到 評論區的特斯拉精神股東真的……多七八千的成本,給你多一次活下去的機會不好麽?生命安全是可以隨便用對某個人的盲目追隨來換的?
很多馬粉沒搞懂啥意思,智能駕駛上,視覺+激光+毫米波,如果視覺說可以,激光說不可以,那麽信激光;如果激光毫米波說可以,視覺說不可以,那麽信視覺。人的眼睛可以開車,現在高端的車型一樣有緊急避險,這樣說夠明確了吧?