2023年全球最大的科技變革,來自於Open AI推出Chat GPT,不僅是自然語言處理技術的飛躍,更帶來了人機互動方式的變革。意味著機器可以透過深度學習,模仿人類思維,能夠更好地理解問題,同時給出較為準確的答案。除了能回答問題,還可以寫作、繪圖、制表、數據分析、圖片分析等等,之所以Chat GPT無所不能,都離不InstructGPT演算法架構開發的大型預訓練語言模型。那大模型如果套用到汽車上,是否會帶來自動駕駛機會的快速叠代。
1、馬斯克與Open AI的「感情糾葛」不斷,成立xAI開始大模型訓練,反哺特斯拉自動駕駛能力
自動駕駛領域,特斯拉率先引入BEV+Tranformer大模型,與傳統2D+CNN小模型相比,不僅車輛的提高感知能力,讓模型不在機械的學習,而是學會總結歸納而不是機械式學習。以便快速在復雜環境中做出合理決策。
但馬斯克並為止步,2015年馬斯克與OpenAI現任行政總裁柯曼合作,建立了自己的人工智能實驗室,早期階段,馬斯克和柯曼顯然十分默契,兩人一致認為,擁有大量相互競爭的人工智能系統更有利於構建人工智能安全體系。2018年馬斯克離開了OpenAI的董事會。時隔多年後,馬斯克在一次采訪指出,OpenAI脫離了他原本的想法,開始以營利為目的並將程式碼閉源。
於是,2023年7月馬斯克創辦人工智能公司xAI,最初的12名員工中有7名來自於谷歌和OpenAI。馬斯克也公布了他對xAI的一系列規劃,包括新公司即將釋出一款工具,將和特斯拉、推特協同合作,並投擲了xAI的宏大目標,即了解宇宙「到底發生了什麽(what the hell is really going on)」。
xAI將在前沿芯片領域、AI軟件方面與特斯拉進行合作,包括特斯拉自研的Dojo超級電腦,特斯拉一直使使用者車輛影片和數據來訓練這套超算系統。xAI還將使用推特的數據來訓練自己的模型,借此構建「最具好奇心」的AI系統和產品。而這種「互惠互利」的關系,也會加速特斯拉自動駕駛能力的不斷前進演化。
2、大模型套用下NOA快速落地,L3及以上自動駕駛行程有望加快
目前特斯拉Model3/Y、小鵬的G6/G9/P7i 、阿維塔11、阿維塔12、問界M5、問界新M7、AlphaS HI、理想L7/L8 /L9 、智己L7/LS7、騰勢N7、蔚來全新車型基本都把高速NOA標配,同時提供城市NOA選配。而且大部份車企開始向不依賴高精度地圖的技術路線轉變,比如特斯拉的FSD V12、華為的ADS2.0等,可以不依靠白名單,特斯拉Occupancy Networks可實作BEV從2D到3D的最佳化,可即時預測被遮擋物體的狀態;華為ADS 2.0利用道路拓撲推理網絡,辨識障礙物。
為什麽越來越多的廠家放棄了高精度地圖?一方面高精度地圖成本非常高,華為曾經在上海用了2年時間,采集9000公裏地圖,仍舊沒有把上海覆蓋,要是把全國地圖都采集下來成本會非常高;二是高精地圖作為國家重要的戰略資訊,不允許完全開放,幾個月才允許車企重新整理一次,但是大家都知道中國是基建狂魔,道路變化特快,沒有辦法做到泛化。不依賴高精度地圖,才能讓高階的自動駕駛廣泛的泛化使用。
3、大模型套用下,對算力和芯片提出更高要求
不依賴高精度地圖和白名單的情況下,只依靠普通導航地圖,車輛就需要像老司機一樣看路識圖,像人的眼睛一樣看交通標誌、看路線,自己推理道路的結構、預判可能發生的情況,大模型催化下,NOA不斷從高速道路向城市道路提升。
高速道路場景和物體相對固定,比如車道保持、定速巡航、主動剎車、上下匝道、自動變道、超車主動避障等,而城市道路不僅是車主最主要出行場景,而且環境復雜度更高,需要自主辨識交通標誌、進出環島、辨識車位泊車、紅綠燈通行、掉頭、並線、自主切換車道、自主切換路線、代客泊車等等,需要同時提升物體辨識、感知融合和系統決策算力需求。
實作L2級自動駕駛只需10Tops以下的算力,實作L4級自動駕駛也只需100Tops左右的算力,真正無人駕駛的L5級,則需要1000+Tops的算力。現實中OEM具備城市NOA高階智能駛功能的車型,算力大多在200-500TOPS左右。模型最佳化或可降低算力要求,但考慮到未來場景復雜度的增加,數據量增加,以及視覺感知占比增加,車端算力或將翻倍達800TOPS以上。
算力需求與車企高階智能駕駛滲透率相關,預計到2025年,算力需求將達到14-43 EFLOPS。以吉利為例,從單車算力需求角度進行測算。星睿智算中心算力預計2025年達到1200PFLOPS,可支持350萬輛線上車輛平行計算,預測到2025年總算力需求為14 EFLOPS。而小鵬扶搖算力可支撐未來2年每輛車每天10TB數據量的訓練算力, 預計2023E/2024E/2025E中國乘用車銷量分別為2380/2428/2485萬輛,2023E/2024E/2025E中國L2及以上級別智能駕駛滲透率為 50%/70%/80%,到2025年算力需求達到46 EFLOPS。
以Transformer大模型為例,同時對芯片效能有更高要求。主要體現在CNN模型以摺積和矩陣乘等計算密集型算子為主,而Transformer是以訪存密集型算子為主的,對頻寬和儲存有較高要求。Transformer是浮點向量矩陣乘法累加運算,而目前智能駕駛芯片基本均針對INT8的。智能駕駛芯片廠商正在加強芯片對Transformer的適配,如輝達在新一代GPU中特別增加了Transformer引擎。