Thor延期,最有趣的可能是小鹏自己的选择。
小鹏是Nvidia的Orin X用的最好的那一批,但在端到端年代,Orin X受限于互联带宽,端到端技术的能力上线被卡住了。
Thor是缓解当下算力/带宽瓶颈,实现更强智驾算法的有效途径。但Thor 延期了,能大规模上市的时间和小鹏自研芯片的时间,可能相差无几,甚至算力都可能是接近的。
于是,小鹏面临——在用的习惯的Thor,和用起来可能没那么习惯的自研芯片之间做抉择,更快更好上自研芯片,似乎成了当下更好的路径。
1、Orin X的端到端支持不够好,所以需要Thor。
Orin X被算力和带宽限制。比如理想说他们用Orin X跑VLM只有3-5Hz(0.2-0.3秒/次)。
而端到端基本只能部署在一颗芯片上(互联带宽问题)
所以本来国内这些厂商都在等Thor,用一颗Thor代替两颗Orin X。
上代BEV+Transformer+OCC的智驾算法,可以多芯片跑,是用不同芯片处理不同信息。
举个例子,下图是双地平线J5的方案,两颗芯片负责的内容各不相同。
2、Nvidia那边对Thor的精力不足
NV家近两年主要精力都在服务器/大模型领域,汽车业务占比也就不到5%。
但近期的B200延期,以及各家服务器芯片的ASIC计划,让NV重点都在下一代芯片应该怎么规划上。
这个并不是NV的芯片设计能力不足,也不是NV水平不行。
要说亲戚关系,Thor可能跟任天堂的Switch更近一点。
Thor演进过来的路线不是从显卡下放,而是移动端处理器升级。路径大体是Tegra-Tegra 2-Tegra 3-Tegra 4-Xavier-Orin-Thor,Xavier前面的这些处理器资深一点的数码爱好者应该都熟悉,我还用过Tegra 2的手机——Moto ME860、海信T96。
3、当然,Thor也有自己的问题,还是出在带宽上。
此前报道中,Thor的带宽应该是273GB/s,比Orin X没高太多,可能还是会碰上存储墙的问题。
当然,这可能也是Thor延迟的原因,由于带宽的原因(可能还有算子,总所周知,Orin X里面那个DLA对于Transformer的算子支持不好,Thor的这部分DLA的算力究竟是多少,也没有公开资料说明),Thor可能还在调整。而这部分调整,又进一步导致了上市时间的延迟。
作为对比,特斯拉HW4用上了GDDR6,内存带宽上升到了448GB/S(单颗芯片正反布置8个 GDDR6 2GB,资深游戏显卡佬应该知道我在说什么),最新一代FSD V13.2也暂时只支持HW4。
4、Thor延期也是小鹏自研芯片的机会。
如果把时间放到2025年,相对好用的智驾芯片就只有Orin系列(400美元左右的X、200-300美元的Y,200+美元级别的N,NV杀价也很猛),以及地平线J6E/M,外加国产化要求,这块需求应该还是挺大的。
小鹏的芯片——如果按照之前发布会上的内容,一颗顶三颗的话,大体上应该是400TOPS稠密算力级别(对应Orin X 127TOPS稠密算力)
如果这颗芯片目前流片,最快上车应用可能也是在2026年下半年到2027年
这个时间点差不多和Thor能正式大规模上车差不多,Thor最快明年下半年出来700TOPS级别的Thor S,但模组要大规模上车应用,照样还得在车企跑完冬测夏测,Thor S要是没赶上冬测,最快想用就得把车挪去澳洲跑一遍,跑完冬夏两测,基本也就到了2027年下半年。
如果Thor S这个700TOPS依然是稀疏算力,那实际好用的稠密算力差不多是350TOPS,还不及小鹏自研产品。
所以,Thor延期,最有趣的可能是小鹏自己的选择。
小鹏是Nvidia的Orin X用的最好的那一批,但在端到端年代,Orin X受限于互联带宽,端到端技术的能力上线被卡住了。
Thor是缓解当下算力/带宽瓶颈,实现更强智驾算法的有效途径。但Thor 延期了,能大规模上市的时间和小鹏自研芯片的时间,可能相差无几,甚至算力都可能是接近的。
于是,小鹏面临——在用的习惯的Thor,和用起来可能没那么习惯的自研芯片之间做抉择,更快更好上自研芯片,似乎成了当下更好的路径。