2023 年,半导体行业最大的事件应该是 " 美国的第二轮芯片禁令 " 吧。
我来说说这个事情。
在今年的 10 月 17 日,美国再次颁布 / 升级了高端芯片对华出口的限制,会涉及 A100、A800、p00、H800、L40S、RTX4090 芯片,其中特别是对于 A800、H800、RTX4090 的限制,引起了广大网友的意外和讨论 (而 p00、A100 本来就在第一轮的芯片禁令中,所以可能大家已经习惯)。在这个时间点颁布这个高端芯片升级限令,其实十分微妙。前段时间,华为在没有事先预告 和长期被技术封锁的情况下直接发布了 mate60,搭载了国产的 7nm 芯片,着实让美国商务部十分打脸,也直接让他们松口会向我们开放除高端芯片以外的芯片,注意,是除高端芯片之外。这不,回头高端芯片的禁令就升级了,这个禁令在之前可是只有 A100 和 p00 的,而 A800、H800 被视为 A100 和 p00 的阉割版,是可以对咱们出售的。此次禁令一出,基本就是国内都不能再直接购买到英伟达这些高算力的顶尖芯片了。除此之外还有很坏的地方,一方面对我们禁售尖端芯片,另一方面还防止我们自主芯片企业的崛起,对摩尔线程和壁韧科技继续提升了技术封锁。为什么要禁这两家,一方面是技术做的确实不错 (摩尔线程是国内为数不多的国产显卡厂商,而璧仞纯粹是性能数据太炸裂),另一方面之前也确实有点高调。
这次的芯片禁令中限制阈值主要由两个指标来控制,一个是叫 TPP,全称为 Total Processing Performance,计算方式是算力 * 位宽的乘积。还有个指标叫 PD,全称为 Performance Density,计算方式是 TPP 除以芯片面积 (非平面晶体管区域)。而 3A090.a 就是最高级限令,用于限制高端芯片,3A090.b 是次高级限令,用于限制次高端芯片。从限定的原文中摘录了下面的这段,这段主要就是在说限令的指标,
其实可以比较明显地看出,TPP 就是在限制算力,而 PD 是在限制 算力密度。这相比于去年的限令,去年限制的两个指标是算力 和 传输速率。在去年的限令之下,英伟达特供版的 H800 / A100 虽然是降低了带宽但保留了算力,H800 芯片之间的传输带宽只有 400GB/s,还不到 p00 峰值的一半,而 p00 的峰值带宽达到了 900GB/s。所以在去年的情况下,H800 / A800 还是可以 "投机取巧" 采购的,而这次的禁令,直接把这俩幻想也给打碎了,甚至还加入了消费级显卡 4090,这也是为什么说这次的芯片禁令限制升级的原因 (其实需要指出的是,这个限令规则其实不适用于 [消费产品],但老美商务部同时也指出,在出口算力 > 300 TFLOPS 的芯片时必须上报,以便于跟踪这些芯片是否被大量用于训练 AI)。
具体来说,这次的芯片禁令两个指标 TPP、PD 的限制范围如下,
根据上面的指标限制范围,辐射到目前英伟达市面上的高端芯片,A100、A800、p00、H800、L40S、RTX4090,无一幸免,各显卡具体的指标如下,
对于英伟达,一家以利益为先的商业企业,虽然只能 "服从安排",但是肯定不甘,也只能见招拆招了。所以在 "详细参读" 第二轮芯片禁令后,又一次特供了的三款 GPU:p0、L20 和 L2,而后又放出了 RTX4090D 的特供消费卡,可谓是 "见招拆招" 了。
在经历了美国这两轮芯片禁令后,对咱们的国产 AI 芯片厂商的冲击也很大,可谓几家欢喜几家愁 ,有些可能乐开花: 禁得好禁得好,禁了英伟达我们的卡就有市场了 ;有些可能愁到了家: 上了禁令名单,可让我怎么活? !