【文/觀察者網專欄作者 潘攻愚】
2015年3月19日,美國司法部在官方網站上釋出了一則新聞稿:「舊金山一男子及其公司因向俄羅斯走私精密電子元件而被起訴。」
經查,已經入籍美國的俄羅斯裔Pavel Flider因透過第三方走私「受控的兩用可編程電腦芯片」,涉案金額高達6000萬美元而被舊金山聯邦大陪審團起訴。
彼時,恰好是俄羅斯從烏克蘭手中奪回凱瑞米亞一周年。
以事後之見來看,凱瑞米亞事件為七年後俄烏爆發全面軍事沖突埋下了伏筆。可以說,Pavel Flider為俄羅斯儲備了一批價值不菲的軍用物資。
他所走私的6000萬物品中,主要的品類是可編程電腦芯片即FPGA,號稱「萬能芯片」。在今天的俄烏戰場上,FPGA甚至一度成為「戰爭芯片概念股」的主角。
根據好事者對戰場遺址打掃和武器拆解,今年7月,在基輔 Okhmatdit,俄羅斯Kh-101火箭的導航系統使用了Xilinx(賽靈思)的FPGA芯片;類似但更先進的FPGA也出現在「柳葉刀」無人機中。俄羅斯Iskander和Calibre-PL巡航飛彈的導航中大量使用全球兩大FPGA巨頭Xilinx和Altera的產品。
從柳葉刀無人機上拆卸下來的Xilinx的FPGA
對俄羅斯抱有敵意的媒體Insider報道,號稱俄高科技工業心臟的米克朗Mikron Group其產品型號中只有兩種FPGA型號,不得不高度依賴進口。
在以美國為首的西方對俄羅斯半導體全面斷供的情況下,俄方透過中亞等第三方中轉站和之前的庫存依然可以維持戰爭所需的「工業糧食」的周轉。從2022年到2024年,即戰爭開始後的兩年裏,Xilinx和Altera流向俄羅斯的FPGA總價至少分別為2.16億美元和1.2億美元。
俄羅斯「特種技術中心」公司釋出的FPGA工程師招聘資訊
戰爭形態可以檢驗一國關鍵物資儲備的生產力和動員力。戰場上廝殺後的余燼往往埋藏著勝負手的解碼器。AI大潮洶湧澎湃之下,看似處境有些尷尬的FPGA以戰立身,在某種層面上可以迫使業界重新思考CPU、GPU、FPGA\ASIC這些高算力芯片在各型別產品價值鏈中的地位,以及探討如何進一步最佳化軍工半導體生態,提升相關供應鏈的健康度。
FPGA的座標系:非中心,但也絕非邊緣
何謂FPGA?Field Programmable Gate Array,即現場可編程門陣列。現場和可編程是其稱謂的兩個關鍵詞。
先說可編程
。透過非門、與非門、或非門的有序堆疊,FPGA可實作任意功能的數位電路,所有組合電路都有對應的真值表,FPGA的可編程邏輯塊中的LUT(尋找表,Look Up Table),可以完成任意組合電路的功能。
再說「現場」
。FPGA底層邏輯運算單元的連線及邏輯布局沒有固化,這可以使得客戶在拿到芯片後,透過本地或者遠端配置的現場實作自己符合需要的功能。
FPGA於1985年由Xilinx創始人Ross Freeman發明,至今約有40年歷史。FPGA和CPU、GPU同屬於大型數位芯片序列。
這裏請註意,FPGA的可編程特性是特指它的硬體可編程,這是其區別於CPU和GPU的顯著特性。
透過對FPGA原理架構的拆解我們可得知,只需要改變FPGA中LUT的掩碼,FPGA就可以承載另一個電路的功能,而且能無限次的修改。FPGA內部往往由數十萬個可編程邏輯塊可以同時獨立工作,有效解決時脈高低起伏的問題,特別適合大型平行計算的場景。
我們可以用數學上著名的戴德金數來看看FPGA的威力。
在普通膝上型電腦上計算第八個戴德金數需要八分鐘,但計算第九個則需要數十萬年。帕德博恩大學的電腦科學博士生Lenart Van Hirtum在FPGA超級電腦的幫助下,這個問題在五個月內就得到了解決。
從架構上看,FPGA相比CPU和GPU,在某些領域的套用有著無可比擬的優勢。
CPU的一項重大任務就是負責任務排程,在處理多執行緒任務時,不可避免地出現任務越多算的越慢的現象,所以任務率越高時延越長,而FPGA由於在布局布線階段不需要重排執行順序和指令排程,其處理時延和利用率大小基本是無關的,因此,FPGA非常適合低時延、需要現場可編程的場景。
生成式AI帶火了GPU,讓輝達這個賣鏟人市值一路水漲船高。業界普遍認為,更適合平行計算的GPU在AI訓練和推理方面的負載難以被替代,取代了CPU,坐上了通用高算力處理型別芯片的頭把交椅。但是任憑輝達CEO黃仁勛無論怎樣變換話術兜售GPU「買的越多越省錢,買的越多越節能」,GPU的功耗依然是個大問題,因其無法很好地利用片上記憶體,需要頻繁讀取片外的DRAM。
被GPU吹上產業風口的HBM(高頻寬記憶體)恰恰說明了GPU需要HBM這樣一個需要被封裝在一起的「外掛」。而FPGA整個演算法無需儲存外掛,整個演算法可以在片上完成,特別適用於小樣本推理和邊緣計算。
問題來了,既然FPGA相較CPU和GPU都有相當鮮明的優點,為何在PC時代和行動通訊時代都沒能成為處理器的主角?
從市場規模角度也能看出端倪。2022年FPGA全球市場規模區區80多億美元,中國區市場不到210億人民幣。FPGA的產品特性決定了它無法完成像CPU那樣的更通用性的排程安排處理功能,也無法像GPU那樣做到大規模平行計算和AI訓練。
而且,FPGA的地盤正在越來越受到ASIC——特定用途積體電路的侵蝕。和CPU、GPU、FPGA相比,ASIC的通用性和靈活性最差,但主打一個專精、高效和低功耗。
誠然,FPGA因為「現場」可用,相比ASIC,FPGA無需等待三個月至一年的流片周期,上市時間短,對於消費電子這類競爭激烈、叠代迅速的行業尤其重要。但ASIC更符合AI時代這種scale law的大力出奇跡模式,因此在技術非常成熟且利潤率非常低的產品是殺手般的存在,只要保證設計上的技術成熟,就可以抵消一次性量產帶來的流片昂貴(ASIC因其硬體不可編程,流片失敗意味著一批產品都要廢掉)的問題,可以大規模上量,有著更低的功耗,更豐富的封裝選擇和更優的TCO(芯片設計、制造總成本)價效比。
從現實市場層面上也可以看到FPGA的命運之坎坷。
2015年,英特爾以167億美元收購當時的FPGA領域龍頭企業Altera,隨後形成了現在的PSG部門。2022年,AMD宣布以全股份交易的方式,完成對最大FPGA廠商Xilinx的收購,按當時雙方股票價格,交易金額達到350億美元。
今年FPGA再次成為媒體熱議的焦點,一大原因是因為英特爾決定拆分PSG部門,讓Altera重新單飛上市。當年在FPGA市場呼風喚雨的Altera被CPU大佬呼來喚去,聚而終散,根本原因在於當年的「CPU+FPGA」異構整合計算的野望無法達成預期,在數據中心和雲端運算方面未能發揮強強聯手的優勢,最終以輝達GPU大獲全勝收場。
此外,由於Altera在緊跟莫耳定律方面裹足不前,10nm工藝以下平台被Xilinx穩穩碾壓,五年來市場份額從超過40%掉到了24%左右。
即便如此,AMD收購Xilinx雖然整合程度高於英特爾,也未達到當年在數據中心市場上的全面預期。大局形勢所迫,Xilinx目前已經不是一個純FPGA公司,還提供很多板級服務,尤其是高整合的SoC產品以進一步增強客戶黏性。
從整體市場前景上看,我們也必須認識到,在AI產業炸裂的時代,FPGA依然無法「挑班」營運,反而讓ASIC乘勢迅速崛起。
目前半導體行業形成了一個基本的共識,未來芯片設計將更加專業化,專用芯片ASIC會得到更廣泛的部署與套用,目前對輝達GPGPU通用計算平台挑戰最大的就來自LPU/TPU,一個典型的例子就是谷歌的TPUv4集群已經廣泛進入到超算行業,並且讓蘋果的AI計畫拋棄了輝達高端AI加速器而選擇了谷歌TPU。
作為一種ASIC的TPU,沒有不必要的邏輯和路由開銷,邏輯控制單元更小、更容易設計,只占整體芯片面積的2%,給片上記憶體留下了更多的空間。
總之,FPGA雖然在各個時代的風口都無法站在的舞台的最中央,但它卻像一個可隱可現的,內力十足的江湖豪俠守住自己的一畝三分地。可現場重構、靈活性、快速叠代、低延時,以及適合某單一套用場景的小批次生產,等等均是它的殺手鐧,這也是其戰略地位的最佳表達。
FPGA的絕招:軍工市場與低延遲通訊
FPGA雖然在AI算力領域只占據小份額的端側推理市場,跟在GPU後面「喝湯」,但在低軌通訊和太空競賽中,它是絕對的王者。
以航空航天為代表的軍工品類只占到全球FPGA 80億美元整體市場的不到15%,卻能以小見大,是大國重器不可或缺的硬體底座。
馬斯克手下的全球最大的商業衛星營運商SpaceX屢屢成為媒體頭條,除了主打衛星通訊的星鏈計劃之外,該計畫還承擔火星殖民的遠景任務,已經成為代表科技創新之美國夢的偶像級計畫。如果我們開啟SpaceX官方網站,再點選其招募條塊,就會發現SpaceX正在大量招聘FPGA工程師(如下圖)。
FPGA動態可重構的特點可以防止邏輯可編程模組被宇宙射線造成物理損壞,而且航空航天的小批次多品種且需要不俗算力(寬頻衛星通訊處理數據的能力)也讓FPGA可以大顯身手。而且,航空航天所需的導航、通訊芯片是一個長尾市場,客觀上為FPGA建立了一個避免ASIC騷擾的護城河。
回到本文開頭。Xilinx和Altera近兩年在俄羅斯出貨不過區區3億多美元,但其承擔的有效打擊敵人,減少自身消耗的戰略價值卻是難以估算的。從Xilinx的Zynq UltraScale系列加持下相控陣雷達的波束指向,到保證飛彈精確打擊的雲台控制,再到衛星上觀測停靠在地面上的中型飛機等,均會大量用到FPGA品類。
在更加敏感的軍民兩用領域,FPGA也有廣闊的施展空間。FPGA可以用於ADAS的傳感器融合領域以及雷射雷達訊號處理主芯片,還能配合SoC完成座艙域訊號橋接,以及車身的電機控制。目前中國領先的雷射雷達廠商如速騰聚創、禾賽等均采用了Xilinx的Zynq FPGA系列。
2018年10月,華為聯手Xilinx宣布開發中國第一款雲端高效率視訊編碼(HVEC)解決方案。
此外,在5G基站中,FPGA可以在桿上的射頻單元中負責無線訊號的波束賦形工作。多年前,諾基亞面對華為和中興在5G基站中的不斷擴大的領先優勢,冒險采用了FPGA作為處理器進入核心網序列,就是看中了FPGA上市快,可以先占點踩位的優勢。不過後來被華為的ASIC解決方案打的潰不成軍,主要是管理和產品使用者定位出了問題,那是後話了。
如何看待FPGA戰略與市場地位的不對稱性
目前,半導體行業與全球地緣政治的變化的錨定度越來越強,自主可控的呼聲和國產替代焦慮並存。
全球80多億美元的FPGA的大盤,中國僅占五分之一左右,而且高端FPGA,即12nm以下工藝制程至少落後Xilinx兩個代差,雖然近年來湧現出了復旦微電、安路科技、紫光系等有相當市場競爭力的FPGA企業,在軍工、電子消費和通訊市場各自逐漸劃定了勢力範圍,但90%的份額仍被Xilinx、Altera、Lattice和Microchip四大海外巨頭把持。
發力趕超,步步逼近,「x道超車」等等媒體經常渲染的芯片市場競爭話術也許放在FPGA這裏並不太合適。考慮到FPGA所能帶來的關涉國防安全和重大戰略利益的高附加值,以及有限的市場成長性,戰略選擇和差異化競爭也許比盲目的工藝節點趕超更重要。
須知,FPGA因其布局布線只能在對應的FPGA廠商自己的EDA中完成,越是大型的設計,重新走一遍布局布線的沈沒成本就越高,而布局布線恰恰是FPGA軟體最核心的領域,FPGA可以當ASIC的原型驗證工具使用,其客戶黏性特別高。
Xilinx、Altera幾十年來透過不斷的產品叠代,輔以料號的鋪散吞食了一些散沙化的市場。FPGA和CPU一樣,工藝節點就代表市場份額占有能力,海外巨頭紛紛往12nm以下進發之時,國內領頭的復旦微電、安路科技等SoC FPGA大多還停留在28nm這一「甜蜜節點」上,與其和其爭奪存量客戶,不如另辟蹊徑尋找自身發展新動能。
筆者對國內FPGA生態建設有以下建議。
首先,加強與國內高校的合作,進一步打通產學研結合。
半導體各個品類中,FPGA在產-學融合上並非是務虛之辭,有著相當強的話語權。海外兩大巨頭Xilinx和Altera通常與學界緊密合作,諸如多倫多大學等科研院所為FPGA的架構演進和演算法叠代做了非常重要的貢獻,畢竟,布局布線是積體電路學院人才培養的基本功;
第二,模擬戰爭的沙盤推演,盤點FPGA品類的自主可控性。
航空航天和相控陣雷達、紅外裝置等制程多在55nm-90nm左右,看重其低延遲、可靠性,可以透過國家隊投資平台牽頭孵化戰時FPGA計畫;
第三,在某些極端狀態下,必要時可以透過類似「平準基金」的方式調控FPGA市場價格。
2021年「缺芯潮」肆虐之時,我們看到Xilinx攜手Altera漲價好幾倍,店大欺客,進一步擠壓了國產FPGA市場上的議價空間;
第四,FPGA+EDA+IP協同作戰。
目前FPGA廠商的競爭主線從邏輯編程的門級數轉向整合度競爭,先後將DDR介面、CPU、GPU等許多功能嵌入到FPGA中,出現了所謂的FPGA「SoC」化的特性,疊加FPGA本身帶來的EDA內容,因此FPGA廠商需要介面IP廠和EDA廠商協同發展,以泛發展聯盟的姿態對接上下遊發展需求,以牛芯半導體為例,該公司研發的高速Serdes IP和DDR IP就是專門對應FPGA的IP產品,市場反饋良好。
總之,FPGA不僅是芯片前端設計(布局布線)的硬通貨,還是戰時狀態下國家利益保障的必需品,它的高價值性不應被碎片化的、小批次生產的終端套用所稀釋,需要產業界攜手摒棄以量取勝,以規模平攤成本盈利的思維模式,重新評定其戰略地位,在風起於青萍之末,浪成於微瀾之間的微妙關節點上做好不時之需。