當前位置: 華文星空 > 知識

HBM 儲存有可能成為未來 CPU 平台的一個主流選擇嗎?

2020-05-12知識

個人看法:短期不會,未來則有可能

HBM的名字是High Bandwidth Memory,顧名思義,就是高頻寬記憶體。HBM的頻寬有多高呢?以標準HBM2來說,單顆粒可以提供256 GB/s的頻寬,作為對比,16 Gbps的GDDR6單顆粒頻寬是64 GB/s,只有HBM2的1/4;DDR4 3200是最少8顆顆粒提供25.6 GB/s頻寬,只有HBM2的1/10。

就現在來說,HBM的核心原理和普通的DDR、GDDR是完全一樣的:每一位數據都透過一個晶體管和一個電容組成的Cell來存放,電容儲存電量來表示0和1,透過晶體管與周邊電路聯通實作讀、寫、重新整理操作。既然原理一樣,HBM要實作高頻寬,就必須在其它方面付出代價: 使用多根數據線。

HBM/HBM2都使用了1024根數據線傳輸數據,作為對比,GDDR是32根,DDR是64根。這麽多數據線,已經無法用傳統的PCB布線實作,因此HBM都需要使用額外的矽聯通層,透過晶片堆疊技術與處理器(CPU、GPU或者其它類別的處理器)連線。使用矽聯通層會帶來兩個缺點: 高成本,容量不可擴。 不過使用矽聯通層的會有一個優點,就是 傳輸數據的功耗可以大幅降低。

HBM堆疊封裝中的矽聯通層

這麽多的連線線,要保持高傳輸頻率一方面會帶來高功耗,另一方面也沒有必要。因此HBM的數據傳輸頻率相對很低,HBM2也只有2 Gbps,作為對比,GDDR6是16 Gbps,DDR4 3200是3.2 Gbps。此外,從多個Bank中讀取並組織1024bit數據進行傳輸也需要耗費相當時間。雖然HBM的1024bit是分成8個128bit通道,HBM2的偽通道模式更是每個通道再進一步細分為兩個偽通道,每個64bit,但組織64/128bit的數據排隊,還是遠比GDDR的32bit,DDR的8bit要慢不少。排隊慢傳輸也慢,因此, HBM還有另一個缺點:延遲高。

小結一下,HBM的優點:頻寬高,傳輸功耗低;缺點:成本高,延遲高,容量不可擴。

現在以及短期可見的套用來說,很少有非常大的計算量,對於頻寬的需求並不高,對效能影響更大的是延遲。而且PC使用者的需求各種各樣,使用習慣,購買預算都會有很大差異,特定一兩種記憶體容量的規格難以滿足全體使用者,所以HBM在可預見的短期內,都不可能成為主流選擇。

就目前來說,記憶體廠家提出的低成本HBM,以及Intel的EMIB技術,可以一定程度上降低HBM的成本。

低成本HBM,首先傳輸速度從2 Gbps提高到3 Gbps。降低介面位寬,從1024bit降低到512bit;同時堆疊層數也可以減半;另一方面,取消掉緩沖芯片、ECC糾錯所需的冗余容量。

Intel的EMIB(Embedded Multi-die Interconnect Bridge,嵌入式多晶片互聯橋接)技術,則可以用很小面積的橋接矽片代替大面積的矽互聯層。但需要處理器、HBM顆粒把用於互聯的觸點分布在顆粒邊緣。

基板封裝、矽穿孔堆疊、互聯橋接對比
互聯橋接只需使用很小面積的晶片<br>(圖中金色小方塊)

未來隨著互聯網接入頻寬的提升,智能電話的普及,以及人工智能的流行,可以合理猜測未來的數據量和計算量是會不斷提升的,當數據量、計算量達到現有的DDR/GDDR頻寬瓶頸後,HBM很可能會是唯一解決方案。

HBM容量不可延伸的問題,如果傲騰記憶體得以普及,應該也不是問題。畢竟現在很多時候我們需要大容量記憶體,往往只是因為硬碟太慢,且不支持隨機存取,很多後台套用、服務占用了大部份記憶體容量,這些數據完全可以放在傲騰記憶體中而且對效能沒有影響,甚至傲騰的無需定時重新整理特性還可以大幅降低功耗。HBM相當於傲騰的緩存,活躍數據才放在HBM上就可以了。

HBM延遲高的缺點,則只能透過加大處理器的內部緩存來解決了。現在CPU方面,AMD 64核的的EPYC 7742/執行緒撕裂者3990X末級緩存都高達256 MiB,GPU也有128 MiB緩存的6800了,可以一定程度上降低HBM高延遲帶來的影響。