有声读物,盗墓笔记第二季,君子以泽

GDDR7規(guī)范重磅發(fā)布！深度解讀

2024-03-10 11:12:32 EETOP

點(diǎn)擊關(guān)注->創(chuàng)芯網(wǎng)公眾號，后臺告知EETOP論壇用戶名，獎勵200信元

JEDEC 上周二（3月5日））發(fā)布了 GDDR7 DRAM 的官方規(guī)范，這是顯卡和其他 GPU 驅(qū)動設(shè)備的長期內(nèi)存標(biāo)準(zhǔn)的最新版本。最新一代 GDDR 帶來了內(nèi)存容量和內(nèi)存帶寬增益的組合，后者主要由內(nèi)存總線上切換到 PAM3 信號驅(qū)動。最新的GDDR 標(biāo)準(zhǔn)還增加了每個 DRAM 芯片的通道數(shù)量，添加了新的接口訓(xùn)練模式，并引入了片上 ECC 以保持內(nèi)存的有效可靠性。

JEDEC 董事會主席 Mian Quddus 表示：“JESD239 GDDR7 標(biāo)志著高速內(nèi)存設(shè)計的重大進(jìn)步。隨著向 PAM3 信號的轉(zhuǎn)變，內(nèi)存行業(yè)有了一條新的途徑來擴(kuò)展 GDDR 設(shè)備的性能并推動圖形和各種高性能應(yīng)用的不斷發(fā)展。”

GDDR7 最大的技術(shù)變化是內(nèi)存總線上的兩位不歸零 (NRZ) 編碼轉(zhuǎn)換為三位脈沖幅度調(diào)制 (PAM3) 編碼。這一變化允許 GDDR7 在兩個周期內(nèi)傳輸 3 位數(shù)據(jù)，比在相同時鐘速度下運(yùn)行的 GDDR6 多傳輸 50% 的數(shù)據(jù)。因此，GDDR7 可以支持更高的總體數(shù)據(jù)傳輸速率，這是使每一代 GDDR 連續(xù)比其前身更快的關(guān)鍵組件。

第一代 GDDR7 的數(shù)據(jù)傳輸速率預(yù)計約為 32 Gbps/pin，而內(nèi)存制造商此前曾表示，最高可達(dá) 36 Gbps/pin。然而，GDDR7 標(biāo)準(zhǔn)本身為更高的數(shù)據(jù)傳輸速率（高達(dá) 48 Gbps/pin）留出了空間，JEDEC 甚至在其新聞稿中宣稱 GDDR7 內(nèi)存芯片“每臺設(shè)備的速率高達(dá) 192 GB/s [32b @ 48Gbps]” 。值得注意的是，這比 PAM3 信號本身帶來的帶寬增長要高得多，這意味著GDDR7的設(shè)計中有多個級別的增強(qiáng)。

深入研究規(guī)范，JEDEC還再次將單個32位GDDR內(nèi)存芯片細(xì)分為更多的通道。GDDR6提供了兩個16位通道，而GDDR7將其擴(kuò)展到四個8位通道。從終端用戶的角度來看，這種區(qū)別有些武斷——它仍然是一個32位芯片，運(yùn)行速度為32Gbps/pin——但它對芯片內(nèi)部的工作方式有很大的影響。特別是JEDEC保留了GDDR5和GDDR6每通道256位預(yù)取，使GDDR7成為32n預(yù)取設(shè)計。

GDDR 通道架構(gòu)

所有這些的最終影響是，通過將通道寬度減半但保持預(yù)取大小相同，JEDEC 有效地將 DRAM 單元每個周期預(yù)取的數(shù)據(jù)量增加了一倍。這是擴(kuò)展 DRAM 內(nèi)存帶寬的非常標(biāo)準(zhǔn)的技巧，本質(zhì)上與 JEDEC 在 2018 年對 GDDR6 所做的事情相同。但它提醒我們，DRAM 單元的速度仍然非常慢（在數(shù)百兆赫的數(shù)量級上）并且速度并沒有變得更快。因此，提供更快內(nèi)存總線的唯一方法是一次性獲取越來越多的數(shù)據(jù)。

每個內(nèi)存芯片通道數(shù)量的變化也對多通道“clamshell”模式如何適用于更高容量的內(nèi)存配置有輕微影響。雖然GDDR6在clamshell配置中從每個芯片訪問單個內(nèi)存通道，但GDDR7將訪問兩個通道- JEDEC稱之為雙通道模式。具體來說，這種模式從每個芯片讀取通道A和C。它實際上與GDDR6的clamshell模式完全相同，這意味著盡管最新一代內(nèi)存仍然支持clamshell配置，但除了不斷增加的內(nèi)存芯片密度之外，沒有任何其他技巧可以用來提高內(nèi)存容量。

在這方面，GDDR7 標(biāo)準(zhǔn)正式增加了對 64Gbit DRAM 設(shè)備的支持，是 GDDR6/GDDR6X 32Gbit 最大容量的兩倍。此外，還繼續(xù)支持非雙功率容量，允許使用 24Gbit 和 48Gbit 芯片。對更大內(nèi)存芯片的支持進(jìn)一步將理論上采用 384 位內(nèi)存總線的高端顯卡的最大內(nèi)存容量推高到 192GB 內(nèi)存，在大型語言人工智能模型時代，這一發(fā)展無疑會受到數(shù)據(jù)中心運(yùn)營商的歡迎。不過，盡管如此，我們?nèi)匀唤?jīng)常看到當(dāng)今的存儲卡使用 16Gbit 內(nèi)存芯片，盡管 GDDR6 支持 32Gbit 芯片。再加上三星和美光已經(jīng)透露，它們的第一代 GDDR7 芯片也將分別以 16Gbit/24Gbit 為上限，可以肯定地說，64Gbit 芯片現(xiàn)在還很遙遠(yuǎn)。

對于其最新一代的內(nèi)存技術(shù)，JEDEC還包括一些新的GDDR內(nèi)存可靠性功能。最值得注意的是，片上ECC功能，類似于我們在引入DDR5時所看到的。雖然我們還沒有從JEDEC那里得到官方評論，說明為什么他們現(xiàn)在選擇包括ECC支持，但考慮到DDR5的可靠性要求，它的包含并不奇怪。簡而言之，隨著存儲芯片密度的增加，越來越難以生產(chǎn)出沒有缺陷的“完美”芯片;因此，添加片上ECC使內(nèi)存制造商能夠在面對不可避免的錯誤時保持其芯片的可靠運(yùn)行。

在內(nèi)部，GDDR7 規(guī)范要求每 256 位用戶數(shù)據(jù)至少 16 位奇偶校驗數(shù)據(jù) （6.25%），JEDEC 給出了 9 位單糾錯碼（SEC）和 7 位循環(huán)冗余校驗（CRC）的示例實現(xiàn)。總體而言，GDDR7 片上 ECC 應(yīng)該能夠糾正 100% 的 1 位錯誤，并檢測 100% 的 2 位錯誤——在極少數(shù) 3 位錯誤的情況下，檢測率降至 99.3%。有關(guān)內(nèi)存錯誤的信息也通過JEDEC所說的片上ECC透明協(xié)議提供給內(nèi)存控制器。雖然在技術(shù)上與ECC本身是分開的，但GDDR7還引入了另一個內(nèi)存可靠性功能，即命令地址與命令阻塞（CAPARBLK）的奇偶校驗，旨在提高命令地址總線的完整性。

此外，雖然加入片上 ECC 對消費(fèi)類顯卡的影響不會超過對 DDR5 內(nèi)存和消費(fèi)類平臺的影響，但這對工作站和服務(wù)器顯卡意味著什么還有待觀察。工作站和服務(wù)器顯卡供應(yīng)商在無保護(hù)內(nèi)存上使用軟 ECC 已經(jīng)有好幾代了；GDDR7 顯卡大概也會如此，但與 CPU 領(lǐng)域相比，軟 ECC 的常規(guī)使用會讓事情變得更加靈活。

最后，GDDR7 還引入了一系列其他與可靠性相關(guān)的功能，主要與幫助 PAM3 運(yùn)行有關(guān)。這包括具有眼圖掩蔽和錯誤計數(shù)器的核心獨(dú)立 LFSR（線性反饋移位寄存器）訓(xùn)練模式。LFSR 訓(xùn)練模式用于測試和調(diào)整接口（以確保效率），眼圖掩蔽評估信號質(zhì)量，錯誤計數(shù)器跟蹤訓(xùn)練期間的錯誤數(shù)量。

撇開技術(shù)問題不談，此次發(fā)布公告包括了來自多方所有常規(guī)參與者的支持聲明，其中包括 AMD 和 NVIDA，以及美光/三星/SKhynix 三巨頭。不言而喻，鑒于 GDDR7 將帶來的內(nèi)存容量和帶寬提升，各方都熱衷于使用或銷售 GDDR7--尤其是在這個任何針對 AI 市場的產(chǎn)品都熱銷的時代。

目前尚未公布具體產(chǎn)品，但由于三星和美光此前已宣布打算在今年推出 GDDR7 內(nèi)存，因此我們應(yīng)該會在今年晚些時候看到新的內(nèi)存，以及與其配對的新 GPU。

來源：EETOP編譯自anandtech

參考鏈接：

https://www.anandtech.com/show/21287/jedec-publishes-gddr7-specifications-pam3-ecc-higher-density

關(guān)鍵詞： GDDR7 PAM PAM3