AMD大躍進:未來4年,能效提高30倍!
2021-09-30 12:21:31 EETOP編譯自tomshardwareAMD 今天宣布了一個極其雄心勃勃的目標:到 2025 年將其 EPYC CPU 和 Instinct GPU 加速器的能效提高 30 倍。AMD 自己也知道這是一個多么崇高的目標:該目標比典型的全行業效率提高 150%。
AMD 的新舉措緊隨其 2014 年至 2020 年的 20x25 計劃之后,在此期間該公司的筆記本電腦芯片的能效提高了 25 倍(特別是,這包括處理器空閑和負載時的效率)。
AMD 的新計劃專門針對 AI 和 HPC 工作負載,該公司的目標可能暗示其未來的硬件設計計劃。例如,AMD 計劃在努力實現新的功耗目標時提高性能,但它并不只是想在性能問題上投入更多的裸片面積(即更大的芯片)。相反,他們的想法是同步提高性能和每瓦性能,以實現性能和效率的提升。
與任何目標一樣,AMD 必須有一種方法來衡量其實現目標的進度。鑒于該公司專注于 AI 和 HPC 工作負載的性能,AMD 選擇了 FP16 或 BF16 FLOPS(具有 4k 矩陣大小的 Linpack DGEMM 內核 FLOPS),這意味著它使用通常用于 AI 訓練工作負載的數據類型。
AMD 使用具有四個 MI60 GPU 和一個 EPYC CPU(未指定型號)的現有系統(計算節點)的總體性能設定了基準性能測量。這已被定義為基準“2020 系統”。AMD 將使用具有相同數量 GPU 和 CPU 的新一代服務器節點來衡量里程碑。重要的是要了解 AMD 只需為 BF16 和 FP16 數據類型添加固定功能(硬件級)加速,就可以朝著其目標邁出一大步,從而獲得相對“容易”的性能和效率提升。例如,MI60 支持 FP16,但不支持 BF16。
AMD 表示,它將依靠硬件和軟件優化來實現其目標,但對我們在此過程中可以預期的硬件加速類型不置可否——該公司不會確認將添加固定功能的 BF16加速其 CPU 和 GPU。僅此添加就可以在目標工作負載中產生令人印象深刻的性能提升。此外,軟件優化通常會導致現有硬件的大規模改進,這意味著 AMD 有多種選擇來實現其目標。與 AMD 之前提高筆記本電腦效率的目標不同,該公司并未將空閑功耗測量納入其測試方法。相反,公司將使用這些工作負載的典型利用率(約 90%)乘以數據中心PUE(電源使用效率 - 數據中心效率的衡量標準)。AMD 表示,這產生的值與每瓦功率指標非常接近,但我們還沒有看到該公司用于計算的最終公式。
AMD 的能效目標是在對加速計算節點的處理需求大幅增加之后提出的,這些節點執行人工智能訓練、氣候預測、基因組學和大規模超級計算機模擬等功能。如果 AMD 實現其目標,該公司表示,這些系統的整體能耗將在五年內驚人地降低 97%。
AMD 執行副總裁兼首席技術官 MarkPapermaster表示:“提高處理器能效是 AMD 的長期設計優先事項,我們現在正在為使用我們的高性能 CPU 和加速器的現代計算節點設定一個新目標,用于人工智能訓練和高性能計算部署。專注于這些非常重要的細分市場,以及領先公司加強環境管理的價值主張,AMD在這些領域的30倍目標比前五年的行業能效表現高出150%。”
AMD 已經在其 CPU 和 GPU 設計上探索了大量的能效改進 - 以至于 AMD Zen CPU 實際上在性能/瓦特比方面擊敗了英特爾。該公司還對其RDNA 2 GPU 的功耗進行了大幅改進,從Nvidia手中奪得了能源效率的桂冠。這些改進的一部分可歸因于制造節點的跳躍,至少在 GPU 方面是這樣。然而,隨著更密集制造工藝的成本激增和研發時間的增加,AMD 顯然并不僅僅指望這些。
相反,諸如3D緩存堆疊(應用于RDNA 2芯片的Infinity Cache大大降低了功耗)等技術和越來越多的效率優先的工程方法將被要求。固定功能加速和軟件改進也將發揮很大作用。為了達到這一目標,AMD將尋求哪些技術,還有待觀察,但令人鼓舞的是,該公司顯然相信它能夠在未來四年內實現這種類型的改進。