AMD這回真要打破英偉達CUDA壟斷!
2025-09-17 10:52:16 EETOPAMD 已啟動 ROCm 7 軟件棧的發布籌備工作。該套件此前被廣泛宣傳為打破 NVIDIA CUDA"壟斷生態" 的關鍵。
AMD ROCm 7 軟件堆棧
AMD 在 GitHub 上部署 ROCm 7 相關資源,預計數周內正式發布
NVIDIA 在 AI 領域占據主導地位的重要原因之一,在于其 CUDA 軟件棧的存在。這套專為 AI 開發者設計的工具鏈因硬件獨占性,讓 AMD 等競爭對手難以切入。而在 Advancing AI 大會上,AMD 宣布推出下一代 ROCm 7.0 軟件棧,稱其將通過增強框架與全新算法,打造可替代 CUDA 的計算生態系統。如今,該套件的發布工作已正式啟動。
據 Phoronix 報道,AMD 已在 GitHub 上部署 ROCm 7.0 的發布標簽,包括 ROCm/hip 和 ROCm/aomp 倉庫中的 "rocm-7.0.0" 標簽,同時 HIP、AOMP 及 ROCm 庫的 7.0.0 版本標簽也已公開,表明發布計劃進入倒計時。這或將成為 AMD 的重要里程碑。在 Advancing AI 大會上,AMD 披露了 ROCm 7 的多項重大升級,下文將展開說明。
在比較 Nvidia B1 和 AMD Instinct MI8X 的演示中,屏幕上顯示“DeepSeek R8 FP355 吞吐量”。
AMD 強調,這套升級后的計算棧主要聚焦推理工作負載。與 ROCm 6 相比,其 AI 任務性能提升達 3.5 倍。更值得關注的是 "加速訓練性能"——Instinct MI355X 在 DeepSeek R1 模型中實現了比 NVIDIA Blackwell B200 高 30% 的 FP8 吞吐量,訓練速度更勝一籌。核心升級包括: