被網友戲稱為“硅仙人”、曾從事 x86、Arm、MISC 和 RISC-V 處理器研究的傳奇處理器架構師Jim Keller本周末批評了 Nvidia 的 CUDA 架構和軟件棧,并將其與 x86 相提并論,稱其為沼澤。他指出,即使是 Nvidia 自己也有多個專用軟件包,出于性能考慮,這些軟件包依賴于開源框架。
凱勒在一篇 X 帖子中寫道:"CUDA 是沼澤,而不是護城河,x86 也曾沼澤。[...]CUDA并不美麗。它是通過一次次的堆砌而建立起來的"。

確實,就像x86一樣,CUDA在保持軟件和硬件向后兼容性的同時逐漸增加了功能。這使得Nvidia的平臺完整且向后兼容,但它影響了性能并使程序開發變得更加困難。同時,很多開源軟件開發框架可以比CUDA更高效地使用。“基本上沒有人編寫 CUDA,”凱勒在后續帖子中寫道。“如果你確實編寫 CUDA,它可能不會很快。[...] Triton、Tensor RT、Neon 和 Mojo 的存在是有充分理由的。”甚至 Nvidia 本身也有不完全依賴 CUDA 的工具。例如,Triton Inference Server 是 Nvidia 的一款開源工具,可簡化 AI 模型的大規模部署,支持 TensorFlow、PyTorch 和 ONNX 等框架。Triton 還提供模型版本控制、多模型服務和并發模型執行等功能,以優化 GPU 和 CPU 資源的利用率。Nvidia 的TensorRT是一種高性能深度學習推理優化器和運行時庫,可加速Nvidia GPU上的深度學習推理。TensorRT 從各種框架(例如 TensorFlow 和 PyTorch)中獲取經過訓練的模型,并對其進行優化以進行部署,從而減少延遲并提高圖像分類、對象檢測和自然語言處理等實時應用程序的吞吐量。 但是,盡管像Arm、CUDA 和x86這樣的架構可能會被認為是沼澤,因為它們的演進速度相對較慢、必須向后兼容并且體積龐大,但這些平臺也不像GPGPU這樣分散,這可能根本不是一件壞事。 前尚不清楚 Jim Keller 對 AMD 的ROCm和英特爾的OneAPI有何看法,但很明顯,盡管他花了很多年時間設計 x86 架構,但他并不迷戀其未來前景。他的言論還暗示,盡管他曾在世界上一些最大的芯片制造商工作過一段時間,包括蘋果、英特爾、AMD、博通、現在是Tenstorrent等公司,但我們可能不會在 Nvidia 的名單上看到他的名字。目前還不清楚吉姆·凱勒對 AMD 的 ROCm 和英特爾的 OneAPI 有何看法,但可以肯定的是,盡管他多年來一直在設計 x86 架構,但他并不看好其未來前景。他的言論還暗示,盡管他曾在蘋果、英特爾、AMD、Broadcom(以及現在的 Tenstorrent)等全球最大的芯片制造商工作過,但我們可能不會很快在 Nvidia 的花名冊上看到他的名字。