NVIDIA采用RISC-V開發可擴展深度神經網絡加速器
2019-06-19 13:18:19 EETOP
NVIDIA稱深度神經網絡需要高性能、運算準確以及一定的功耗要求,構建一款深度神經網絡加速器通常比較難而且制造成本高。所以他們通過使用低功耗、高帶寬的芯片互聯技術將單個具有各種計算能力的推理加速器芯片連接起來。NVIDIA在一個芯片中集成了16個通過芯片內部網絡連接的用于深度學習運算的處理元件(Processing Elements,PE)以及一個采用RISC-V指令集的控制器,而單個芯片最高可以提供4.01TOPS(每秒萬億操作),而NVIDIA的研究人員通過芯片間網絡連接最高36個芯片,最高提供128TOPS的算力。
除了NVIDIA公布的芯片算力外,其研究人員在論文中還提供了芯片的面積等信息。在采用臺積電16nm工藝的情況下,單芯片累積核心面積為3.1平方毫米,而累積Die面積為6平方毫米,核心功耗在0.03W到4W。而36芯片(6×6規格)累積核心面積為111.6平方毫米,Die累積面積為216平方毫米,核心功耗在5W到100W之間(跨度有些大)。
不過即便其多芯片互聯功耗比較高,但根據NVIDIA論文中的表述,其36芯片互聯最高效率達到了1.15TOPS每平方毫米,表現非常出色。但遺憾的是,NVIDIA應該沒有打算推出這款芯片,僅僅是作為展示其高效能芯片設計,將來NVIDIA可能其中的設計思路融入其產品中。
摘要下載地址:
https://research.nvidia.com/sites/default/files/pubs/2019-06_A-0.11-pJ/Op%2C//C24_1.pdf