99精品在线观看-99精品在线免费观看-99精品在线视频观看-99精品这里只有精品高清视频-99九九精品国产高清自在线

x

Hot Chips:IBM 用兩款新處理器解決生成式 AI 問題

2024-08-30 11:56:56 EETOP
點擊關注->創芯網公眾號,后臺告知EETOP論壇用戶名,獎勵200信元
在本周的 2024 年 Hot Chips 大會上,IBM 宣布了兩款新的 AI 處理器,即 Telum II 和 Spyre Accelerator。據該公司稱,這些處理器將驅動下一代 IBM Z 大型機系統,特別是增強 AI 功能,包括大型語言模型 (LLM) 和生成式 AI

image.png

IBM 的新處理器

IBM 設計的處理器保持了 IBM 大型機眾所周知的高安全性、可用性和性能級別。

Telum II 的架構創新

IBM 的 Telum II 處理器對其前身進行了顯著改進,具有更快的速度、更大的內存容量和新功能。

“我們設計了 Telum II,以便內核可以將 AI 操作卸載到模塊中其他七個相鄰處理器芯片中的任何一個,” IBM 微處理器設計師 Chris Berry 說。“它為每個內核提供了對更大 AI 計算池的訪問,從而減少了對 AI 加速器的爭用。”

處理器利用八個高性能內核,每個內核以固定的 5.5GHz 頻率運行,并具有集成的片上 AI 加速器。該加速器直接連接到處理器的 CISC 指令集,以實現低延遲 AI 操作。與依賴內存映射 I/O 的傳統加速器不同,Telum II 的 AI 加速器將矩陣乘法和其他 AI 基元作為本機指令執行,從而減少開銷并提高吞吐量。Telum II 中每個加速器的 AI 計算能力翻了兩番,達到每個芯片 24 TOPS。

圖片
Tellum II 處理器

處理器還大幅增加了緩存容量,每個內核都可以訪問 36 MB 的 L2 緩存,片上總計 360 MB。虛擬 L3 和 L4 緩存分別增長了 40%,達到 360 MB 和 2.88 GB。這些增強功能使 Telum II 能夠更高效地處理大型數據集,進一步支持其 AI 和事務處理能力。

Tellum 的數據處理單元

Telum II 處理器的顯著特點之一是其集成數據處理單元 (DPU)。

在 IBM 大型機每天處理數十億個事務的企業環境中,I/O 運營效率極為重要。因此,Telum II 中的 DPU 連貫地連接到處理器的對稱多處理 (SMP) 結構,并配備了自己的 L2 緩存。

DPU 架構包括四個處理集群,每個集群有 8 個可編程微控制器內核,總共 32 個內核。這些內核通過本地一致性結構互連,該結構在整個 DPU 中保持緩存一致性,并將其與主處理器集成。這種集成允許 DPU 直接在片上管理自定義 I/O 協議。

Berry 說:“通過將 DPU 放在 PCI 接口的處理器端,并實現 DPU 與運行主要企業工作負載的主處理器的連貫通信,我們可以最大限度地減少通信延遲并提高性能和能效。“整個系統的 I/O 管理功耗降低了 70%。”

此外,DPU 包括用于循環冗余校驗 (CRC) 加速的專用硬件和用于批量數據傳輸的專用數據路徑,因此緩存不會受到瞬態數據的污染。

Spyre 加速器:大規模增強 AI

與 Telum II 處理器相輔相成的是IBM Spyre 加速器,這是一款專用的 AI 芯片,旨在將 AI 功能擴展到僅靠主處理器所能實現的之外。

Spyre 加速器安裝在 75 W PCIe 適配器上,具有 32 個內核,每個內核具有 2 MB 的暫存器內存,片上總計 64 MB。與傳統緩存不同,此暫存器通過共同設計的軟硬件框架進行優化,可在 AI 計算期間實現高效的數據存儲和管理。

圖片
Spyre 加速器

Spyre 加速器支持大型語言模型和其他計算密集型 AI 工作負載。Spyre 在單個 I/O 模塊中的 8 個卡中提供高達 1 TB 的內存,使 IBM Z 系統能夠處理需要大量計算能力和內存帶寬的 AI 工作負載。加速器的核心支持 int4、int8、fp8 和 fp16 數據類型。在同時使用多個 Spyre 卡的情況下,系統可以擴展到 1.6 TB/s 的內存帶寬。

Telum II 和 Spyre Accelerator 之間的協同作用

據 IBM 稱,Telum II 和 Spyre 旨在以優化 AI 工作負載的方式在更大的大型機架構中協同工作。

Telum II 的片上 AI 加速器提供集成在主處理器中的即時、低延遲 AI 處理功能。相比之下,Spyre 加速器為更復雜的大規模 AI 模型提供了必要的額外、可擴展的 AI 計算能力。

IBM 聲稱,兩者之間的協同作用解鎖了集成 AI,其中多個 AI 模型(包括傳統模型和 LLM)被串聯使用。例如,較小、節能的模型可以處理大多數事務,而更復雜的模型則保留給需要更高置信度的情況。此策略提高了準確性并優化了資源使用情況。

推動下一代 IBM Z 大型機系統

Telum II 和 Spyre Accelerator 為 IBM 大型機的未來提供了強大的集成解決方案。

“我們目前正在構建一個測試系統,其中將包含 96 張 Spyre 卡,其中總共將具有 30 peta-ops 的 AI 推理和計算能力,”Berry 總結道。“這就是我們正在討論添加到下一代 IBM Z 中的額外 AI 計算的規模。”

EETOP編譯整理自allaboutcircuits


關鍵詞: HotChips IBM

  • EETOP 官方微信

  • 創芯大講堂 在線教育

  • 半導體創芯網 快訊

全部評論

主站蜘蛛池模板: 黄色国产精品| 国产大片喷水在线在线视频 | 午夜看一级特黄a大片黑| 欧美一级日韩一级| 国产视频日本| 黄色三级影院| 99久久精品国产综合一区| 久久久全国免费视频| 污在线观看| 亚洲邪恶天堂影院在线观看| 一级特黄特交牲大片| 日本特黄视频| 毛片小视频| 亚洲精国产一区二区三区| 免费看的黄色| 国内精品一区视频在线播放| 国产精品国产三级国产专区5o | 96一级毛片| 一级黄色毛片视频| 女人被男人狂躁下面在线观看| 亚洲国产日韩在线人成蜜芽| 免费视频黄| 欧美一级特黄aaaaaa在线看片| 国产在线观看高清不卡| 国产精品亚洲视频| 爱爱小说视频永久免费网站| 暧暧视频在线观看免费| 丁香狠狠色婷婷久久综合| 国产日本三级欧美三级妇三级四| 久久综合精品不卡一区二区| 片免费观看网站视频| 日日a.v拍夜夜添久久免费| 午夜欧美成人久久久久久| 亚洲精品国产成人中文| 亚洲午夜精品专区国产| 伊人激情网| 亚洲一区三区| 亚洲欧美一区二区三区在线播放| 一道精品视频一区二区三区图片| 97玖玖| 91成人高清在线播放|