突破單個設施物理限制!博通推出百公里超遠數據中心網絡芯片!
2025-08-05 08:34:55 EETOP博通今日宣布,一款支持多數據中心規模分布式 AI 工作負載的新型高容量互連設備已正式商用。這款名為 Jericho4 的以太網結構路由器隸屬于該公司的 DNX 產品線,據稱能夠實現可跨 100 公里及以上距離的分布式計算集群。博通設計這款設備的初衷是服務于 AI 訓練和推理工作負載,讓原本分散的系統能在區域性數據中心范圍內實現統一協同運作。這款新解決方案據稱實現了突破單個設施物理限制的計算可擴展性。
以下讓我們以深入了解這款新解決方案。
博通打造的 Jericho4 能夠安全互連地理上分散的數據中心內超過 100 萬個各類處理器(XPUs),將 AI 計算架構的覆蓋范圍拓展至單個設施的物理與功率限制之外。
“我們的客戶正著眼于數百萬個 GPU,” 謝弗表示,“這正是我們助力他們解決的問題。”
每個系統最多支持 36,000 個端口,每個端口通過博通專有 HyperPort 接口可提供 3.2 太比特每秒(Tbps)的帶寬 —— 這是一種專為長距離、高吞吐量 AI 數據傳輸打造的全新架構。
這一技術針對傳統多 800G 端口上的 ECMP 負載均衡方法的缺陷而設計 —— 此類方法因哈希沖突和流量分配不均會導致效率低下,而在 “大象流”(大流量)占主導的 AI 工作負載中,這一問題尤為突出。HyperPort 通過增加有效流量寬度和提升端口級鏈路利用率來緩解這些問題。博通稱,相較于 800GE 方案,其帶寬利用率提升高達 70%,這意味著設施間數據傳輸更快、任務完成時間更短,且無需改動現有光學器件或物理基礎設施即可提升整體系統性能。
Jericho4 的一大顯著特性是將融合以太網 RDMA(RoCE)的支持范圍拓展至 100 公里以上的距離。
在長距離以太網鏈路上維持無丟包傳輸,是標準數據中心交換機設計未能解決的難題。
“RoCE 必須做到無丟包,否則就無法正常工作,也就不再是 RoCE 了,” 謝弗表示,“如果不采用像 Jericho 這樣的解決方案,長距離支持可能會成為一個致命障礙。”
博通通過基于高帶寬內存(HBM)的集成深度緩沖技術解決了這一問題,使路由器能夠吸收擁塞,而不會將優先級流控制(PFC)事件擴散到相鄰的數據中心域。通過這種方式,Jericho4 能將長距離擁塞影響與本地計算架構隔離開來,確保在突發 AI 工作負載下保持穩定性和吞吐量。
Jericho4 將 RoCE 的部署范圍拓展至 100 公里以上
除緩沖和擁塞管理外,Jericho4 還在每個端口集成了線速 MACsec 加密功能,以保障設施間的流量安全。值得注意的是,MACsec 通過硬件實現,不會造成性能損耗,因此無論加密是否啟用,吞吐量都保持一致。
與專有互連技術不同,Jericho4 遵循超以太網聯盟(UEC)的規范,確保能與日益增長的 UEC 兼容網卡(NIC)、交換機和軟件棧生態系統協同工作。博通在 HyperPort 接口中保留了以太網數據包結構,以簡化與現有軟件定義網絡棧和監控工具的集成。這為運營者提供了一套跨本地和區域域的統一、基于標準的架構。
這種符合標準的方案也使博通的技術成為未來開放式架構的可擴展基礎,尤其當超大規模數據中心運營商尋求通過通用編程和管理框架來統一分布式基礎設施時,這一優勢更為凸顯。
“任何正在開發加速器的企業,現在都可以采用這一規范,在其加速器中集成基于以太網的小芯片(chiplet),從而與任何以太網交換機相連,” 西拉杰表示。
互操作性簡化了采購和部署流程,同時降低了供應商鎖定風險,這讓 Jericho4 對正在制定長期 AI 基礎設施路線圖的客戶具有很強的吸引力。
據博通介紹,Jericho4 與該公司的 Tomahawk 和 Trident 平臺形成互補,填補了廣域、橫向擴展互連的角色空白。Tomahawk Ultra 和 Tomahawk 6 專注于機架內和設施內互連,強調超低延遲和大交換容量,而 Jericho4 則實現設施間連接,同時保持相同的管理模式和路由策略。基于 Jericho4 的完整架構可作為單一邏輯路由器運行,簡化了分布式系統的管理復雜性。
Jericho4、Tomahawk6 與 Tomahawk-Ultra 的靈活部署組合
這種統一的架構理念使系統設計人員能根據延遲、規模和地理限制,靈活組合 Tomahawk 和 Jericho 系列產品。博通稱,Jericho4 基于相同的核心芯片,可構建容量高達 51.2Tbps 的固定形態或機箱式路由器。該平臺還支持靈活的拓撲結構,適用于中央交換平面、模塊化架構元件或分布式計算節點互連。
博通將 Jericho4 視為以太網走向成熟的標志 —— 它已成為足以支撐最嚴苛 AI 工作負載的傳輸技術。曾經,InfiniBand 或專有架構在橫向擴展領域占據主導地位,而博通的 “以太網優先” 戰略則為跨 AI 與非 AI 領域的統一基礎設施提供了可行路徑。