99精品在线观看-99精品在线免费观看-99精品在线视频观看-99精品这里只有精品高清视频-99九九精品国产高清自在线

x

面向未來的PCI-Express交換機(jī)推理服務(wù)器

2025-03-28 11:40:38 EETOP
點(diǎn)擊關(guān)注->創(chuàng)芯網(wǎng)公眾號(hào),后臺(tái)告知EETOP論壇用戶名,獎(jiǎng)勵(lì)200信元

點(diǎn)擊關(guān)注半導(dǎo)體創(chuàng)芯網(wǎng),后臺(tái)告知EETOP論壇用戶名,獎(jiǎng)勵(lì)200信元

在數(shù)據(jù)中心系統(tǒng)的發(fā)展歷程中,能被英偉達(dá)選為其人工智能系統(tǒng)的組件供應(yīng)商,這無疑是至高無上的贊譽(yù)。

這也正是新興互連芯片制造商阿斯特拉實(shí)驗(yàn)室(Astera Labs)感到頗為得意的原因。該公司正與博通(Broadcom)和美滿電子(Marvell)等公司在 PCI-Express 交換機(jī)、PCI-Express 重定時(shí)器以及 CXL 內(nèi)存控制器等領(lǐng)域展開競(jìng)爭。英偉達(dá)認(rèn)可其即將推出的使用Blackwell GPU 加速器的服務(wù)器節(jié)點(diǎn),采用阿斯特拉實(shí)驗(yàn)室的 PCI-Express 6.0 交換機(jī)和重定時(shí)器,將 X86 GPUBlackwell GPU 相連,在某些情況下還會(huì)連接網(wǎng)絡(luò)接口卡和存儲(chǔ)設(shè)備。

MGX 是一套服務(wù)器參考設(shè)計(jì),它構(gòu)成了英偉達(dá)自身人工智能服務(wù)器的基本架構(gòu),原始設(shè)備制造商(OEM)和原始設(shè)計(jì)制造商(ODM)也會(huì)基于此進(jìn)行復(fù)刻,以便分得一杯羹。

在上周舉行的 2025 年 GPU 技術(shù)大會(huì)(GPU Technical Conference 2025)上,阿斯特拉實(shí)驗(yàn)室做了兩件事。首先,該公司展示了其 “天蝎座”(Scorpio)P 系列 PCI-Express 6.0 結(jié)構(gòu)交換機(jī)和 “白羊座”(Aries)PCI-Express 6.0 重定時(shí)器,與英偉達(dá)的 Hopper H100 和 H200 GPU,以及用于 HGX 配置的各種Blackwell B100 和 B200 GPU 之間的互操作性(大家熟悉的雙 CPU 搭配八 GPU 的設(shè)計(jì),如今Hopper 架構(gòu)的被稱為 HGX NVL8,Blackwell 架構(gòu)的則叫 DGX NVL16)。其次,阿斯特拉實(shí)驗(yàn)室展示了一款由 ODM 服務(wù)器制造商緯創(chuàng)(Wistron)設(shè)計(jì)的推理服務(wù)器,該服務(wù)器基于Hopper GPU,并使用阿斯特拉的交換機(jī)和重定時(shí)器將各個(gè)組件連接在一起。

目前還完全不清楚英偉達(dá)自身在其系統(tǒng)中哪些地方使用了阿斯特拉的芯片,我們只是借這一消息來了解一下阿斯特拉所提供的產(chǎn)品。不過,英偉達(dá)硬件工程副總裁安德魯?貝爾(Andrew Bell)確實(shí)在一份聲明中表示,“天蝎座” 交換機(jī)已集成到 “基于Blackwell的 MGX 平臺(tái)” 中,所以就是這樣。基于數(shù)字信號(hào)處理器(DSP)的 “白羊座” 重定時(shí)器雖未被提及,但如果你需要擴(kuò)展 PCI-Express 5.0 或 6.0 鏈路以拉開組件之間的距離,同樣也需要這類設(shè)備。

從概念上講,整個(gè)架構(gòu)是這樣的:

1.jpg

在上述圖表的中心,結(jié)構(gòu)可以是任何 PCI-Express 交換機(jī),但阿斯特拉無疑更希望是自家的 “天蝎座” 交換機(jī),它也展示了這一點(diǎn)。使用來自兩個(gè)不同供應(yīng)商的開關(guān)和重定時(shí)器可能會(huì)帶來麻煩。

如你所見,你可以使用重定時(shí)器將 GPU 連接到網(wǎng)絡(luò)或存儲(chǔ)結(jié)構(gòu),以及另一個(gè)用于直接將 GPU 相互連接的 PCI-Express 結(jié)構(gòu),這與英偉達(dá)使用 NVLink 端口和 NVSwitch 交換機(jī)的方式非常相似。目前,對(duì)于 GPU 加速器而言,這種 PCI-Express 結(jié)構(gòu)上不存在內(nèi)存尋址功能,但這正是由 AMD、博通、思科系統(tǒng)(Cisco Systems)、谷歌(Google)、慧與(Hewlett Packard Enterprise)、英特爾(Intel)、Meta Platforms和微軟(Microsoft)牽頭開展的超高速加速器鏈路(UALink)項(xiàng)目的目標(biāo)所在。

“天蝎座” P 系列交換機(jī)用于將 CPU 連接到 GPU、網(wǎng)絡(luò)接口和存儲(chǔ)設(shè)備,“天蝎座” 交換機(jī)還有另一個(gè)版本,即 X 系列,用于創(chuàng)建 GPU 網(wǎng)格,這與英偉達(dá)的 NVSwitch 的作用類似,顯然其帶寬要低得多。這款 X 系列芯片需要定制化的合作項(xiàng)目,不出所料,在 2025 年的 GPU 技術(shù)大會(huì)上,阿斯特拉絕對(duì)不會(huì)提及這款芯片

P 系列和 X 系列交換機(jī)都向后兼容一直到 PCI-Express 1.0 的設(shè)備。

就 PCI-Express 6.0 而言,以下是阿斯特拉與英偉達(dá)共同測(cè)試的內(nèi)容:

圖片

在這種情況下,是一條 PCI-Express 6.0 x16 鏈路,將 “白羊座” 重定時(shí)器連接到Blackwell GPU,以擴(kuò)展 PCI-Express 鏈路的范圍。機(jī)箱內(nèi)的 “天蝎座” P 系列交換機(jī)連接到英特爾至強(qiáng) 5.0 處理器和英偉達(dá) ConnectX-7 網(wǎng)絡(luò)接口,速度降為 PCI-Express 5.0。美光科技(Micron Technology)的閃存驅(qū)動(dòng)器使用一條運(yùn)行在 PCI-Express 6.0 速度的單 x1 通道進(jìn)行存儲(chǔ)。“天蝎座” 交換機(jī)有 64 條 PCI-Express 6.0 信號(hào)通道,這種配置使用了其中的 49 條,其中 32 條以 PCI-Express 5.0 的半速運(yùn)行。

“天蝎座” P 系列交換機(jī)于 2024 年 9 月開始提供樣品,目前正在逐步擴(kuò)大量產(chǎn)規(guī)模。

阿斯特拉與 ODM 合作伙伴緯創(chuàng)展示的機(jī)器,是英偉達(dá) MGX H100/H200 NVL 推理服務(wù)器的一個(gè)具體實(shí)現(xiàn)。MGX 系列模塊化機(jī)器于 2023 年 5 月推出,其理念是將 GPU 加速應(yīng)用于不同類型的工作負(fù)載,并采用適合相應(yīng)用途的外形規(guī)格。

從概念上看,MGX 推理服務(wù)器是這樣的:

圖片

這是一個(gè) 4U 機(jī)架式機(jī)箱,后部有一個(gè)雙插槽 X86 服務(wù)器作為系統(tǒng)主機(jī),配備 PCI-Express 交換機(jī),連接到兩個(gè)BlueField 3數(shù)據(jù)處理單元(DPU,位于前方右側(cè))以及八個(gè) H100 或 H200 PCI-Express 5.0 GPU(位于前方,占據(jù)了大部分空間)。沒有 NVSwitch 內(nèi)存互連,但每張 GPU 卡上都有 NVLink 內(nèi)存端口,并且可以使用橋接器將兩個(gè)或四個(gè)相鄰的 GPU 連接成共享內(nèi)存配置,以便共享內(nèi)存并針對(duì)更大的內(nèi)存進(jìn)行計(jì)算。

這種 MGX 參考架構(gòu)還有其他配置,例如配備一個(gè)BlueField 3 DPU 和四個(gè) ConnectX-7 智能網(wǎng)卡,每兩個(gè) GPU 對(duì)應(yīng)一個(gè)智能網(wǎng)卡。

以下是每個(gè) “天蝎座” 交換機(jī)連接兩個(gè) GPU 和一個(gè)網(wǎng)卡的 MGX 推理系統(tǒng)原理圖:

圖片

每對(duì)通過 NVLink 橋接器連接的 GPU,都有一個(gè) ConnectX-7 網(wǎng)卡,用于與外部世界通信,并通過 “天蝎座” P 系列交換機(jī)進(jìn)行數(shù)據(jù)傳輸。我們推測(cè),這對(duì) GPU 也可以通過 “天蝎座” 交換機(jī)以 PCI-Express 6.0 速度進(jìn)行通信。如果 GPU 支持 PCI-Express 6.0,x16 通道的速度可達(dá) 256GB/秒;如果僅支持 PCI-Express 5.0,則速度只有 128GB/秒。

在主機(jī) CPUGPU 之間需要多少帶寬,以及 NVLink 非統(tǒng)一內(nèi)存訪問(NUMA)的級(jí)別(NVL2 或 NVL4),取決于你所進(jìn)行的人工智能類型。

這款 MGX 推理服務(wù)器設(shè)計(jì)的一個(gè)重要特點(diǎn)是它具有模塊化特性。(因此 MGX 中的 “M” 代表 “Modular”,即模塊化的 GPU,我們不確定 “X” 代表什么)

后部的主機(jī)計(jì)算和內(nèi)存板可以獨(dú)立于前部的 GPU / 網(wǎng)卡 / DPU 板進(jìn)行升級(jí)。例如,如果你在 GPU 計(jì)算板中使用了 “天蝎座” P 系列 PCI-Express 6.0 交換機(jī),那么目前可以在 PCI-Express 5.0 模式下運(yùn)行,并連接到任何現(xiàn)有的 X86 或 Arm 服務(wù)器節(jié)點(diǎn)。當(dāng)支持 PCI-Express 6.0 插槽的新處理器上市時(shí),再更換為新的服務(wù)器卡。如果你目前擁有帶有 PCI-Express 5.0 x16 插槽的較舊的Hopper GPU,現(xiàn)在也可以在這個(gè) MGX 設(shè)計(jì)中使用,未來某個(gè)時(shí)候再更換為新的支持 PCI-Express 6.0 的Blackwell GPU

以下是緯創(chuàng)實(shí)際的 “xWing” 推理服務(wù)器 GPU 系統(tǒng)板的樣子:

圖片

這種設(shè)計(jì)每個(gè) “天蝎座” 交換機(jī)連接兩個(gè) GPU,并且在板的左側(cè)有一個(gè)網(wǎng)卡插槽。

沒有一款 MGX 推理服務(wù)器設(shè)計(jì)能夠?qū)碛袛?shù)萬億參數(shù)的生成式人工智能(GenAI)模型進(jìn)行推理。但對(duì)于許多人工智能推理工作負(fù)載來說,它們的規(guī)模恰到好處。

原文:

https://www.nextplatform.com/2025/03/27/future-proofing-inference-servers-with-pci-express-switches/


關(guān)鍵詞: PCI-Express 交換機(jī) 服務(wù)器

  • EETOP 官方微信

  • 創(chuàng)芯大講堂 在線教育

  • 半導(dǎo)體創(chuàng)芯網(wǎng) 快訊

全部評(píng)論

主站蜘蛛池模板: 综合网婷婷| 日韩精品免费在线观看| 国产成人免费在线| 草草草网站| 高h文bl| 精品视频国产| zoofilia杂交videos新一| 国产精品视频大全| 亚洲第一久久| 亚洲婷婷丁香| 亚洲欧美影视| 亚洲精品一区二区三区香蕉在线看 | 日本特黄视频| 午夜一级毛片看看| 午夜国产精品久久久久| 毛片a级三毛片免费播放| 老司机成人免费精品视频| 亚洲欧美中日韩| 亚洲区视频| 中文国产成人精品久久一| 日韩视频一| 久色一区| 三级网站日本| 一区二区三区在线观看免费| 日韩中文字幕免费观看| 日韩大片免费看| 日本另类xxxx| 久久99精品视频| 一级黄色录像毛片| 99视频九九精品视频在线观看| 99xxoo视频在线永久免费观看| 91国在线| 亚洲激情视频| 欧美一区二区三区在线可观看| 嫩草免费视频| 国产一精品一aⅴ一免费| 国产挤奶水在线视频播放| 91麻豆国产在线观看| 黄色毛片前黄| 国产精品 视频一区 二区三区| 国产在线高清理伦片a|