通過電源完整性測試提高 AI 數據中心的能源效率
2024-08-01 14:52:53 Christopher Loberg基于人工智能的技術正在數據中心部署。處理器密集型服務器正在推高能源需求。下表說明了影響的程度。國際能源署 (IEA) 預測,到 2030 年,數據中心將占全球電力消耗的 7%;這個數字相當于整個印度國家的用電量。
隨著對電力的需求不斷增長,對能源效率的重視至關重要。與備受認可的電力完整性專家史蒂夫·桑德勒(Steve Sandler)合作;泰克開發了良好的測量技術,以提高下一代 AI 數據中心的運營/瓦特。
PDN 必須為驅動這些服務器機架中 GPU 的敏感負載提供許多低噪聲直流電源軌。追求更高的速度和更高的密度意味著更快的邊沿速率、更高的頻率和更多的電源軌,但電壓水平更低,電流更高,如上圖所示。這強調了良好的電源完整性。
進行電源完整性測量的目的是驗證在所有預期工作條件下到達負載點 (POL) 的電壓和電流是否符合負載的電源軌規格。在GHz頻率下,需要特別注意精確測量電源軌噪聲的毫伏。讓我們看一下如何通過基于服務器的系統上的配電網絡的高級視圖來評估 PDN 性能。
圖 2:數據中心的高級配電網絡
如圖所示,典型的數據中心通過 12、24 或 48 V DC 電源為其基于 AI 的服務器供電,然后將其轉換為主板上的其他電源電壓。工程師能夠查看從電源輸出到 FPGA、處理器和其他復雜 IC 的鏈條中的每個環節,因此必須將電源軌阻抗管理在非常低的水平,以便提供由 GPU 技術驅動的以 AI 為中心的服務器中的高電流。使阻抗管理復雜化的是,網絡由許多阻抗組成,包括穩壓器、去耦電容器和PCB走線。高速交換和熱插拔服務器卡會帶來意想不到的阻抗變化,從而導致過多的瞬變或噪聲。
要確保穩定、節能的設計,首先要將 PDN 中的噪聲降至最低。電源軌上的噪聲規格可以上升到MHz或GHz頻率范圍,幅度以毫伏為單位。
評估能效首先要對交流線路輸入和輸出進行電能質量測量,以確保線路電壓和線路電流。評估質量的測量值如下所示:
· 頻率
· RMS 電壓和電流
· 阻抗
· 波峰因數(電壓和電流)
· 真實功率、無功功率和視在功率
· 功率因數和相位
確保這些測量準確無誤;示波器探頭的選擇很重要;使用差分探頭測量系統的線路電壓,使用電流探頭測量系統的線路電流。
另一個關鍵測量是對PDN的控制環路響應進行頻率響應分析。這將提供有關控制回路速度和電源穩定性的寶貴信息。波特圖用于查看分析,圖 3 中的設置示例如下。
圖 3:配電網中阻抗的測量設置。
電源完整性探測系統值得關注
當今示波器附帶的高阻抗 10X 無源探頭可能具有足夠的帶寬,但它們會衰減您嘗試測量的噪聲信號。1X探頭通過噪聲信號而不衰減,但它們被限制在幾個MHz帶寬內。輸入阻抗為 50 Ω的傳輸線探頭或電纜具有出色的高頻性能,但在直流時會造成很大的負載,除非添加直流模塊。 衰減傳輸線探頭提供更少的負載,同時保持低噪聲和高帶寬。
電源軌探頭是另一類探頭,可在高達 4 GHz 的頻率下提供低噪聲和高失調范圍,直流失調范圍為 -60 至 +60 Vdc。在識別噪聲源方面,這被視為傳統無源探頭的更準確替代方案;如下圖 4 所示。根據電源軌的電壓,可能需要一個直流塊。如果是這種情況,請確保它為示波器提供浪涌保護,并且對直流或交流偏置不敏感。電源軌探頭雖然噪聲非常低,但也是單端的。為此,請尋找能夠進一步減小測量接地環路誤差的同軸隔離器。Picotest提供一系列直流模塊和同軸隔離器來滿足這些需求。了解有關終極電源軌噪聲測量的更多信息。
圖 4:使用無源探頭(下圖)和電源軌探頭(上圖)對紋波的電源線測量比較。看到區別了嗎?
快速、低噪聲采集與超快邊緣負載相結合,可模擬 AI 級處理器工作負載;允許準確評估 PDN 設計中的電源軌噪聲電壓和電源軌到電源軌串擾。與泰克 5 系列 B MSO 或 6 系列 B MSO 示波器結合使用;Picotest 提供高達 2,000 安培、1ns 邊緣負載的完整負載系列,支持高達 65MS/s 的采樣率,以實現精確的仿真工作。(見圖5)
圖5.顯示 AI 級處理器高振幅負載的偽隨機步長的表征。這種表征的準確性是通過使用 Picotest 負載實現的,并由泰克 6 系列 B MSO 示波器測量,非常適合低噪聲和高分辨率信號捕獲。
識別和分析 PDN 中的故障點可能需要一些時間。在供電網絡中尋找紋波、過沖、欠沖、導通、關斷、時間趨勢、建立時間和抖動是一項復雜的工作。值得慶幸的是,當今大多數現代示波器都提供內置分析軟件來設置儀器并自動進行信號采集和顯示。下面是一個顯示紋波自動測量的示例。將其內置到儀器中,并能夠從遠程 PC 自動執行,從而簡化了大型團隊的工作,以評估 AI 支持的性能隨時間和溫度變化的變化,從而強調服務器的效率和耐用性。
圖 6:5 系列 B MSO 示波器顯示器右側的帶注釋的自動紋波測量結果。
總結
隨著人工智能 (AI) 推高下一代數據中心的能源需求;評估供電網絡的性能和效率變得比以往任何時候都更加重要。擁有良好的 PDN 評估測試和測量策略將導致數據中心在性能、可靠性和能源效率方面實現最佳功能、人工智能就緒。