99精品在线观看-99精品在线免费观看-99精品在线视频观看-99精品这里只有精品高清视频-99九九精品国产高清自在线

x

Habana Gaudi2性能穩(wěn)超英偉達(dá)A100,助力實(shí)現(xiàn)高效AI訓(xùn)練

2022-07-07 13:17:40 英特爾
點(diǎn)擊關(guān)注->創(chuàng)芯網(wǎng)公眾號,后臺告知EETOP論壇用戶名,獎勵200信元

近日,英特爾宣布Habana? Gaudi?2深度學(xué)習(xí)處理器MLPerf行業(yè)測試中表現(xiàn)優(yōu)于英偉達(dá)A100提交的AI訓(xùn)練時間,結(jié)果突顯了5月在英特爾On產(chǎn)業(yè)創(chuàng)新峰會上發(fā)布Gaudi2處理器在視覺(ResNet-50)和語言(BERT)模型上訓(xùn)練時間的優(yōu)勢

英特爾公司執(zhí)行副總裁兼數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理 Sandra Rivera表示:非常高興能與大家分享Gaudi 2MLPerf基準(zhǔn)測試中的出色表現(xiàn),也為英特爾團(tuán)隊(duì)在產(chǎn)品發(fā)布一個月取得的成就感到自豪。我們相信,在視覺和語言模型中提供領(lǐng)先的性能能夠?yàn)榭蛻魩韮r值,有助于加速其AI深度學(xué)習(xí)解決方案。

借助Habana LabsGaudi平臺,英特爾數(shù)據(jù)中心團(tuán)隊(duì)能夠?qū)W⒂?a href="http://www.xebio.com.cn/ai" target="_blank" class="keylink">深度學(xué)習(xí)處理器技術(shù),讓數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師得以高效地進(jìn)行模型訓(xùn)練,并通過簡單的代碼實(shí)現(xiàn)新模型構(gòu)建或現(xiàn)有模型遷移,提高工作效率的同時降低運(yùn)營成本。

Habana Gaudi2處理器在縮短訓(xùn)練時間(TTT)方面相較第一代Gaudi有了顯著提升。Habana Labs20225月提交的Gaudi2處理器視覺和語言模型訓(xùn)練時間上已超越英偉達(dá)A100-80GMLPerf測試結(jié)果。其中,針對視覺模型ResNet-50,Gaudi2處理器TTT結(jié)果相較英偉達(dá)A100-80GB縮短了36%,相較戴爾提交的同樣針對ResNet-50BERT模型采用8個加速器的A100-40GB服務(wù)器,Gaudi2TTT測試結(jié)果則縮短了45%。

圖片25.png

圖片26.png

intelone="" font-size:="">MLCommons發(fā)布的數(shù)據(jù),intelone="">2022intelone="">6月。intelone="" font-size:="" color:="">https://mlcommons.org/en/training-normal-20/

 

相比于第一代Gaudi處理器Gaudi2ResNet-50模型的訓(xùn)練吞吐量提高了3倍,BERT模型的訓(xùn)練吞吐量提高了4.7倍。這些歸因于制程工藝從16納米提升至7納米、Tensor處理器內(nèi)核數(shù)量增加了三、增加GEMM引擎算力、封裝的高帶寬存儲容量提升了三倍、SRAM帶寬提升以及容量增加一倍。對于視覺處理模型的訓(xùn)練,Gaudi2處理器集成了媒體處理引擎,能夠獨(dú)立完成包括AI訓(xùn)練所需的數(shù)據(jù)增強(qiáng)壓縮預(yù)處理。

兩代Gaudi處理器的性能都是在沒有特殊軟件操作的情況下通過Habana客戶開箱即用的商業(yè)軟件棧實(shí)現(xiàn)的。

通過商用軟件所提供的開箱即用性能,Habana 8GPU服務(wù)器與HLS-Gaudi2參考服務(wù)器上進(jìn)行測試比對。其中,訓(xùn)練吞吐量來自于NGCHabana公共庫的TensorFlow docker,采用雙方推薦的最佳性能參數(shù)在混合精度訓(xùn)練模式下進(jìn)行測量。值得注意的是,吞吐量是影響最終訓(xùn)練時間收斂的關(guān)鍵因素。

圖片27.png

圖形測試配置詳見說明部分。

intelone="" font-size:="" color:=""> 圖片28.png

圖形測試配置見說明部分。

除了Gaudi2MLPerf測試中的卓越表現(xiàn)第一代Gaudi128個加速器和256個加速器的ResNet基準(zhǔn)測試中展現(xiàn)了強(qiáng)大的性能和令人印象深刻的近線性擴(kuò)展,支持客戶高效系統(tǒng)擴(kuò)展。

Habana Labs首席運(yùn)營官Eitan Medina表示:我們最新的MLPerf測試結(jié)果證明Gaudi2在訓(xùn)練性能方面顯著優(yōu)勢。我們將持續(xù)深度學(xué)習(xí)訓(xùn)練架構(gòu)和軟件創(chuàng)新,打造最具性價比AI訓(xùn)練解決方案。

 

關(guān)于MLPerf基準(zhǔn)測試MLPerf社區(qū)旨在設(shè)計公平且極具實(shí)際價值的基準(zhǔn)測試,以公平地測量機(jī)器學(xué)習(xí)解決方案的準(zhǔn)確度、速度和效率。該社區(qū)由來自學(xué)術(shù)界、研究實(shí)驗(yàn)室和業(yè)界的AI領(lǐng)導(dǎo)者創(chuàng)建,他們確立基準(zhǔn)并制定了一套嚴(yán)格的規(guī)則,以確保所有參與者均能夠公平公正地進(jìn)行性能比對。基于一套明確的規(guī)則,以及能夠?qū)Χ说蕉巳蝿?wù)進(jìn)行公平比較,目前MLPerfAI行業(yè)唯一可靠的基準(zhǔn)測試。此外,MLPerf基準(zhǔn)測試結(jié)果要經(jīng)過為期一個月的同行評審,這進(jìn)一步驗(yàn)證報告結(jié)果。

 

說明:

ResNet-50性能對比中使用的測試配置

A100-80GBHabana20224月在Azure實(shí)例Standard_ND96amsr_A100_v4上進(jìn)行測量,使用了一個A100-80GB,其中應(yīng)用了NGCTF docker 22.03-tf2-py3optimizer=sgd, BS=256

A100-40GBHabana20224月在DGX-A100上進(jìn)行測量,使用了一個A100-40GB,其中應(yīng)用了NGCTF docker 22.03-tf2-py3optimizer=sgd, BS=256

V100-32GB?Habana20224月在p3dn.24xlarge上進(jìn)行測量,使用了一個V100-32GB,其中應(yīng)用了NGCTF docker 22.03-tf2-py3optimizer=sgd, BS=256

Gaudi2Habana20225月在Gaudi2-HLS系統(tǒng)上進(jìn)行測量,使用了一個Gaudi2,其中應(yīng)用了SynapseAI TF docker 1.5.0BS=256

結(jié)果可能有所不同。

BERT性能對比中使用的測試配置 

A100-80GBHabana20224月在Azure實(shí)例Standard_ND96amsr_A100_v4上進(jìn)行測試,使用了一個A100-80GB,包含NGCTF docker 22.03-tf2-py3Phase-1Seq len=128BS=312,accu steps=256Phase-2seq len=512BS=40,accu steps=768 

A100-40GBHabana20224月在DGX-A100上進(jìn)行測試,使用了一個A100-40GB,包含NGCTF docker 22.03-tf2-py3Phase-1Seq len=128,BS=64accu steps=1024;Phase-2seq len=512,BS=16accu steps=2048

V100-32GBHabana20224月在上p3dn.24xlarge進(jìn)行測試,使用了一個V100-32GB,包含NGCTF docker 21.12-tf2-py3Phase-1Seq len=128,BS=64,accu steps=1024;Phase-2seq len=512,BS=8accu steps=4096

Gaudi2Habana20225月在上Gaudi2-HLS進(jìn)行測試,使用了一個Gaudi2,包含SynapseAI TF docker 1.5.0Phase-1Seq len=128,BS=64,accu steps=1024;Phase-2seq len=512,BS=16accu steps=2048

結(jié)果可能有所不同。

 

Habana Labs、Habana、Habana標(biāo)識、GaudiSynapseAIHabana Labs的商標(biāo)。

 

關(guān)于英特爾

英特爾NASDAQ: INTC)作為行業(yè)引領(lǐng)者,創(chuàng)造改變世界的技術(shù),推動全球進(jìn)步并讓生活豐富多彩。在摩爾定律的啟迪下,我們不斷致力于推進(jìn)半導(dǎo)體設(shè)計與制造,幫助我們的客戶應(yīng)對最重大的挑戰(zhàn)。通過將智能融入云、網(wǎng)絡(luò)、邊緣和各種計算設(shè)備,我們釋放數(shù)據(jù)潛能,助力商業(yè)和社會變得更美好。


關(guān)鍵詞:

  • EETOP 官方微信

  • 創(chuàng)芯大講堂 在線教育

  • 半導(dǎo)體創(chuàng)芯網(wǎng) 快訊

全部評論

主站蜘蛛池模板: 久久99视频| 国产成人久久久精品毛片| 自拍第一页| 久草在线观看首页| 在线看一区| 欧美黄色片免费观看| 国产精品久久现线拍久青草| 51精品资源视频在线播放| 国模沟沟一区二区三区| 青草视频久久| 亚洲精品高清视频| 黄色中文字幕在线观看| 国产精品宅男在线观看| 免费片| 五夜婷婷| 久久夜色精品| 免费网站看v片在线观看| 国产凹凸一区在线观看视频| 品爱网在线观看视频免费视频| 99热这里只有精品88| 国产色视频一区二区三区| 免费国产片| 琪琪五月天综合婷婷| 亚洲国产欧美日韩一区二区| 97精品在线| www.大香| 人成精品| 九九免费高清在线观看视频| 日本一级黄色| 日韩a一级欧美一级在线播放| 亚洲成人黄色片| 国产永久福利| 国产福利一区二区在线精品| 美女免费视频网站| 特级片在线观看| 黄色一毛片| 黄色片一级黄色片| 黄色三级在线| 黄色一级性生活视频| 黄色大片一级| 美国一级大黄一片免费的网站|