99精品在线观看-99精品在线免费观看-99精品在线视频观看-99精品这里只有精品高清视频-99九九精品国产高清自在线

x

賽靈思推出業內首款PCIe 4 輕量級加速卡Alveo U50,部分應用可實現20倍加速

2019-08-13 12:56:02 EETOP
點擊關注->創芯網公眾號,后臺告知EETOP論壇用戶名,獎勵200信元
美國當地時間8月6日,賽靈思發布了一款名為Alveo U50的數據中心加速器卡,進一步將Alveo系列產品擴展到自適應性和智能計算領域。

 


據悉,Alveo U50是業界首款支持PCIe 4的輕量級自適應計算加速器,能夠在同一個可重配置的FPGA平臺上,增強各種關鍵計算、網絡和存儲工作負載。
 

許多種類的加速器,特別是那些帶有GPUFPGA的加速器,都可以用做相當強大的計算引擎,能夠滿足或超過現代處理器的功率、熱量和空間封裝。他們做的工作比CPU多得多,但這仍然不容易將它們部署到現有的商業服務器。
 

這就是為什么賽靈思推出Alveo U50加速器,這是一款低調的PCI-Express加速卡。該設備可以插入標準數據中心服務器,因此廣泛用于有助于計算加速的工作負載,包括機器學習推理,數據分析,視頻轉碼和財務分析,,以及加速存儲和網絡的內向型應用。
 

如果這聽起來類似于去年推出的Alveo卡- U200,U250和U280 ,但與其可以提供高達225瓦的雙插槽前代產品不同,U50已被拆卸為75瓦,單插槽,半高半長卡,幾乎可以安裝在任何服務器上。
 

Xilinx的數據中心營銷總監Jamon Bowen解釋說:“縮短的外形,使得U50可以用在更多的地方。”據Bowen說,雖然他們的客戶欣賞雙寬的200系列卡的性能,但他們希望能夠在標準服務器機箱中即擁有加速功能,又不需要特殊的電源或冷卻。
 

在性能方面,Bowen告訴我們U50保持了舊卡的吞吐量和低延遲。FPGA本身有872K查找表(LUT),而U200的查找表為892K, U250的查找表為1341K, U280的查找表為1082K。寄存器計數也同樣減少。但是,總的來說,對于U50的大多數應用來說,有很多FPGA資源可以利用。
 


這張卡實際上只在一個方面受到影響:內存容量。U50完全依賴于8Gb的封裝在HBM2的內存,沒有外部RAM來支持它。相比之下,200系列的顯卡最多可以配備64GB的DDR4。除了DDR4, 頂級的U280還配備了8GB的HBM2。

 

雖然較低的內存配置文件會讓U50在處理大型數據庫或構建神經網絡時顯得有些牽強,但許多目標應用程序都是基于流數據的,而在流數據中,大內存容量不是那么重要。然而,HBM2提供了更快的數據傳輸,在這種情況下,高達460 GB/s,大約是DDR4內存的6倍。這對于許多需要低延遲操作的面向數據流的工作負載來說是一個顯著的優勢。
 

U50上沒有外部存儲器可以節省大量功耗,這不僅僅是因為DDR4模塊不存在,而且還因為引腳和布線損耗更少。U50上的FPGA芯片也是采用了最新的16納UltraScale+架構,可提供額外的功耗節省及更高的密度。
 

U50升級到PCI-Express 4.0連接,這是第一個這樣做的低配置FPGA卡。它還配備了一個100GbE接口,用于與外界通信。高速接口特別適用于NVMe-oF解決方案(NVM Express over Fabrics)或其他基于網絡的工作上的應用。
 

撇開硬件規格不談,U50的價值最終將取決于它比CPU或其他加速器更好地加速實際工作負載的能力。基于Xilinx的初步結果,新的Alveo確實可以在幾個應用領域找到了一個可接受的客戶群。
 

例如,U50能夠比英偉達的主要推理GPU Tesla T4更快地執行語音翻譯,而且能夠以更低的延遲完成。鮑恩認為,U50將特別擅長于這些短期存儲(LSTM)應用,以及使用循環神經網絡(RNN)架構的其他應用——比如異常檢測、對話系統和手寫識別等。
 

盡管U50在內存容量方面可能會面臨一些挑戰,但在正確的場景下,它非常擅長數據庫分析。對于基于高吞吐量查詢的分析應用,U50比24核Xeon Platinum CPU高出四倍。在這種情況下,Alveo卡每24毫秒就會給出一個答案,而英特爾處理器則需要210毫秒。
 


在衍生定價和風險模型應用中,U50的能效比Xeon CPU(v4)高20倍,比V100 GPU高7倍。該算法使用蒙特卡羅技術獲得預期的投資回報,并繪制出衍生品的風險概況。盡管U50的定價信息尚未公布,但Bowen表示,他們的解決方案預計將以不到GPU設置成本的一半來實現。

 

對于電子交易而言,U50看起來也是一個不錯的選擇,這是金融服務領域中更為傳統的FPGA應用。對于抽象交易(T2T)操作,該卡能夠在500納秒內執行交易,這比CPU快20倍。Bowen指出,不僅傳遞的延遲極低,而且它也是一致的,因為FPGA邏輯的確定性特性確保了這種可靠的行為。

對于存儲應用,FPGA對于數據加密,擦除編碼和壓縮等任務最為有用。對于后者,U50比22核Skylake Xeon快20倍。

 


這方面的一個特定應用是加速Hadoop存儲,通常關閉壓縮以最大化磁盤吞吐量。使用這種由fpga支持的 line-rate compression功能,不僅可以將磁盤空間減少一半,而且只需要一半的服務器(在本例中,每個服務器都有兩個U50卡)來提供存儲。因此,根據Xilinx的計算,基礎設施成本可以降低約40%。
 

Bowen表示,這種計算存儲功能也可以應用于NVMe over Fabric設置,這里利用了高性能網絡以及Alveo加速器除了壓縮之外還可用于執行各種數據相關工作的事實,包括數據庫過濾,掃描和聚合等。
 

所有這一切都得益于Xilinx的努力,為這些加速器構建應用生態系統。雖然這是一個長期項目,但自從去年10月Alveo推出以來,它們似乎在短時間內取得了不錯的進展,使這些設備上運行的應用程序數量翻了一番。同樣,在此期間,接受過編寫這些應用程序培訓的開發人員數量增加了四倍。
 

此外,Bowen表示他們有越來越多的軟件合作伙伴和系統供應商支持這一產品組合。后者包括許多主流OEM,包括戴爾EMC,SuperMicro和浪潮。亞馬遜,阿里巴巴,騰訊和百度也在各自的云中支持這些加速器。
 

正如您所料,Xilinx提供了一堆開發工具,驅動程序和運行庫,包括數學原語和參考代碼塊。Bowen說,擁有這種IP基線對于開發人員構建新應用程序至關重要。
 

Alveo U50現已開始提供樣品,許多原始設備制造商正在進行鑒定,根據規格表,包括戴爾,惠普企業和Supermicro。一般可用性定于2019年秋季。
 

關鍵詞: PCIe 4 賽靈思

  • EETOP 官方微信

  • 創芯大講堂 在線教育

  • 半導體創芯網 快訊

全部評論

主站蜘蛛池模板: 97影院午夜午夜伦不卡| 亚洲一区二区日韩欧美gif| 青青在线成人免费视频| 日韩在线 在线播放| 国产人成精品香港三级在 | 日韩中文字幕在线观看| 色婷婷激情五月综合| 香蕉性视频| 精品国产免费人成网站| 综合一区| 毛片啪啪啪| 欧美成人交tv免费观看| 黄色欧美视频| 九九热精品视频在线播放| 中国的毛片| 日本特黄特色大片免费播放视频| 免费黄网站在线看| 香蕉eeww99国产在线观看| 99久久精品国产片| 国产欧美视频在线| 色综合亚洲综合网站综合色| 一级黄色短视频| 亚洲精品成人一区二区www| 国产在线观a免费观看| 91国内精品久久久久怡红院 | 国产精品入口在线看麻豆| 午夜香蕉| www在线观看视频| 亚洲人在线观看| 在线观看黄网视频免费播放| 国产一卡2卡3卡四卡高清| 国产黄色影院| 精品国产福利在线观看网址2022| 麻豆视频免费| 亚洲综合伦理一区| 久久91精品国产91久久麻豆| 亚洲一级片免费看| 亚洲精品美女国产一区| 在线观看黄色片| 成人久久久观看免费毛片| 欧美精品国产日韩综合在线|