兩年前被質疑PPT造芯,如今再次宣稱吊打英特爾!初創公司5.7GHz 128核通用CPU將流片!支持x86、ARM、RISC-V
2022-05-15 11:33:25 EETOPProdigy T16128有128個64位CPU內核,工作頻率高達5.7GHz,有16個DDR5內存控制器和64個PCIe5.0通道,可以處理通用計算、高性能計算(HPC)和AI工作負載--所有這些都在一個芯片上。
Tachyum稱Prodigy是世界上第一個"通用處理器",并表示它從一開始就被設計成一個多用途的CPU,能夠運行世界上眾多最密集的計算應用。Prodigy不僅能在單個芯片上處理所有這些不同的任務,而且其功率預算比傳統硬件低10倍--而且成本只有三分之一。
Tachyum公司大膽地宣稱,Prodigy超級計算機芯片在高性能計算應用中的性能是英特爾市場上最快的Xeon的四倍,是Nvidia的H100原始性能的三倍。所有這些,同時又是10倍的電源效率。
為了在單核架構中創造出如此令人印象深刻的性能,Tachyum表示,它在構建Prodigy時,從頭到尾都有矩陣和矢量處理能力--而不是把它們作為事后的考慮。Prodigy支持一系列數據類型,包括FP64、FP32、TF32、BF16、Int8、FP8和TAI,所有這些都來自單個CPU核本身。
另一方面,Prodigy將能夠在單個內核上運行光線追蹤和人工智能應用,并且不需要將數據轉移到微處理器內的另一個芯片上。
在單個芯片內運行所有這些不同的HPC工作負載可能會極大地改變服務器的格局。公司將能夠把更多的芯片裝入一個服務器場,并降低功率要求和冷卻。
Prodigy T16128 采用5納米,目前還沒有透漏是哪家工藝。T16128在一個非常小的(就其提供的功率而言)64毫米×84毫米FCLGA封裝內運行。Tachyum表示,當涉及到HPC工作負載時,該芯片能夠執行12個AIPetaFLOPS和90 TeraFLOPS。Prodigy芯片還可以運行x86、ARM、RISC-V的二進制文件。從某種角度來看,單個Nvidia A100只能夠實現5個AI PetaFLOPS。
每個核心具體能夠實現2x 1024位矢量單元,4096位矩陣操作,以及每時鐘4條失序指令。還支持虛擬化和高級RAS。該芯片還包括超過128MB的L2+L3高速緩存,具有糾錯能力。為了給其所有的內核提供能量,該芯片配備了16個DDR5內存控制器,額定速度高達7200MT/s,每個插座的最大容量為8TB。
T16128是Tachyum公司Prodigy系列的旗艦型號,將于2023年開始生產,所以我們應該在明年某個時候看到這些芯片的實際基準測試。
T16128規格書截圖:
初創公司Tachyum于2016年在硅谷成立,剛剛宣布已經準備好其旗艦處理器Tachyum Prodigy,這是一種小型128核處理器,根據制造商的說法,其功耗超僅僅是英特爾至強的1/10倍。該處理器將成為英特爾和AMD的競爭者嗎?
該初創公司已獲得斯洛伐克政府的1700萬美元投資,希望在該國創造就業機會,所以該公司現在應該是一家斯洛伐克公司。Tachyum已經能夠開始生產該處理器和更簡單的64核型號,他們計劃將其生產今年面市。
Tachyum的幾位創始人都是美國人,且大有來頭。尤其是CEO Radoslav Danilak,擁有25年的半導體行業經驗,一度大紅大紫的SSD主控巨頭SandForce就是他創立的,還親自擔任CEO,后被希捷收購,后來又創立了Skyera,繼續研究SSD主控技術,2014年又被西數收購。
Tachyum高管團隊: