99精品在线观看-99精品在线免费观看-99精品在线视频观看-99精品这里只有精品高清视频-99九九精品国产高清自在线

x

Arm發布5nm新架構:Cortex-A78和Cortex-X1,功耗暴降50%、性能提升30%

2020-05-27 12:56:00 EETOP 作者:易建芯
點擊關注->創芯網公眾號,后臺告知EETOP論壇用戶名,獎勵200信元
arm 昨天推出了Cortex-A78和Cortex-X1 cpu 架構,2021年的移動設備將會搭載。
Cortex-A78是Cortex-A系列的迭代產品,Cortex-X1是一款新的高性能CPU

 

 
據介紹,Arm的Cortex-A78和Cortex-X1都是基于上一代Cortex-A77,但這兩款Arm處理器的設計目標不同,Cortex-A78側重于提供更高的每瓦性能,同時體積更小,而Cortex-X1則是追求最大性能。

兩款處理器都有望在2021年用于頂級SoC和智能手機,甚至可能彼此結合使用。
Arm Cortex-A78:效率至上
 

根據官方的介紹,Cortex-A78主頻達到了3GHz,每核每瓦性能相比上代提升了20%,在同樣的性能下,Cortex-A78的能耗相比上代降低了50%。另外,A78的面積也小了5%,為四核集群節省了15%的面積,這為額外的GPU、NPU和其他組件騰出了更多的空間。

Cortex-A78架構并沒有盲目追求性能提升,更注重性能、功耗、面積,也就是PPA的均衡。Cortex-A78通過更保守的性能改進來優化功率和面積。ARM把更高性能提升用于Cortex-X1架構。

而Cortex-A78根據ARM的說法,Cortex-A78的架構性能(也就是IPC)只提升了7%,功耗降低了4%,內核小了5%,四核簇面積的縮小了15%。
根據ARM的說法,在同樣的每核心1W功耗下,7nm生產的Cortex-A77可以達到2.6GHz,而5nm生產的Cortex-A78頻率可達3.0GHz,同功耗下持續性能提升20%左右。

能耗方面,在相同的性能下,5nm工藝生產的2.1GHz Cortex-A78功耗比7nm工藝2.3GHz的Cortex-A77降低了50%,有助于提高5G手機的續航。
 

談到微體系結構,Arm進行了許多重大更改。首先,Cortex-A78帶有可選的較小的32kB L1緩存配置,這可以節省大部分芯片空間。盡管Arm的合作伙伴仍然可以選擇更熟悉的64kB L1緩存來進一步提高內核的性能。高通公司為其Snapdragon Prime內核在較大的L2緩存中做了類似的事情,并且在高達512kB的容量中仍保持了靈活性,以平衡這一代產品的性能,面積和功率。

為了抵消這種較小的L1內存,分支預測器可以更好地覆蓋不規則搜索模式,并且現在能夠在每個周期跟蹤兩個已取分支。這樣可以減少L1高速緩存未命中的次數。與A77相比,流水線要長1個周期,從而確保A78達到3 GHz左右的時鐘頻率目標,但每個周期設計仍然是6條指令。

Arm還在執行單元中引入了第二個整數倍數單元,并引入了一個額外的加載地址生成單元(AGU),以將數據加載帶寬增加50%。其他優化包括更多融合的指令以及指令調度程序的效率改進,寄存器重命名結構和重排序緩沖區。最重要的是,Cortex-A78是比A77更精簡,更優化的CPU

Cortex-A78的目標是達到效率的峰值效率。這對于電池續航時間非常有用,但對于希望Android能夠在明年與蘋果縮小差距的發燒友而言卻并非如此。為此,這就需要Arm的高性能架構Cortex-X1了。
Cortex-A78主要面向2021年的智能手機等產品,不過考慮到之前的情況,2021年很難普及Cortex-A78,ARM也沒提到有哪些公司現在應用了這個架構。
ArmCortex-X1:終極性能

Cortex-X1是Arm“CXC項目”的第一款商用產品。性能方面,Cortex-X1將比Cortex-A77提高30%,與Cortex-A78相比,Cortex-X1的的整數運算性能提升了23%,Cortex-X1還擁有兩倍于Cortex-A78的機器學習能力。要實現Cortex-X1的目標性能,需要進行許多重大的微體系結構更改。Cortex-X1的內核比A77和A78要大得多,L2緩存的最大容量為1MB,帶寬是原來的兩倍,可以最大限度地提高性能,而共享的L3緩存可以達到8MB,是前幾代緩存的兩倍。有趣的是,Cortex-X1隨附了一個特定的動態共享單元(DSU),以支持8MB配置,該配置也與集群中的所有Cortex-A78共享該內存。


Cortex-X1在結構設計上與Cortex-A78如出一轍,但幾乎在每個地方都進行了擴展。
 

 
前端解碼部分從4端口增加到了5端口,宏指令緩存直接加倍,達到3000條,甚至超過Intel的Sunny Cove(2250條),但少于Zen 2(4000條)。亂序重排緩沖區(ROB)的大小也是擴充到224條,與Zen 2和Skylake持平。
 
 

 
執行部分中變化最大的是FP單元,也就是ARM特有的NEON浮點引擎,Cortex-X1上面直接將FP單元的數量倍增,達到4x128B的規模,寬度上基本等同于目前的桌面x86處理器,不過ARM目前的指令集并不允許單個長度大于128B的向量,在吞吐上肯定是不如桌面端處理器的。
 

 
緩存部分也發生了較大的變化,除了同步Cortex-A78增加的一個Load AGU外,ARM允許Cortex-X1的二級緩存加倍,增加到1MB之多,同時L2 TLB較Cortex-A78翻倍,可覆蓋8MB的L3緩存。
 

 
Cortex-X1很像Cortex-A78,兩者共享了不少設計改進,但Cortex-X1明顯是沖著高性能去的,它很寬,有著更高的計算吞吐量。官方數據顯示它相比Cortex-A77在峰值性能上有30%的提升,是相當巨大的。
 

 
在產品層面,智能手機的SoC似乎不太可能使用四Cortex-X1集群,單Cortex-X1與三個Cortex-A78將是不錯的選擇。這樣的配置只比四核Cortex-A76集群多占用15%的空間,但提供了更高的單核性能。
 

 
預計未來的SoC產品會選擇1核X1、3核A78和4核A55的搭配,從而實現更好的的性能與能效的平衡。未來Windows on Arm產品則有可能會搭載多核Cortex-X1的SoC,從而大幅提升性能。
 

關鍵詞: Arm A78 Cortex-X1

  • EETOP 官方微信

  • 創芯大講堂 在線教育

  • 半導體創芯網 快訊

全部評論

主站蜘蛛池模板: 久久国产精品自由自在| 久久性视频| 一级一片免费播放| 亚洲尹人香蕉网在线视颅| 手机在线看片不卡中文字幕| 天堂mv亚洲mv在线播放9蜜| 成人午夜大片免费看爽爽爽| 国产va精品免费观看| 香蕉视频在线免费播放| 91在线区啪国自产网页| 黑人巨大videosjapan高清| 一级黄色片免费| 中国一级淫片aaa毛片毛片| 成人影院www在线观看| 国产精品特黄一级国产大片 | 国产一毛片| 欧美精品成人一区二区在线观看| 亚洲性色图| 91短视频在线观看免费最新| 久久有精品| 日本黄色高清视频| 中国护士一级毛片免费版本| 在线观看视频一区二区三区| 免费高清精品国偷自产在线| 国产一级做a爰片久久毛片| 国产综合社区| 看一级毛片国产一级毛片| 黄色片网战| 嫩草视频在线播放| 久久六月丁香婷婷婷| 任我爽在线| 天天色综合色| 午夜刺激视频| 亚洲 欧美 精品| 亚洲精品乱码国产精品乱码| 中文免费观看视频网站| 日韩区欧美区| 中文字幕制服| 中文字幕久久综合伊人| 亚洲天堂三区| 毛片自拍|