前所未有的 CPU 和 GPU 性能和效率!Arm 推出迄今速度最快的 Arm 計(jì)算平臺(tái)!
2024-06-11 11:43:05 Nancy,EETOP現(xiàn)在正是移動(dòng)設(shè)備行業(yè)的關(guān)鍵時(shí)刻。越來越多的 AI 正轉(zhuǎn)向在設(shè)備端,而不是在云端運(yùn)行。人工智能 (AI) 技術(shù)給移動(dòng)設(shè)備帶來的改變令人贊嘆。這不僅限于智能手機(jī),還包括筆記本電腦、可穿戴設(shè)備和數(shù)字電視等設(shè)備。設(shè)備端 AI 再次重新定義了智能手機(jī)的“智能性”,并由此誕生了 AI 智能手機(jī)和 AI PC。
而 Arm 是這一切的基石。基于 Arm 架構(gòu)的智能手機(jī)一直是 AI 體驗(yàn)的先行者。AI 時(shí)代正加速發(fā)展,復(fù)雜性隨之不斷提高,計(jì)算需求呈指數(shù)級(jí)增長。為提供更領(lǐng)先的AI體驗(yàn),助力芯片開發(fā)者更輕松、快速地構(gòu)建基于 Arm 架構(gòu)的解決方案,并加速其產(chǎn)品上市進(jìn)程,近日,Arm 正式推出人工智能優(yōu)化的 Arm 終端計(jì)算子系統(tǒng) (CSS)和新的Kleidi 軟件。
據(jù)介紹, Arm 終端 CSS基于三納米工藝,具備最新的 Armv9.2 CPU、Arm Immortalis GPU、以及最新的 CoreLink 系統(tǒng)互連和系統(tǒng)內(nèi)存管理單元 (SMMU),可為旗艦系統(tǒng)級(jí)芯片 (SoC) 提供基礎(chǔ)計(jì)算要素。
James McNiven,Arm 終端事業(yè)部產(chǎn)品管理副總裁
Arm 終端事業(yè)部產(chǎn)品管理副總裁 James McNiven表示:“Arm 終端 CSS 的關(guān)鍵在于Arm目前性能最強(qiáng)、效率最高、功能最廣泛的 CPU 集群。”
Arm Cortex-X925: 實(shí)現(xiàn)了 Cortex-X 系列推出以來最高的同比性能提升,該 CPU 利用了領(lǐng)先的三納米工藝節(jié)點(diǎn),在 3.8GHz 的時(shí)鐘速率和最大緩存大小的條件下,與 2023 年旗艦智能手機(jī)的四納米 SoC 相比,其單線程性能大幅提高 36%。而在 AI 性能方面,Cortex-X925 取得了驚人的 41% 性能提升,可顯著提高如大語言模型 (LLM) 等設(shè)備端生成式 AI 的響應(yīng)能力。
Arm Cortex-A725 CPU :將對前沿性能的不懈追求與出色的效率相結(jié)合,該 CPU 將針對 AI 和手游用例的性能效率提高了 35%。這一改進(jìn)也得益于更新后的 Arm Cortex-A520 CPU 和更新后的 DSU-120,使得采用最新 Armv9 CPU 集群的消費(fèi)電子設(shè)備可提升能效和可擴(kuò)展性。
Arm Immortalis-G925 GPU :是 Arm 第三代具備光線追蹤技術(shù)的 GPU,是目前Arm性能最強(qiáng)、效率最高的 GPU,在各款領(lǐng)先的手游應(yīng)用中實(shí)現(xiàn)了 37% 的性能提升,并在多個(gè) AI 和 ML 網(wǎng)絡(luò)上提升了 34% 的性能。Immortalis-G925 面向旗艦智能手機(jī)市場,而包括 Arm Mali-G725 和 Mali-G625 GPU 在內(nèi)的全新高可擴(kuò)展性 GPU 系列,則面向從高端手機(jī)到智能手表和 XR 可穿戴設(shè)備等廣泛的消費(fèi)電子設(shè)備市場。
在談及Arm終端 CSS 如何為業(yè)界提供領(lǐng)先的性能時(shí),James McNiven特別強(qiáng)調(diào)說:“這是我們首次在終端領(lǐng)域以 Arm CPU 和 GPU 的優(yōu)化設(shè)計(jì)形式提供物理實(shí)現(xiàn)解決方案。”
那么,物理實(shí)現(xiàn)具體是指什么樣的產(chǎn)品形態(tài)呢?
James McNiven解釋說:“我們大多數(shù)的 IP 是通過 RTL 的形式進(jìn)行交付,這類似于軟件的形式,主要是對 IP 產(chǎn)品的描述。而要使 RTL 變成芯片,還需要通過 EDA 工具流,才能把這套描述轉(zhuǎn)變成實(shí)際的芯片布局。所以我們指的物理實(shí)現(xiàn),意即我們的設(shè)計(jì)完成了這些工具流。通過優(yōu)化和工具產(chǎn)出物理交付。這并不是指物理的形態(tài),它依然是近似于軟件的形式。但基本上,它已顯示了設(shè)計(jì)中的晶體管和線路等。RTL 形式的 IP 交付依然存在,我們只是額外提供合作伙伴物理實(shí)現(xiàn)形式的選項(xiàng),畢竟要把 RTL 轉(zhuǎn)變?yōu)槲锢韺?shí)現(xiàn)需要花費(fèi)一定的時(shí)間,并且需要基于對產(chǎn)品的全盤了解做出決策。而通過提供物理實(shí)現(xiàn),我們可以幫助合作伙伴節(jié)省時(shí)間,也有助于他們實(shí)現(xiàn)更佳的性能和效率。”
為了讓開發(fā)者能夠充分利用終端 CSS 的性能優(yōu)勢,Arm 同步還推出 Arm Kleidi,它可以嵌入到任何軟件平臺(tái)中,有助于軟件開發(fā)者無縫取得 Arm CPU 上的最佳性能,其包括面向 AI 工作負(fù)載的 KleidiAI 和面向計(jì)算機(jī)視覺應(yīng)用的 KleidiCV。
KleidiAI 是一套面向 AI 框架開發(fā)者的計(jì)算內(nèi)核,使他們能夠在各種設(shè)備上輕松獲得 Arm CPU 上的最佳性能,并支持 Neon、SVE2 和 SME2 等關(guān)鍵 Arm 架構(gòu)功能。CPU 是唯一可以確保運(yùn)行未來網(wǎng)絡(luò)的計(jì)算引擎。Arm一直在將KleidiAI集成到各種 AI 框架中,包括PyTorch、Tensorflow、MediaPipe 等,旨在加速 Meta Llama 3、Phi-3 等關(guān)鍵模型的性能,并且還可前后兼容,致力于提供無縫的開發(fā)者體驗(yàn)。
將 KleidiCV 融入到常用的 OpenCV 庫時(shí),性能便有了顯著改進(jìn)。今年,Arm與 OpenCV.ai 合作,力求讓安卓開發(fā)者可以更輕松地將 OpenCV 納入到他們的項(xiàng)目中,并從 KleidiCV 帶來的改進(jìn)中受益。James McNiven進(jìn)一步分享到: “從根本上講,計(jì)算機(jī)視覺現(xiàn)在與 AI 緊密相連,但這些攝像頭管線可不僅僅運(yùn)行神經(jīng)網(wǎng)絡(luò),還有很多傳統(tǒng)的計(jì)算機(jī)視覺算法,其性能對于攝像頭或社交媒體應(yīng)用的順暢運(yùn)行至關(guān)重要。這就是我們構(gòu)建 KleidiCV 的原因。”
智能手機(jī)一直引領(lǐng)著開發(fā)者進(jìn)行創(chuàng)新并突破平臺(tái)限制,驅(qū)動(dòng)著對更高效性能的要求。性能出色且應(yīng)用普遍的 Arm CPU 自然是在安卓設(shè)備上運(yùn)行 AI 的首要目標(biāo)。據(jù)介紹,目前有 70% 的第三方安卓 ML 工作負(fù)載都在 CPU 上運(yùn)行。Kleidi 為開發(fā)者提供了實(shí)現(xiàn) Arm CPU 最佳性能的路徑,使其能夠?qū)W⒂谙乱粋€(gè)重大創(chuàng)新。
對于Arm 終端 CSS的實(shí)際市場應(yīng)用表現(xiàn),vivo 首席芯片規(guī)劃專家夏曉菲表示:“vivo 非常注重用戶體驗(yàn),在 Arm CSS 的技術(shù)基礎(chǔ)之上,我們與 Arm 的密切合作,共同推動(dòng)開發(fā)者生態(tài),使手機(jī)更流暢更好用,同時(shí)也為設(shè)備端帶來了前沿的 AI 體驗(yàn)。我們很高興看到 Arm 終端 CSS 所引入的新方向,以及通過 Armv9 CPU 與 Arm GPU,這套計(jì)算子系統(tǒng)將賦能新一代設(shè)備端生成式 AI,從而實(shí)現(xiàn)沉浸式的智能移動(dòng)端解決方案。”
EETOP 官方微信
創(chuàng)芯大講堂 在線教育
半導(dǎo)體創(chuàng)芯網(wǎng) 快訊
相關(guān)文章