ARM發布Cortex M55內核與Ethos U55 microNPU
2020-02-11 09:01:22 cnbeta(題圖 via AnandTech)
過去幾年,機器學習技術的應用已變得相當普及,可見其在廣泛的行業和各種系統中。ARM 認為終端 AI 市場會在未來幾年中迎來爆炸性增長,新 IP 就是為此做準備。
首先介紹下 Cortex-M55,它是與 M33 聯系更加緊密的新一代 IP,引入了體系架構上的新改進,能夠在機器學習和矢量指令方面實現較大的性能和靈活性改進。
Ethos-U55 是專用的 microNPU 推理加速器,可與 Cortex-M 系列 CPU 結合使用,帶來專門面向于 NPU 的性能與能效提升。
與 Cortex-M 系列內核一樣,Ethos-U55 的空間占用也比較少。至于 Cortex-M55,則是首款具有 Helium / 定制指令能力的 CPU 內核。
Helium 特指 M-Profile Vector Extension(簡稱 MVE),屬于 M 系列 CPU 中的新矢量擴展和專用矢量執行單元,使之成為該范圍內首款具有單指令多數據流(SIMD)功能的產品。
新增功能使得新內核的 DSP 性能提升了 5 倍,結合針對機器學習工作負載的優化指令和 MVE,整體表現可提高至 15 倍。
整體微架構方面,新 IP 算是繼承了 M33 和 µarch 。在頻率提升的加持下,它將標量工作負載的性能提升了大約 20%,具體取決于供應商的配置。
新內核的設計重點,同樣體現在帶寬上。其啟用了需要帶寬的新 MVE 和機器學習工作負載,因此對內存子系統進行了改進,比如 4×32-bit 接口與緊密耦合內存(TCM)。
盡管 ARM 進入 NPU 領域的時間相對較晚,但新推出的 Ethos-U55 microNPU,還是較嵌入式市場有著獨特的意義。與移動 SoC 上更大的 Ethos-N 系列相比,它的面積和功耗要低得多。
Ethos-U55 是一種小型 NPU,可從 32 路擴展到 256 MAC、且需要與 Cortex-M 系列 NPU 耦合。
ARM 未提及微體系架構的主要細節,但可知它是一種非常精簡的設計,注重的是面積和能源效率、具有較小的內存占用量,其中包含我們在 N 系列產品中見到的一些特性,如 Weight Decompression 。
即便如此,它與 N 系列在功能上并沒有太大區別,因為該 IP 已包含 M 系列 CPU 。據說其架構與 NPU 有所不同(與更大的兄弟無關),且是專門為低功耗用例而設計。
就面積大小而言,U55 最小的 32 MAC 實現,約為 M55 的 2 倍。這里沒有絕對的數字提供,實際上討論的是平方毫米的分數。
與上一代解決方案相比,使用 M55 和 U55 的此類系統,其性能改進意味著相當重要的步進功能提升。與基于 Cortex-M7 的系統相比,ARM 帶來了包含 50 倍的性能提升、以及 25X 的能效改進。
至于新 IP 的可用領域,ARM 展望了各式各樣的嵌入式系統(主要是現有的芯片子系統)。比如在移動設備上,廠商可在手機的指紋傳感器、語音助理(實時監聽指令)、甚至在 RF 系統中(如天線調諧)使用它來優化工作負載。
當今的移動設備中,有數百種 M 系列 CPU 可從機器學習功能中獲益,且其中大多數功能對用戶來說是完全透明的。
目前 ARM 已向主要合作伙伴開放 M55 和 U55 的授權,并將在未來幾個月內向更廣泛的客戶群開放,預計最終產品可在廠商二次開發的兩年后走向市場。
免責聲明:本文由作者原創。文章內容系作者個人觀點,轉載目的在于傳遞更多信息,并不代表EETOP贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題,請及時聯系我們,我們將在第一時間刪除!