從一款全新的嵌入式AI系統看未來DRAM的設計趨勢
2021-08-19 12:47:36 未知據了解,華邦電子正在擴建產能,其中位于臺灣高雄的新廠投產后,未來每年產出將以15~20%的產能幅度滿足客戶需求。除了產能方面的布局之外,華邦電子在產品技術方面的布局謀篇,同樣具有代表性。
在近日的采訪中,華邦電子DRAM產品營銷部經理曾一峻介紹說:“在未來一兩年,邊緣計算將更流行。通常大家都認為AI的模型很大。但其實,行業內正在致力于通過不斷的架構優化,來將AI模式縮小,可以說是在準確度可以接受的范圍情況下進行極致地壓縮化處理。”
在物聯網、人工智能、5G、大數據、云計算等新興技術的驅動下,最近幾年,人們的生活品質呈現出明顯的快速迭代。尤其是2020年的新冠疫情,及之后的后疫情時代,迅速拓寬和激活了我們全新的生活方式。短視頻的崛起,讓數據更是呈現指數級增長。這些海量的數據,傳統的做法是上傳至云端,運用人工智能技術,對數據進行云管理、云托管、云挖掘。不過,隨著數據的激增,運算量實在太大,已經面臨無法負荷的挑戰。解決的辦法就是把運算直接轉移到終端或是邊緣計算。
確實,在終端應用及邊緣運算應用的驅動下,AI模型會一直往最佳化,也就是所謂的壓縮化方向發展。縱觀行業市場產品,不難發現這一趨勢變化。如谷歌現在最有名的TensorFlow Lite for Micro Controllers,它可以把AI的神經模型引擎的Weight size壓到很低。市面上還有廠商在做優化升級optimize,比如說MobileNetV2-YOLOv3-Nano,它的Weight size已經可以壓到3.0MB,甚至Yolo-Fastest可以到1.3MB,Yolo-Fastest-XL也頂多3.5MB。
外掛內存是未來的設計趨勢。當前,主芯片廠商在設計內存控制器時推崇的是HyperBus™技術。該技術最早是由Cypress在2014年發表。相較于其他內存IC的傳輸控制接口, HyperBus™ 接口的特點之一是接腳數低,這使得電路板的布局更簡潔, 布線面積也更小。華邦電子因此趨勢,也陸續推出相關的HyperRAM™ 系列產品。
據了解,華邦電子自2019年正式推出HyperRAM新型存儲產品以來,在內存容量上,現在已經可以提供HyperRAM1.0、HyperRAM2.0、HyperRAM2.0e的系列產品。其中HyperRAM1.0的容量是 32Mb;HyperRAM2.0的容量是64Mb。256Mb HyperRAM 2.0/2.0e分別可支持x8 和x16,在3.0V或1.8V的工作電壓之下,HyperRAM 2.0效能皆可達最高工作頻率 200MHz,相當于數據傳輸率 400Mbps。
低功耗、引腳數少和易于設計是華邦電子HyperRAM的主要賣點。對于低功耗,其實對于內存產品來說,這是市場上對該類產品的一個主要訴求。華邦HyperRAM最大的一個亮點就是超低功耗。HyperRAM 2.0e的B/W約為1GB/s,運行功耗低于50微瓦,常溫時待機功耗低于70微瓦,如果是超低功耗模式,常溫時待機功耗低于35微瓦。
那么如此低的功耗,HyperRAM是如何做到的呢?原來,華邦是在電路上做了一些特別設計。HyperRAM在進入超低功耗模式時,就會關掉所有功耗電源,只保留一些必要性的電路,當然數據會一直被存儲。相比傳統的待機模式,這種超低功耗模式的喚醒時間勢必會更長一些。不過,曾一峻表示,其實目前很多IoT的裝置并沒有那么多需要急于喚醒的時候,華邦經過與客戶溝通發現,目前HyperRAM 超低功耗模式的的喚醒時間沒有問題。
至于封裝尺寸,HyperRAM的面積相比LPDDR與SDRAM都大大減小,更加易于設計。還有引腳數的部分,HyperRAM的引腳(pin count)很少,目前有兩種類型, 8 I/O與16 I/O,16 I/O大概是30 Ball。相對傳統LPSDRAM或者SDRAM都是50或60Ball,HyperRAM基本上減少將近一半的引腳數,即小于30個。所以在客戶使用方面,不管是PCB 板的面積或者是設計來看,都會更加簡單,也可以得到低功耗,頻寬上面也沒有太多的衰減,符合目前的市場需求。
HyperRAM的應用范圍非常廣,不僅可以利用HyperRAM存儲AI數據,甚至可用來存儲視頻流或音頻流的數據。目前客戶端采用HyperRAM的應用市場主要為4G功能手機、智能手表、LTE的物聯網模塊,以及人工智能物聯網設備。如華邦的64Mb HyperRAM不只可以用來存儲RTOS,還可以使用在一些很簡單的輕智能上,不過不能做到實時圖像識別。比如智能水表、智能電表,通常以一秒一張的速度進行圖像識別,然后再經過NBIOT去傳到中央控制臺之后,就可以把數據傳輸出來。對于不需要進行即時圖像解析的應用場景,HyperRAM非常合適。
此外 據介紹,其實現在有很多小型的eFPGA公司把HyperRAM用于Display Buffer,所需容量為32Mb-256Mb。還有WiFi IoT設備中采用HyperRAM,主要是為了提供Data buffer。其實WiFi IoT里面還有放一些ISP(Image Signal Processing,圖像信號處理)的功能,以及一些MPU,需要做圖像識別(Image Recognition),它對HyperRAM的容量需求比較高,且起跳幅度較大,大概是從64Mb-256Mb。
曾一峻表示,從今年年底到明年開始,可能陸續會有很多導入HyperRAM的設計。如智能音箱、家用攝像頭、智能門鈴、智能門鎖等智能家居應用,以及工業用人機界面,甚至汽車儀表。據介紹,目前在歐洲,已經有將HyperRAM應用于電動自行車的主機上的產品。
不過,整體而言,HyperRAM在微控制器、芯片組制造商方面的被接受度會更高一些。曾一峻介紹說,HyperRAM在微控制器與AI結合的新型應用上會越來越普遍,這也是未來的發展趨勢。據介紹,通過目前與華邦合作的客戶來看,與HyperRAM相搭配的主要是Cortex-M7或者M55之類的微控制器,或是一些其他的MPU。而應用大概是KWS(Key Word Spotting)或者是簡易的圖像識別。
比如微控制器,可能需要搭載RTOS功能,或外掛一些WiFi/BT(Blue Tooth),或LTE,甚至還要添加設備端AI(On Device AI)的NPU功能。在添加AI功能的前提下,使用既有的SRAM存儲RTOS之后,SRAM的空間就不夠大了。而通常Microcontroller里面不會配置高容量的SRAM,因為成本太高。解決的辦法就是采用外掛內存的處理方式。目前,雖然主流的智能設備如耳機、藍牙(BlueTooth)、TWS等,基本采用的還全都是NOR Flash。不過隨著衍生性應用需求的增多,為了實現更高階的應用,就需要更大的內存來實現低延遲(low latency)、語音計算等功能。曾一峻介紹說:“外掛內存就是很好解決辦法。這樣的產品,可能明年開始就會出現在市場上。”
除了在微控制器領域,華邦還在積極跟MCU以及一些系統廠商進行合作,希望將HyperRAM的生態系統建立起來。因為MCU系統的電路板不會做的很大,需要的引腳數(pin-count)不用太多,所以HyperRAM就是一個很好的選擇。曾一峻介紹,目前很多microcontroller或者工業控制部分都希望導入華邦HyperRAM。尤其因為在低頻(low frequency)的情況下,microcontroller其實并不需要特殊的DRAM去做控制,一般的GPIO在低時鐘頻率,如100MHz以下,就可以模擬出HyperRAM控制功能。所以對于microcontroller來講非常適合采用HyperRAM產品
曾一峻進一步分享說:“HyperRAM可作為工作內存使用,適合AIoT設備的嵌入式AI和圖像處理應用。華邦仍在持續對HyperRAM這個產品線做一些研發和企劃。2.0e之后是2.0 Plus,這款產品速度將會再次得到大幅度提升。接下來,華邦會將HyperRAM的容量延伸到128Mb甚至256Mb,屆時將可以存儲更多圖像數據或者更多AI模型。并且根據華邦的預期,未來這兩三年AIoT的應用會越來越廣泛。我們希望在市場的回響越來越好之后,將推出HyperRAM3.0。”
因為目前AI大多將數據存放在終端進行運算,也會有一些AI模型需要存放在終端,通常都是存放在NOR Flash或者是NAND Flash上面。使用情境就是把AI模型快速的從閃存讀取出,再傳到DRAM/SDRAM 或者HyperRAM做一些運算。所以, “讀取速度”成為了很重要的考量點。
如果AI的模型是比較小,容量比較小,NOR Flash其實在小容量讀取上是非常快速的,是一個不錯的選擇。但是如果隨著添加的功能越來越多,或者是需要識別的東西越來越復雜的時候,AI模型所占的容量就會比較大。此時,在大容量的情況下,NAND Flash的讀取速度相比于NOR Flash更快。所以在這樣的使用場景上,就要去可以選擇不同容量的NOR搭配不同容量的NAND,同時滿足小容量與大容量的快速讀取。
華邦SpiStack將NOR芯片和NAND芯片堆疊到一個封裝中,例如 64Mb Serial NOR和1Gb QspiNAND芯片堆疊,使設計人員可以靈活地將代碼存儲在 NOR 芯片中,并將數據存儲在NAND芯片。此外,雖然是兩個芯片 (NOR+NAND) 的堆棧,但單一封裝的SpiStack,在使用上僅需6個信號引腳。
總結來看,華邦的SpiStack擁有三大優點,即硬件兼容、成本優勢、質量優良。對于閃存產品,客戶永遠都會期待它擁有以下三個優點,PCB占地小、成本低、組合多樣化。而華邦的SpiStack產品家族可以充分滿足這些需求。
華邦電子閃存產品營銷部經理黃信偉特別強調說,市面上也有將NOR芯片和NAND芯片放在一個封裝里面的產品,但他們的方式都是用硬件的實體腳位去做切換,這樣就無法保持8腳位數的標準封裝了,必須采用另外的封裝方法。華邦導入了一個全新方法,用軟件指令做芯片切換。當需要控制某一顆芯片的時候,只要用一個軟件的方式去切換,就會操作到特定的芯片。每一個芯片都會有自己的識別碼,用軟件去指向特定的識別碼。此外,SpiStack(NOR+NAND)支持并發操作,當某顆芯片在執行寫入/擦除時,另一顆芯片可以同時進行寫入/擦除/讀取。它們互不干擾,反之亦然。所以SpiStack也可以節省寫入與擦除的時間。此外,SpiStack用到的NAND跟NOR,都是華邦已經通過車規級驗證,且生產NAND與NOR采用的都是成熟制程,所以在質量上是毋庸置疑的。
7月初,華邦電子正式確認,華邦HyperRAM 和 SpiStack (NOR+NAND) 產品將與瑞薩基于Arm 內核的RZ/A2M 微處理器 (MPU) 搭配使用。瑞薩RZ/A2M屬于RZ產品系列微處理器,基本適用于所有需要圖像預處理的應用,尤其在非汽車的產品當中屬于性能卓越的系列。
RZ/A2M的基礎是ARM Cortex-A9 528MHz MPU。和其他的MPU一樣,有一些共通的外設。但是比較特殊的是RZ/A2M同時設置有兩個網口,兩個USB,兩個SDHI,還有一些security在里面。此外還有三個比較特別的與其他品牌MPU不同的地方,RZ/A2M配置了瑞薩獨有的DRP硬件加速內核,主要用于圖像預處理,速度非常快。
據了解,DRP是一個硬件加速,即搭載外置memory的圖像預處理應用。它是瑞薩自研加速核,可以比一般的CPU快10倍左右。以二維碼掃描儀為例, 單純用一款528MHz的芯片,便能達到60幀輸出,基本等同于其他客戶用的FPGA級別。
面對這個問題,瑞薩電子中國企業基礎設施事業部經理 Anson介紹說,音頻/視頻等MCU設備中的人工智能需求激增,是促使瑞薩等企業選用HyperRAM產品的主要原因。據了解,RZ/A2M內部配有一個4MB的SRAM,可用于比較簡單的應用,如一些HMI(人機交互界面),或者是簡單的控制應用。因為本身配備DRP的核,即使CPU運轉不快, 仍然可以用于圖像預處理。但是面對現在很多的嵌入式系統,數據量以及程序庫依然遠遠大于普通的HMI。4MB的內存容量,面向現在嵌入式AI系統來講,有些應用場合是不夠的。所以很多時候瑞薩都會建議客戶采用外掛內存。
瑞薩RZ/A2M采用華邦的HyperRAM和SpiStack (NOR+NAND)可以減少PCB上的內存安裝面積、導線數量和BOM成本。兩種封裝尺寸均僅有8x6mm , 其中有13個信號引腳用于HyperRAM,6個用于SpiStack (NOR+NAND)。與傳統的SDRAM和并行NOR/NAND相比,華邦HyperRAM和SpiStack的封裝尺寸和終端數量都減少了80%左右。隨著嵌入式AI系統變得越來越復雜,使用搭載外部存儲器的RZ/A2M可支持應用程序代碼或訓練模型不斷增加的數據量。
— 結束語 —
過去,傳統存儲面對的主要是數據庫、文件和流媒體等傳統應用。今天,在新興技術驅動下,存儲主要面對的是云計算、大數據和人工智能等大規模數據應用場景。此外,隨著IoT終端設備微型化的趨勢,新一代高效能、低功耗的MCU市場正在興起。雖然MCU的制程節點已經從55nm、40nm朝28nm,甚至16nm移轉。尺寸上的滿足并不能同步帶來運算能力的優化,需要新一代的外部內存作為數據緩沖之用。正是這些新型應用的崛起和快速普及給數據存儲帶來了全新的機遇,市場對存儲芯器芯片的需求日益增長。當然,機遇和挑戰往往總是相伴而生的。行業進入深耕時代,搶占用戶的能力決定了未來,找準場景快速落地將成為關鍵。