99精品在线观看-99精品在线免费观看-99精品在线视频观看-99精品这里只有精品高清视频-99九九精品国产高清自在线

x

一種大幅提升AI SOC芯片設(shè)計的方法!

2024-12-12 13:15:45 EETOP
點擊關(guān)注->創(chuàng)芯網(wǎng)公眾號,后臺告知EETOP論壇用戶名,獎勵200信元

片上網(wǎng)絡(luò) (NoC) 技術(shù)在系統(tǒng)級芯片 (SoC) 設(shè)計中的應(yīng)用已被證實可以減少布線擁塞并降低功耗?,F(xiàn)在,一種新的NoC瓦格化(NoC-enabled tiling)方法有助于加速開發(fā)、便于擴展、支持SoC的降功耗技術(shù)并可提高針對人工智能 (AI) 應(yīng)用的SoC設(shè)計重用。在本文中,我們將假設(shè) AI 包括機器學習 (ML) 和推理等用例。

image.png
軟瓦格與硬瓦格

工程學中的一個挑戰(zhàn)是,同一個術(shù)語可能被用來指代不同的事物。例如,術(shù)語“瓦格 (tile)”就具有多種含義。有些人將瓦格等同于芯粒 (chiplet),芯粒是獨立的小型裸硅芯片 (die),實際使用時安裝在普通硅襯底或有機襯底或中介層上。芯??梢员徽J為是“硬瓦格”。

相比之下,許多SoC,包括那些用于AI應(yīng)用的SoC,都采用處理單元 (processing elements, PE) 陣列,這可以被視為“軟瓦格”。例如圖 1 所描述的通用SoC。



圖 1. 包含NPU的SoC的高級框圖。

除了包含多個通用CPU處理器集群,以及其他幾個IP模塊之外,SoC還可能包含專用處理器或硬件加速器:圖1中的SoC包括了一個圖像信號處理器 (ISP)、一個圖形處理器 (GPU) 和一個專為高性能、低功耗AI處理而設(shè)計的神經(jīng)處理單元 (NPU)。

NPU是由相同PE組成的一個陣列。在不遠的過去,這些PE通常是以相對簡單的乘積 (MAC) 函數(shù)實現(xiàn)的,其中MAC是指乘加運算。相比之下,如今的 SoC 通常包含多個通過內(nèi)部 NoC 連接的 IP 的 PE。

手動實現(xiàn)軟瓦格化

在本文討論的常見SoC場景中,NoC可以在設(shè)計層次結(jié)構(gòu)的多個級別中使用。例如,可以在頂層使用NoC來連接處理器集群、ISP、GPU、NPU和其他IP。NoC可以以各種拓撲結(jié)構(gòu)實現(xiàn),包括環(huán)形、星形、樹形、網(wǎng)狀等。即使在SoC層次結(jié)構(gòu)的頂層,某些器件也可能使用多個 NoC拓撲結(jié)構(gòu)。

如前文所述,NPU中的每個PE可以由多個IP組成,這些IP通過內(nèi)部NoC連接。此外,NPU中的所有PE也可以使用NoC連接,通常以網(wǎng)狀拓撲結(jié)構(gòu)實現(xiàn)。

傳統(tǒng)手工方法實現(xiàn)NPU是從創(chuàng)建單個PE開始的。除了AI加速器邏輯以外,PE還將包含一個或多個網(wǎng)絡(luò)接口單元 (NIU),用于將PE連接到主網(wǎng)狀NoC中。如圖2a所示。


圖 2. 手動實現(xiàn)軟瓦格化。

如果我們假設(shè)NPU規(guī)范需要一個 4x4 的PE陣列,那么設(shè)計人員將使用“剪切-粘貼”方法將PE復(fù)制 16 次 (圖2b)。接下來,使用NoC工具自動生成NoC (圖2c)。在此過程中,NoC 生成器會自動為NoC的每個交換單元分配唯一標識符 (ID)。但是,PE中的NIU也將具有與PE相同的ID,即PE創(chuàng)建時的默認ID。

為了使NoC將數(shù)據(jù)從源節(jié)點傳輸?shù)侥繕斯?jié)點,每個PE中的NIU必須有一個唯一的ID。這需要設(shè)計人員手動修改每個 PE 實例,以便為每個NIU提供自己的ID。這一過程不僅耗時,而且容易出錯,從而會影響下游測試和驗證。

這種手動實現(xiàn)的瓦格化 (tiling) 技術(shù)面臨一些挑戰(zhàn)。例如,在設(shè)計過程的早期,經(jīng)常會對PE規(guī)范進行更改。對于每次更改,設(shè)計人員有兩種選擇: (a) 在陣列的所有PE實例中手動復(fù)制更改,或者 (b) 僅修改原始PE,然后重復(fù)整個手動剪貼的軟瓦格化過程。這兩種方法都非常耗時且容易出錯。

此外,手動執(zhí)行軟瓦格化也不方便擴展。如果需要用 8x8 版本替換原始的 4x4 陣列,例如用于衍生產(chǎn)品,則這個過程就會變得越來越繁瑣,問題也會越來越多。

片上網(wǎng)絡(luò)瓦格化

“片上網(wǎng)絡(luò)瓦格化 (NoC-enabled tiling)”是SoC設(shè)計的一個新興趨勢。這種演進式方法采用成熟、穩(wěn)健的NoC IP使擴展更容易、縮短設(shè)計時間、加快測試速度并降低設(shè)計風險。

使用片上網(wǎng)絡(luò)瓦格化技術(shù),設(shè)計人員也像以前一樣從創(chuàng)建單個PE開始。不過,在這種情況下,可以使用NoC工具自動復(fù)制PE、生成NoC并配置PE中的NIU,所有這些操作只需幾秒鐘即可完成。設(shè)計人員只需要指定所需的陣列維度。


圖3. 片上網(wǎng)絡(luò)瓦格化技術(shù)


除了顯著加快陣列生成過程外,這種“按照結(jié)構(gòu)修正 (correct by construction)”的方法還消除了人為錯誤的可能性。它還使設(shè)計團隊能夠在SoC開發(fā)流程的早期快速、輕松地滿足對PE的更改請求。此外,它還能極大地促進擴展和設(shè)計重用,包括創(chuàng)建衍生設(shè)計。

不斷發(fā)展的市場

Arteris 與引領(lǐng)市場的創(chuàng)新者合作,共同應(yīng)對不斷發(fā)展的IP和SoC設(shè)計挑戰(zhàn)。根據(jù)對客戶目前正在開發(fā)的AI SoC設(shè)計的分析,Arteris 團隊確定了軟瓦格化在當今的 AI 關(guān)鍵垂直和水平領(lǐng)域中的相對使用情況。如圖 4 所示,其中圓圈的面積反映了應(yīng)用用例的相對數(shù)量。


圖4. 當今AI在關(guān)鍵垂直和水平領(lǐng)域中片上網(wǎng)絡(luò)瓦格化的使用情況。
總結(jié)

設(shè)計具數(shù)十億個晶體管的SoC不僅十分耗時,而且面臨許多挑戰(zhàn)。一些SoC器件,比如針對AI 應(yīng)用的SoC,可能包含由PE陣列組成的NPU等功能。

Arteris以其行業(yè)領(lǐng)先的一致性和非一致性NoC技術(shù)而聞名。片上網(wǎng)絡(luò)瓦格化技術(shù)是一種新興趨勢,Arteris 公司領(lǐng)先的NoC IP產(chǎn)品和NoC工具給您帶來先進的可靠的支持。我們還精心為您準備了Arteris 的三份技術(shù)白皮書,掃一掃二維碼,即可獲取如下資料。

掃一掃二維碼,立即獲取資料

資料清單

  • Arteris AI Tiling 總覽
  • Arteris FlexNoC 5 互聯(lián) IP 產(chǎn)品手冊
  • Arteris Ncore緩存一致性互聯(lián) IP 產(chǎn)品手冊




關(guān)鍵詞: Arteris NOC 片上網(wǎng)絡(luò) SOC

  • EETOP 官方微信

  • 創(chuàng)芯大講堂 在線教育

  • 半導(dǎo)體創(chuàng)芯網(wǎng) 快訊

相關(guān)文章

全部評論

主站蜘蛛池模板: 亚洲在线视频一区| 高清国产一区二区三区| 成年人免费视频网站| 看色网站| 免费观看三级毛片| 日本视频免费高清一本18| 91精品国产91久久久久久最新| 色视频亚洲| 精品国免费一区二区三区| 国产毛片在线高清视频| 亚洲国内自拍| 一日本道加勒比高清一二三| 国内免费视频成人精品| 狠狠色丁香婷综合久久| 色综合久久综合中文小说| 大看蕉a在线观看| 麻豆网站入口| 制服丝袜在线看| 亚洲大片免费观看| 一本一道久久a久久精品综合| 精品免费在线视频| 国产免费1000拍拍拍| 中国一级毛片视频| 亚洲a在线视频| 国产亚洲精品久久久久久久网站| 99热在线只有精品| 国产主播精品| 天天成人| 黄色免费高清视频| 国产精品区一区二区三| 毛片免费软件| 免费看午夜高清性色生活片| 亚洲国产成人超福利久久精品| 日韩高清在线日韩大片观看网址| 一本毛片| 国产综合精品| 黄色高清视频在线观看| 国产成人在线视频网站| 正在播放国产无套露脸| 1000部国产拍拍拍拍在线观看| 精品国产一二三区|