我國首個光子人工智能芯片項(xiàng)目正式啟動!光子芯片原理是什么?為什么更適合于AI?
2019-01-07 12:51:19 EETOP光子人工智能芯片。光子芯片的計算速度為電子芯片的1000倍,但功耗僅為其百分之一。
算力是傳統(tǒng)電子人工智能芯片的1000倍,但功耗只有其百分之一,低延遲還抗電磁干擾,由清華、北大、北交大等高校博士生創(chuàng)業(yè)研發(fā)的光子人工智能芯片,在技術(shù)上實(shí)現(xiàn)不少突破,未來可廣泛應(yīng)用于手機(jī)、自動駕駛、智能機(jī)器人、無人機(jī)等領(lǐng)域。近日,該光子人工智能芯片項(xiàng)目落戶順義,將這項(xiàng)新技術(shù)推向了臺前。
“芯片的設(shè)計、加工、封裝、測試全部在國內(nèi)完成,擺脫了對國外高制程光刻機(jī)的依賴,是我國在芯片領(lǐng)域換道超車的核心技術(shù)。”研究團(tuán)隊(duì)負(fù)責(zé)人白冰說。
具高速率、低功耗優(yōu)勢
落地順義的光子人工智能芯片出自一個由清華、北大、北交大等多所高校的在校博士生組成的創(chuàng)業(yè)團(tuán)隊(duì),該團(tuán)隊(duì)是全國第一個,也是全球第二個光子人工智能芯片研究團(tuán)隊(duì)。
團(tuán)隊(duì)負(fù)責(zé)人、光子芯片的研發(fā)者之一——白冰,目前正在北京交通大學(xué)通信與信息系統(tǒng)專業(yè)攻讀博士學(xué)位。作為國內(nèi)第一個研究光子計算的團(tuán)隊(duì),白冰介紹,光子芯片具有低延遲、抗電磁干擾等優(yōu)勢,計算能力是傳統(tǒng)芯片的三個數(shù)量級,功耗卻只有傳統(tǒng)芯片的百分之一。
全流程可在國內(nèi)完成
對于光子人工智能芯片發(fā)展的意義,白冰說,國內(nèi)電子芯片設(shè)計領(lǐng)域能力很強(qiáng),但在核心加工環(huán)節(jié)有一個很強(qiáng)的技術(shù)壁壘,需依賴國外的高制程光刻機(jī),在成本等多個方面都會受限。光子人工智能芯片的生產(chǎn)過程自主可控,全流程可在國內(nèi)完成,采用國內(nèi)130nm微電子工藝加工完成,擺脫了對于國外高制程光刻機(jī)的依賴,無需在工藝制程上進(jìn)行追趕。
“芯片的設(shè)計、加工、封裝、測試全部在國內(nèi)完成,擺脫了對國外高制程光刻機(jī)的依賴,所以說是我國在芯片領(lǐng)域換道超車的核心技術(shù)。”白冰說。
白冰表示,未來芯片主要還是針對人工智能領(lǐng)域的應(yīng)用與發(fā)展。目前光子人工智能芯片的產(chǎn)品部署主要集中于設(shè)備端,預(yù)計于2022年將光子芯片運(yùn)用到云端。
記者了解到,第三代半導(dǎo)體是北京市高精尖產(chǎn)業(yè)的重要內(nèi)容,也是順義確定發(fā)展的三大創(chuàng)新型產(chǎn)業(yè)集群之一。當(dāng)前,順義正布局全產(chǎn)業(yè)鏈,7.1萬平方米的第三代半導(dǎo)體材料及應(yīng)用聯(lián)合創(chuàng)新基地已于去年12月竣工。目前,中關(guān)村科技園區(qū)順義園管理委員會已與其團(tuán)隊(duì)簽約,項(xiàng)目正式落戶順義。
據(jù)介紹,上海也已開始光子芯片的布局,計劃到2021年建成全國硅光子芯片研發(fā)和中試基地,到2025年量產(chǎn)平臺實(shí)現(xiàn)芯片批量供貨,成為國際知名硅光子的研發(fā)、制造基地。
白冰介紹,光子人工智能芯片是指采用硅基光子集成技術(shù),讓光提供算力,為人工智能應(yīng)用提供高性能的硬件支持。第一個層面是“人工智能芯片”。如果一個芯片要跑得非常快、非常省電,一定是芯片的物理結(jié)構(gòu)跟軟件高度匹配,這樣才能達(dá)到一個比較高的效率。包括現(xiàn)在的人臉識別、自動駕駛、安防監(jiān)控、AI金融、AI醫(yī)療等,實(shí)際上都是一種人工智能算法,要設(shè)計一款芯片結(jié)構(gòu)跟其特征匹配,這就是人工智能芯片。
第二個層面是“光子”。已有的人工智能芯片都是電子芯片,電子芯片在計算速度和功耗方面會有瓶頸。光子人工智能芯片是依托硅基光子集成技術(shù),在內(nèi)部用光完成矩陣運(yùn)算與數(shù)據(jù)交換。它的計算過程與人工智能算法高度匹配,計算速度比普通電子芯片高,功耗比電子芯片低。
中科院上海微系統(tǒng)所所長助理、上海新微科技集團(tuán)總裁秦曦曾介紹,集成電路的發(fā)展沿著摩爾定律已趨于極限,硅光子技術(shù)是超越摩爾研究領(lǐng)域的發(fā)展方向之一。通過硅光集成,用光代替原來的電進(jìn)行傳輸,成本有可能降低到原來的十分之一,甚至更低。
釋疑2 與傳統(tǒng)芯片比有哪些優(yōu)勢?
白冰解釋,主要有兩方面優(yōu)勢。一個優(yōu)勢是計算速度,光子人工智能芯片的計算速度大概是電子芯片的三個數(shù)量級,約1000倍,單個電子芯片的計算速度大約是7.8TFlops,而光子人工智能芯片的計算速度大概是3200TFlops。第二個優(yōu)勢是功耗,光子人工智能芯片的功耗僅為電子芯片的百分之一,單位電子芯片和耗電量大概300W,對應(yīng)的光子人工智能芯片的耗電量只有4W。
對比不同芯片在同一情境下是否具有優(yōu)勢,要考慮性能功耗比、單位美元提供算力兩方面。性能功耗比是指消耗單位瓦特提供的性能,重在強(qiáng)調(diào)涉及多少電費(fèi),單位美元提供算力則重在強(qiáng)調(diào)芯片的生產(chǎn)成本。在這兩方面,光子人工智能芯片比電子芯片更有優(yōu)勢。
釋疑3 未來主要應(yīng)用在哪些方面?
白冰表示,光子人工智能芯片可廣泛用于手機(jī)、安防監(jiān)控、自動駕駛、服務(wù)機(jī)器人、無人機(jī)、工業(yè)物聯(lián)網(wǎng)、企業(yè)服務(wù)器和數(shù)據(jù)中心等關(guān)鍵人工智能領(lǐng)域。比如在分揀機(jī)器人機(jī)械臂上裝上攝像頭,讓它識別有什么東西,控制它去抓取等。
據(jù)其介紹,光子人工智能芯片的發(fā)展得益于人工智能的發(fā)展。光學(xué)計算芯片其實(shí)在實(shí)驗(yàn)室一直存在,但它一直沒有比較好的應(yīng)用場景,沒有辦法落地應(yīng)用。近年來伴隨著人工智能的興起,人工智能的算法特征恰好跟光學(xué)芯片物理性能匹配,這使得光學(xué)計算有了走出實(shí)驗(yàn)室、走向產(chǎn)業(yè)應(yīng)用的機(jī)會,就是這樣一個過程。
中科院“百人計劃”專家、上海微系統(tǒng)所研究員余明斌回國后也一直致力于硅光工藝平臺的建設(shè)。他認(rèn)為,這是一個可能引發(fā)巨大產(chǎn)業(yè)新空間的前瞻性技術(shù)。
光子芯片原理及世界發(fā)展現(xiàn)狀
從傳輸走向計算,光子芯片將成終極計算解決方案?
從 2006 年開始,英特爾推出首款標(biāo)準(zhǔn) CMOS 工藝的電子混合硅激光器之后,電和光這兩個截然不同的物理現(xiàn)象終于成功被湊在一起。往后數(shù)年,基于此技術(shù)的超高帶寬光學(xué)傳輸架構(gòu)更成為高性能數(shù)據(jù)中心的最愛,借此有效降低了大量數(shù)據(jù)傳輸造成的系統(tǒng)瓶頸。
2015 年,IBM 研究人員,發(fā)表了針對光子計算的新實(shí)驗(yàn)性技術(shù),通過把硅光子數(shù)組集成到與 CPU 相同的封裝尺寸中。硅光子技術(shù)的問題一直在于芯片的光學(xué)接口,不過 IBM 的光子解決方案能被應(yīng)用于系統(tǒng)單芯片 (SoC),以廉價的標(biāo)準(zhǔn)連接器 (edge connector) 在芯片之間傳輸光,或是只要將 CMOS 芯片邊緣接在一起就能進(jìn)行芯片對芯片的通訊。
這些光子芯片的發(fā)展主要是作為解決傳統(tǒng)芯片與芯片之間,或芯片與存儲系統(tǒng)之間的互連問題。而憑借集成度高的光子芯片的發(fā)明,取代了過去龐大復(fù)雜的光傳輸架構(gòu),且速度能更快,延遲更低。
然而,真正把“光子”帶往計算領(lǐng)域,甚至架構(gòu)成“光子芯片”的概念,卻是近兩年才逐漸被發(fā)掘出來。
由于半導(dǎo)體芯片技術(shù)雖依靠新應(yīng)用與算法的整合,能做到的事情也越來越多,但實(shí)際上芯片架構(gòu)本身還是基于同樣的邏輯之下,且受限于半導(dǎo)體工藝,計算能力、規(guī)模以及功耗、成本形成難以均衡的四角關(guān)系。
這時,業(yè)界也開始積極尋找能突破現(xiàn)況的新計算技術(shù)。GPGPU、神經(jīng)網(wǎng)絡(luò)芯片、DSP、FPGA 都在不同的時期被提出來,擅長解決特定應(yīng)用計算領(lǐng)域,但這些芯片并沒有解決根本的問題,也就是其基于半導(dǎo)體結(jié)構(gòu)所面臨的物理特性限制。
圖丨光子突觸作用原理
由 AI 所帶起的計算需求不斷膨脹,促進(jìn)了處理架構(gòu)持續(xù)推陳出新,譬如英特爾未來將結(jié)合 CPU 與 FPGA 計算能力,借以應(yīng)對更復(fù)雜的應(yīng)用情境;英偉達(dá)則是在其最新一代的 GPU 方案上大幅強(qiáng)化推理性能。除此之外,亦有不少希望能夠針對特定計算推出更適合的新架構(gòu),比如說類神經(jīng)網(wǎng)絡(luò)芯片 (NPU)、量子計算機(jī) (Quantum computing),以及最新的計算概念:基于光子回路 (Photonic Circuits) 的計算架構(gòu)。
實(shí)際上,“光”被使用在計算環(huán)境中已經(jīng)有超過數(shù)十年的歷史,過去主要用以在不同芯片或存儲設(shè)備間傳輸數(shù)據(jù)之用,而因?yàn)橄嚓P(guān)的傳輸技術(shù)成本太高,且必須搭配昂貴的周邊才能顯現(xiàn)出其效益,也因此,“光”的傳輸從沒有被普及到消費(fèi)市場,導(dǎo)致我們對這個事實(shí)沒有太明確的認(rèn)知。
然而,計算則是另一層次的問題。
圖丨SMART Photonics的光子芯片
用很簡單的概念解釋光子計算芯片,就是在芯片上使用了無數(shù)個光學(xué)開關(guān)器,作用就類似半導(dǎo)體芯片中的邏輯柵,利用不同波長,相位和強(qiáng)度的光線組合,在復(fù)雜的反射鏡、濾波器以及棱鏡結(jié)構(gòu)所組成的數(shù)組中進(jìn)行信息處理。
硅光子和微電子一樣,都是基于硅材料的半導(dǎo)體架構(gòu)。而硅作為光學(xué)通信傳輸方面的應(yīng)用已經(jīng)相當(dāng)普及,由于光的快速反應(yīng)和并行特性,能瞬間傳輸大量數(shù)據(jù),因此被普遍應(yīng)用在數(shù)據(jù)中心的服務(wù)器上。也因?yàn)楣庾觽鬏斶^程穩(wěn)定,并行能力強(qiáng),且糾錯設(shè)計相對簡單,傳輸和轉(zhuǎn)換所需要的能量極小,所以采用光子計算的架構(gòu)理論上可以做到相對低的功耗表現(xiàn)。其次,光子芯片理論上也能做到規(guī)模極小的應(yīng)用上,比如說移動設(shè)備中。
光子芯片可沿用目前成熟的半導(dǎo)體工藝技術(shù),而目前仍處于實(shí)驗(yàn)階段的光子芯片僅需要老舊的微米級工藝就可達(dá)到大幅超越既有半導(dǎo)體芯片的計算能力,也因此未來工藝微縮空間極大。而憑借芯片密度的增加,性能還能大幅成長,甚至有機(jī)會徹底改寫摩爾定律的限制。
沿用 CMOS 工藝是光子計算最大優(yōu)勢,但目標(biāo)非取代傳統(tǒng)半導(dǎo)體計算
由于光子芯片基本上還是以目前的 CMOS 制造工藝為基礎(chǔ),相對于量子計算使用的特殊工藝,在成本或量產(chǎn)技術(shù)方面都要更有優(yōu)勢,雖然目前實(shí)驗(yàn)室中的光子芯片在密度上還比不過傳統(tǒng)半導(dǎo)體芯片,但已經(jīng)比量子芯片好很多了。
而光子芯片的效能取決于架構(gòu)和算法,比如說同時使用多少路不同波長的光來進(jìn)行組合,或者是在芯片中使用的光學(xué)信號的帶寬,以及光電轉(zhuǎn)換時的瓶頸,但是單從光的物理特性上來看,在合適的算法上要做到傳統(tǒng)半導(dǎo)體芯片的百倍速度是不會有太大的問題的。
當(dāng)然,理論上光子芯片可以做到規(guī)模很大,也可以做到很小,但因?yàn)楣獠贿m合做非線性運(yùn)算,另外光芯片的集成度和尺寸還是會有一定的規(guī)范,要完全取代半導(dǎo)體芯片還是有很大的難度。
從芯片、算法到周邊的生態(tài)正在發(fā)展中
2017 年 6 月,麻省理工學(xué)院研究團(tuán)隊(duì)針對可程序設(shè)計納米光子處理器提出了一份論文,并且發(fā)表在《自然-光子》雜志上。該論文的第一作者及通訊作者,出生在杭州的沈亦晨目前為 Lightelligence 的聯(lián)合創(chuàng)始人兼 CEO。
沈亦晨強(qiáng)調(diào),目前 Lightelligence 的光子芯片發(fā)展已經(jīng)完成實(shí)驗(yàn)室階段的展示,在算法、總線以及存儲方面都有相對應(yīng)的設(shè)計正在進(jìn)行,當(dāng)然,計算芯片最重要的還是生態(tài),這點(diǎn)也需要更多科研機(jī)構(gòu)和公司加入到擴(kuò)展光學(xué)計算這一領(lǐng)域來共同建立。
因?yàn)橹髁Ξa(chǎn)品是芯片,所以核心部分在于算法和硬件的結(jié)合,以及相對應(yīng)的芯片指令以及編譯程序,而 Lightelligence 的工作就是要讓開發(fā)出來的芯片可以應(yīng)用到目前市場上流行的框架中,比如說 TensorFlow、Caffe 等。
另外,由于光子計算在傳輸或者是存儲有其特殊性, Lightelligence 也在開發(fā)相對應(yīng)的周邊設(shè)計。當(dāng)然,沿用目前的存儲系統(tǒng)雖可加快落地商用速度,但可能就會限制光子計算的性能表現(xiàn),因此這部分未來還是會以搭配針對光子計算優(yōu)化的設(shè)計為目標(biāo),才更能凸顯光子計算的整體優(yōu)勢。
如今 Lightelligence 團(tuán)隊(duì)正努力改善光子計算的相關(guān)生態(tài),目前當(dāng)然還不成熟,不過業(yè)界對于高性能計算,甚至更好的神經(jīng)網(wǎng)絡(luò)計算架構(gòu)有著非常高的期待,相信其光子計算架構(gòu)落地之后,可以大大加速整體 AI 計算生態(tài)的變革。
沈亦晨表示,不論是特定用途,或者是針對通用計算能力,這個都會是芯片架構(gòu)發(fā)展的不同過程的選擇。Lightelligence首先還是會以技術(shù)或應(yīng)用場景比較成熟的光子芯片應(yīng)用著手,然后再逐步去擴(kuò)大可應(yīng)用的范圍。同時也在努力開發(fā)光子芯片前后端的技術(shù),為未來不同的計算場景進(jìn)行更好的適配。
沈亦晨強(qiáng)調(diào),總體來講,在實(shí)現(xiàn)光子計算的路上還有很多重大的工程改進(jìn)需要完成,但和過去的種種光子計算的嘗試相比,現(xiàn)在可能是最好的時機(jī),也是最接近實(shí)現(xiàn)的一次。
光子計算在處理一些 AI 算法時有獨(dú)特的優(yōu)勢
事實(shí)上,光子芯片或許將會是未來最適合用來作為 AI 計算的硬件架構(gòu),這是因?yàn)楣獾奶匦韵忍爝m合線性計算(AI 計算里最重要的部分),這包含了高維度的并行計算。相對的,雖然量子計算近來也因?yàn)?AI 而受到關(guān)注,但量子計算還是比較偏向擅長解碼或搜索的領(lǐng)域,另外在量產(chǎn)的生態(tài)上也還不太成熟,但潛力卻不容小覷。
EETOP 官方微信
創(chuàng)芯大講堂 在線教育
半導(dǎo)體創(chuàng)芯網(wǎng) 快訊
相關(guān)文章