魏少軍:中國應(yīng)放棄英偉達(dá)GPU!
2025-09-12 05:24:22 EETOP據(jù)彭博社報(bào)道,中國半導(dǎo)體行業(yè)協(xié)會(huì)副會(huì)長、IEEE Fellow、清華大學(xué)教授魏少軍在新加坡召開的一個(gè)行業(yè)論壇上警告稱,依賴美國硬件將對中國及其亞洲伙伴構(gòu)成長期風(fēng)險(xiǎn)。呼吁中國與其他亞洲國家摒棄使用英偉達(dá) GPU 進(jìn)行 AI 訓(xùn)練與推理。
魏少軍批評當(dāng)前亞洲 AI 發(fā)展模式過度效仿美國路徑 —— 即采用英偉達(dá)或 AMD 的計(jì)算 GPU 訓(xùn)練大型語言模型。他指出,這種模仿會(huì)削弱地區(qū)自主性,若不加以改變可能產(chǎn)生 “致命” 影響。在他看來,亞洲必須突破美國技術(shù)范式,尤其要在算法設(shè)計(jì)與計(jì)算基礎(chǔ)設(shè)施等基礎(chǔ)領(lǐng)域另辟蹊徑。
2023 年美國政府對出口中國的 AI 及高性能計(jì)算處理器實(shí)施性能限制后,中國面臨顯著的硬件瓶頸,前沿 AI 模型的訓(xùn)練進(jìn)程因此放緩。盡管挑戰(zhàn)重重,魏少軍以DeepSeek的崛起為例,強(qiáng)調(diào)中國企業(yè)即便缺乏尖端硬件,仍有能力實(shí)現(xiàn)算法層面的重大突破。他同時(shí)提到,由于英偉達(dá)H20芯片可能會(huì)有后門而遭到中國的抵制采用部分國產(chǎn)替代,這標(biāo)志著中國正推動(dòng) AI 基礎(chǔ)設(shè)施的真正自主化。但他也承認(rèn),中國半導(dǎo)體產(chǎn)業(yè)雖取得進(jìn)展,仍落后美國及中國臺灣地區(qū)數(shù)年,短期內(nèi)本土企業(yè)難以研發(fā)出性能可媲美英偉達(dá)高端產(chǎn)品的 AI 加速器。
魏少軍建議,中國應(yīng)開發(fā)專為大語言模型訓(xùn)練定制的新型處理器,而非繼續(xù)依賴原本針對圖形處理設(shè)計(jì)的 GPU 架構(gòu)。盡管他未詳述具體設(shè)計(jì)方案,但其言論釋放出明確信號:呼吁在芯片層面推動(dòng)本土創(chuàng)新,以支撐中國的 AI 發(fā)展雄心。不過,他并未提及中國計(jì)劃如何在半導(dǎo)體制造競賽中追趕中國臺灣地區(qū)與美國。
他以自信的基調(diào)總結(jié)道,盡管多年來面臨美國出口管制與政治壓力,中國仍擁有充足資金與堅(jiān)定決心,持續(xù)構(gòu)建本土半導(dǎo)體生態(tài)。其核心主張清晰可見:中國必須停止追隨,轉(zhuǎn)而通過開發(fā)契合自身技術(shù)與戰(zhàn)略需求的獨(dú)特解決方案,在 AI 領(lǐng)域?qū)崿F(xiàn)引領(lǐng)。
背景補(bǔ)充: 英偉達(dá) GPU 在 AI 領(lǐng)域的主導(dǎo)地位源于其大規(guī)模并行計(jì)算架構(gòu) —— 這種設(shè)計(jì)極其適合加速深度學(xué)習(xí)中密集的矩陣運(yùn)算,效率遠(yuǎn)超 CPU。2006 年推出的 CUDA 軟件棧更讓開發(fā)者能為 GPU 編寫通用代碼,推動(dòng) TensorFlow、PyTorch 等深度學(xué)習(xí)框架將英偉達(dá)硬件標(biāo)準(zhǔn)化。此后,英偉達(dá)通過專用硬件(Tensor Core、混合精度計(jì)算格式)、緊密的軟件集成及廣泛的云服務(wù)與原廠支持,進(jìn)一步鞏固優(yōu)勢,使其 GPU 成為 AI 訓(xùn)練與推理的默認(rèn)計(jì)算支柱。例如,面向數(shù)據(jù)中心的 Blackwell 等現(xiàn)代架構(gòu)已針對 AI 任務(wù)做了大量優(yōu)化,幾乎與圖形處理無關(guān)。相比之下,魏少軍倡導(dǎo)的專用 ASIC 芯片,目前在 AI 訓(xùn)練與推理領(lǐng)域尚未形成競爭力。
不過值得欣慰的是,近期博通(Broadcom)憑借定制化 AI 芯片解決方案斬獲巨額訂單 —— 據(jù)行業(yè)披露,其為全球頭部云服務(wù)廠商量身打造的專用 AI 加速芯片,不僅拿下百億美元采購合約,更在實(shí)測中展現(xiàn)出與英偉達(dá) GPU 比肩的 AI 推理性能,且在電商推薦、圖像識別等特定場景下,功耗比還低出 15%-20%。這一突破不僅打破了 “英偉達(dá) GPU 壟斷 AI 硬件市場” 的固有認(rèn)知,更給中國探索用自主 ASIC(專用集成電路)芯片替代英偉達(dá) GPU 提供了關(guān)鍵參照。
事實(shí)上,中國本土企業(yè)近年已在 ASIC 賽道逐步發(fā)力:部分 AI 巨頭通過聯(lián)合芯片設(shè)計(jì)廠商,針對大語言模型輕量化推理、工業(yè)級 AI 質(zhì)檢等場景開發(fā)定制化芯片,在成本控制與能效比上取得初步成果;國內(nèi)在芯片設(shè)計(jì)工具(EDA)、低功耗電路設(shè)計(jì)等領(lǐng)域的技術(shù)突破,也為 ASIC 的規(guī)模化研發(fā)掃清了部分障礙。當(dāng)然,要實(shí)現(xiàn)對英偉達(dá) GPU 的全面替代,中國仍需突破生態(tài)適配瓶頸 —— 比如構(gòu)建支持 ASIC 的深度學(xué)習(xí)框架插件、推動(dòng)云廠商與芯片企業(yè)的 “場景 - 芯片” 協(xié)同開發(fā),以及解決高端制程芯片制造的產(chǎn)能與良率問題。但博通的成功案例已明確證明,定制化 ASIC 絕非 “小眾賽道”,而是能憑借場景針對性打開市場空間的可行路徑,這無疑為中國推進(jìn) AI 硬件自主化提供了新的信心與實(shí)踐思路。
EETOP 官方微信
創(chuàng)芯大講堂 在線教育
半導(dǎo)體創(chuàng)芯網(wǎng) 快訊
相關(guān)文章