中國算法讓GPU性能提升800倍!
2025-02-01 15:25:26 EETOP隨著國產AI DeepSeek崛起,低成本AI訓練引發了科技圈的震動。而近日,一篇在《計算力學學報》上發表的最新研究成果,將人們的目光再次引向了中國。
中國研究者近日開發出一種高性能算法,能夠在普通消費者級別的GPU上解決復雜的材料設計問題,與傳統方法相比,速度提升了驚人的800倍。這一成果由深圳北理莫斯科大學(由洛蒙諾索夫莫斯科國立大學和北京理工大學聯合創辦)的研究團隊研發,該算法極大地提高了近場動力學(PD)的計算效率。近場動力學是一種前沿的非局部理論,能夠解決裂紋、損傷和斷裂等復雜的物理問題。
這一突破為在廣泛可用的、低成本且不受美國制裁的芯片上解決各行業復雜的機械問題開辟了新的可能性,包括航空航天和軍事應用等領域。
近場動力學在材料損傷建模方面已經展現出其優勢,但其高計算復雜性傳統上導致大規模模擬效率低下,存在內存占用高和處理速度慢等難題。為了應對這些挑戰,深圳北理莫斯科大學的楊楊副教授利用英偉達(Nvidia)的CUDA編程技術,創建了PD-General框架。
通過對GPU芯片獨特結構的深入分析,楊楊副教授的團隊優化了算法設計和內存管理,從而實現了顯著的性能提升。這一研究成果于1月8日發表在《計算力學學報》(中文版)上,引起了業界的廣泛關注。
該文章的第一完成單位是深圳北理莫斯科大學,作者為楊楊副教授和南方科技大學碩士研究生蘇梓鑫。1月31日,在接受深圳商報采訪時,楊楊副教授表示,這項成果的最大創新在于無需更換GPU,即可將計算效能“最大化”,為工業軟件的核心技術國產化貢獻了重要力量。
“這種高效的計算能力使研究人員能夠將通常需要數天的計算減少到僅需幾個小時——甚至幾分鐘——只需使用普通的家用級GPU,這對于近場動力學研究來說是一個重大的進步,”楊楊在論文中寫道。
楊楊副教授還透露,這項研究之所以能夠取得突破,得益于團隊的跨學科合作。她本人是研究力學算法的,但團隊中的碩士研究生則專注于計算機領域,對計算機架構有深入的了解。“跨學科的合作與碰撞,使得我們提出了一個全新的思路,也走出了不一樣的路。”楊楊說道。這一合作模式不僅促進了技術的創新,也為未來的科研合作提供了新的思路。
通用寄存器優化算法示意圖,展示了算法優化過程中的關鍵技術和步驟。