國產突破!芯片設計核心調度器實現完全自主自研!
2023-08-25 12:07:26 速石本篇一共五個章節:
一、介紹一下主角——速石自研調度器Fsched
二、只要有個調度器,就夠了嗎?
三、全面對比:速石研發平臺 VS LSF Suite
四、如果你想嘗試AI——
五、不止半導體領域。。。。
介紹一下主角 速石自研調度器Fsched 01 我們的Fsched調度器到底厲害在哪?
Fsched性能指標 吞吐量: 1000 jobs/second 響應時間: 1 ms 集群規模: 單個Fsched集群能夠支持的最大節點數:1000 單個Fsched集群能夠支持的最大CPU核數:30000
02 代碼級技術支持有什么不一樣? 03 Slurm之上,我們還做了什么? 只要有個調度器 就夠了嗎?
答案自然是否定的。
為什么?
或許,我們可以換個角度來回答這個問題。
就像汽車出現之前,用戶的期望永遠是——1匹更快的馬一樣。
在當下芯片設計研發領域,我們如果把調度器類比馬,那么汽車是什么呢?
我們給大家簡單描繪一下:
一個站在整個芯片設計研發體系和架構視角來滿足EDA行業用戶性能、功能、體驗的產品。
1. Ta是完整的一體化產品,功能緊密耦合,且經過層層實戰考驗;
2. Ta解決的是完整生命周期的芯片設計業務問題,調度器只是其中一個模塊;
3. Ta具有對企業未來發展的彈性,能擴展至不同規模和更多業務路線,比如AI。
而這,正是我們與其他很多產品最大的區別之一。
我們的產品在設計之初就是面向EDA應用,服務芯片設計研發業務場景的。這也決定了我們解決問題的出發點永遠是:是否滿足研發業務需求,然后從上至下地解決問題。
01 一整套上中下層聯動的芯片研發環境
我們提供的是一整套上中下層聯動的芯片設計研發環境:
1. 連接上層EDA應用,對應用本身的運行提供支持和優化;
2. 連接底層資源,給用戶提供更靈活,更高效使用資源的能力;
3. 結合EDA應用和底層資源的聯動和適配,給出最佳實踐經驗。
02 功能面向實際業務場景設計和提供
我們的功能都是面向實際業務場景設計和提供的:
1. License調度優化,可幫助企業用戶最大化提升License利用率,更好地規劃License購買策略,控制整體使用成本;
2. 我們能多維度監控任務狀態,提供基于EDA任務層的監控、告警、數據統計分析功能與服務,讓團隊管理者監控各個重要指標變化,從全局角度掌握項目的整體任務及資源情況,為未來項目合理規劃、集群生命周期管理、成本優化提供支持;
3. 日常數據統計與運營分析管理,實現問題可追溯,可追蹤,降低成本,提升整體項目管理效率。
03 交互方式不改變EDA用戶使用習慣
我們的交互方式不改變EDA用戶的使用習慣。原來怎么用,現在還怎么用。
速石研發平臺 VS LSF Suite
半導體行業用戶最熟悉的調度器是LSF,就不多介紹了。
不過,它背后的LSF Suite大家就不一定熟悉了。
來來,我們盤一下,我們速石研發平臺跟LSF Suite的區別是什么?
01 根本區別:設計理念不一樣 02 性價比:速石研發平臺TCO更低
下圖是我們研發平臺與LSF Suite的橫向對比圖,可以清楚地看到,兩者的收費模式差別很大。
我們Fsched調度器是包含在平臺費用里的,相關組件也都是隨產品一起內置的,不單獨收費。
而LSF Suite除了核心調度器按使用核數收費以外,所有功能組件都需要額外收費。
從總擁有成本來看,對用戶來說,速石研發平臺付出的成本更低,獲得的東西更多。還有很多隱性成本沒有列在表格里,比如對接調試時間成本,人工成本,售后支持成本等等。
總結一下,我們跟LSF Suite的五大主要區別:
如果你想嘗試AI——
路線一:AI+EDA工具
Synopsys、Cadence與Siemens等公司紛紛在其最新工具中使用了AI技術,覆蓋先進數字與模擬芯片的設計、驗證、測試和制造環節,讓開發者在芯片開發的每一個階段都可以采用借助AI的自主學習能力,提供芯片設計生產力。
當然,越來越多EDA工具也支持借助GPU進行運算加速。
路線二:AI算法模型訓練
Google研究人員使用10,000個芯片布局圖來訓練他們的深度學習模型——PRIME,人工智能生成的芯片的設計時間不到六個小時。
而NVIDIA設計了另一種用于芯片設計的深度學習方法——PrefixRL模型,NVIDIA使用其RL工具設計的電路比人類使用當今EDA工具設計的電路小25%,但性能相似。
路線一需要支持全流程EDA工具的一整套研發環境,以及構建異構資源(CPU+GPU、本地+云上)的調度及管理平臺的能力。
路線二需要的支持企業從ML/LLM模型構建、大規模訓練到最終部署需求的MLOps模塊。
我們都有。
另外,我們剛剛發布的一款行業知識庫聊天應用Megrez,面向企業客戶提供大語言模型的私有化部署能力,允許用戶自定義行業知識庫,實現領域知識的問答。
Megrez基于芯片設計領域提供的支持
不止半導體領域。。。。
在半導體以外的其他行業,如生命科學、汽車/智能制造,我們也表現不錯:
汽車/智能制造
這樣跑COMSOL,是不是就可以發Nature了
LS-DYNA求解效率深度測評 │ 六種規模,本地VS云端5種不同硬件配置
怎么把需要45天的突發性Fluent仿真計算縮短到4天之內?
從4天到1.75小時,如何讓Bladed仿真效率提升55倍?
生命科學
王者帶飛LeDock!開箱即用&一鍵定位分子庫+全流程自動化,3.5小時完成20萬分子對接
1分鐘告訴你用MOE模擬200000個分子要花多少錢
155個GPU!多云場景下的Amber自由能計算
提速2920倍!用AutoDock Vina對接2800萬個分子