99精品在线观看-99精品在线免费观看-99精品在线视频观看-99精品这里只有精品高清视频-99九九精品国产高清自在线

x

微軟發布最輕量級大語言模型!可在CPU上高效運行

2025-04-18 11:42:24 EETOP
點擊關注->創芯網公眾號,后臺告知EETOP論壇用戶名,獎勵200信元

微軟研究人員剛剛創建了 BitNet b1.58 2B4T,這是一個開源的 1 比特大語言模型(LLM),擁有 20 億個參數,在 4 萬億個詞元上進行了訓練。但這個人工智能模型的獨特之處在于它足夠輕量,可以在中央處理器CPU)上高效運行,《科技創業》雜志稱蘋果 M2 芯片就能運行它。該模型在 Hugging Face 平臺上也可輕易獲取,任何人都能對其進行測試

Bitnet 使用 1 比特權重,只有三種可能的值:-1、0 和 + 1 —— 從技術上講,由于支持三種值,它是一個 “1.58 比特模型” 。與采用 32 比特或 16 比特浮點格式的主流人工智能模型相比,這節省了大量內存,使其運行效率更高,對內存和計算能力的需求也更低。不過,Bitnet 的簡單性也有一個缺點 —— 與更大的人工智能模型相比,它的準確性較差。然而,BitNet b1.58 2B4T 憑借其龐大的訓練數據彌補了這一點,據估計這些數據相當于 3300 多萬本書。

這個輕量級模型背后的團隊將其與領先的主流模型進行了對比,包括 Meta 的 LLaMa 3.2 1B、谷歌的 Gemma 3 1B 和阿里巴巴的 Qwen 2.5 1.5B。在大多數測試中,BitNet b1.58 2B4T 與這些模型相比得分相對較高,甚至在一些基準測試中名列前茅。更重要的是,它在非嵌入式內存中僅占用 400MB,不到第二小的模型(Gemma 3 1B,占用 1.4GB)的 30% 。

1.jpg

然而,這個大語言模型必須使用 bitnet.cpp 推理框架才能如此高效地運行。該團隊特別指出,“在使用標準的 Transformer 庫時,即使是經過必要修改的版本,這個模型也無法獲得性能效率提升” 。

如果你想在輕量級硬件上利用它的優勢,就需要獲取 GitHub 上提供的該框架。該代碼庫稱 bitnet.cpp 提供了 “一套經過優化的內核,支持在 CPU 上對 1.58 比特模型進行快速無損推理(接下來還將支持神經網絡處理器和圖形處理器)” 。雖然目前它還不支持人工智能專用硬件,但它仍能讓任何擁有電腦的人在無需昂貴組件的情況下進行人工智能實驗。

人工智能模型常常因訓練和運行時能耗過高而受到批評。但像 BitNet b1.58 2B4T 這樣的輕量級大語言模型可以幫助我們在性能較弱的硬件上本地運行人工智能模型。這可以減少我們對大型數據中心的依賴,甚至能讓那些沒有配備內置神經網絡處理器的最新處理器以及最強大圖形處理器的人也能使用人工智能


關鍵詞: 微軟 AI 芯片

  • EETOP 官方微信

  • 創芯大講堂 在線教育

  • 半導體創芯網 快訊

全部評論

主站蜘蛛池模板: 国产在线观看不卡| 91小视频在线观看| 亚洲国产精品一区二区不卡 | 九九亚洲精品自拍| 国产大学生毛片一级高清| 精品国产91久久久久久久| 亚洲国产日韩在线人高清不卡 | 久久久精品日本一区二区三区| 成人免费黄色网址| 欧美特黄一级高清免费的香蕉| 国产精品自在线拍国产| 91久久九九精品国产综合| 国产一区二区丁香婷婷| 欧美日韩综合视频| 亚洲va久久久久| 天堂影院jav成人天堂免费观看 | 国产精品黄在线观看观看| 91探花在线视频| 国产亚洲欧美精品久久久| 免费精品美女久久久久久久久久| 亚洲国产第一区二区香蕉 | 乱子伦xxxxvideos| 性大片免费视频观看| 91原创视频在线观看| 国产精品久久久久影院色| 久久99精品久久久久久青青91 | 亚洲一区二区成人| 中文字幕日本一级高清片| 全黄毛片| 免费特级黄色片| 欧美成人片在线| 性网站在线| 黄色片网站在线免费观看| 九草在线视频| 亚洲成人一区| 亚洲欧美日韩国产精品网| 久久99精品久久只有精品| 日本成人片网站| 日本在线播放一区| 日韩一区二区三区免费视频 | 日本综合欧美一区二区三区|