99精品在线观看-99精品在线免费观看-99精品在线视频观看-99精品这里只有精品高清视频-99九九精品国产高清自在线

x

發布即可部署!英特爾酷睿Ultra平臺完成百度文心4.5模型端側適配

2025-07-01 09:49:57 EETOP
點擊關注->創芯網公眾號,后臺告知EETOP論壇用戶名,獎勵200信元

今天,百度正式發布文心大模型4.5系列開源模型。英特爾OpenVINO?與百度飛槳多年來一直保持著緊密的合作。在此次文心系列模型的發布過程中,英特爾借助OpenVINO?在模型發布的第零日即實現對文心端側模型的適配和在英特爾酷睿Ultra平臺上的端側部署。

OpenVINO?工具套件是由英特爾開發的開源工具套件,旨在優化和加速深度學習模型的推理性能,支持跨平臺部署并充分利用英特爾硬件資源。OpenVINO?助力行業中廣泛的先進模型在英特爾人工智能產品和解決方案中的性能,應用在AI PC、邊緣AI和更多人工智能的使用場景當中。

image.png

2021年開始,百度飛槳和英特爾OpenVINO?進行深入合作,雙方進行深度適配,為開發者提供了更有效更便捷的AI開發工具鏈。經過雙方適配的眾多模型,如PaddleOCRPaddleSegPaddleDection等,在金融、醫療、智能智造等領域被廣泛應用,開發者可以直接將飛槳模型用OpenVINOTM推理和部署,或通過OpenVINO?的模型優化器轉化為IR格式,進一步部署和推理。

今天,百度基于多年積累的雄厚的AI技術實力,為業界帶來了開源的文心4.5系列大模型。英特爾宣布OpenVINO?已經對0.3B參數量的稠密模型成功適配,并在英特爾酷睿Ultra平臺上成功部署且獲得了優異的推理性能。

英特爾助力百度文心大模型的首次亮相,共同為行業帶來全新的人工智能體驗。接下來,英特爾將持續與百度保持緊密合作,適配更多的文心系列模型,攜手拓寬AI技術的新邊界。

快速上手指南 (Get Started)

第一步,環境準備

基于以下命令可以完成模型部署任務在Python上的環境安裝。

 python -m venv py_venv 

./py_venv/Scripts/activate.bat 

pip install --pre -U openvino-genai --extra-index-url https://storage.openvinotoolkit.org/simple/wheels/nightly 

pip install nncf

pip install git+intel.git@ernie" title="https://github.com/openvino-dev-samples/optimum-intel.git@ernie">https://github.com/openvino-dev-samples/optimum-intel.git@ernie

第二步,模型下載和轉換

在部署模型之前,我們首先需要將原始的PyTorch模型轉換為OpenVINOTMIR靜態圖格式,并對其進行壓縮,以實現更輕量化的部署和最佳的性能表現。通過Optimum提供的命令行工具optimum-cli,我們可以一鍵完成模型的格式轉換和權重量化任務:

optimum-cli export openvino --model baidu/ERNIE-4.5-0.3B-PT --task text-generation-with-past --weight-format fp16 --trust-remote-code ERNIE-4.5-0.3B-PT-OV

開發者可以根據模型的輸出結果,調整其中的量化參數,包括:

· --model為模型在HuggingFace上的model id,這里我們也提前下載原始模型,并將model id替換為原始模型的本地路徑,針對國內開發者,推薦使用ModelScope魔搭社區作為原始模型的下載渠道,具體加載方式可以參考ModelScope官方指南:https://www.modelscope.cn/docs/models/download

· --weight-format:量化精度,可以選擇fp32,fp16,int8,int4,int4_sym_g128,int4_asym_g128,int4_sym_g64,int4_asym_g64

· --group-size:權重里共享量化參數的通道數量

· --ratioint4/int8權重比例,默認為1.00.6表示60%的權重以int4表,40%int8表示

· --sym:是否開啟對稱量化

第三步,模型部署

針對ERNIE-4.5系列的文本生成類模型,我們可以使用Optimum-Intel進行任務部署和加速。Optimum-Intel可以通過調用OpenVINO?  runtime后端,以實現在Intel CPUGPU平臺上的性能優化,同時由于其兼容Transformers庫,因此我們可以直接參考官方示例,將其遷移至Optimum-Intel執行。

from transformers import AutoTokenizer

from optimum.intel import OVModelForCausalLM

 

model_path = "ERNIE-4.5-0.3B-PT-OV"

# load the tokenizer and the model

tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)

model = OVModelForCausalLM.from_pretrained(model_path, trust_remote_code=True)

 

# prepare the model input

prompt = "Give me a short introduction to large language model."

messages = [

    {"role": "user", "content": prompt}

]

text = tokenizer.apply_chat_template(

    messages,

    tokenize=False,

    add_generation_prompt=True

)

model_inputs = tokenizer([text], add_special_tokens=False, return_tensors="pt").to(model.device)

 

# conduct text completion

generated_ids = model.generate(

    model_inputs.input_ids,

    max_new_tokens=1024

)

output_ids = generated_ids[0][len(model_inputs.input_ids[0]):].tolist()

 

# decode the generated ids

generate_text = tokenizer.decode(output_ids, skip_special_tokens=True).strip("\n")

print("generate_text:", generate_text)

 

輸入結果參考:

generate_text: "Large Language Models (LLMs) are AI-powered tools that use natural language processing (NLP) techniques to generate human-like text, answer questions, and perform reasoning tasks. They leverage massive datasets, advanced algorithms, and computational power to process, analyze, and understand human language, enabling conversational AI that can understand, interpret, and respond to a wide range of inputs. Their applications range from customer support to academic research, from language translation to creative content generation."


關鍵詞: 英特爾 OpenVINO 百度飛槳

  • EETOP 官方微信

  • 創芯大講堂 在線教育

  • 半導體創芯網 快訊

全部評論

主站蜘蛛池模板: 欧美性色黄大片a级毛片视频| 成人国产一区二区| 高颜值露脸极品在线播放| 国产在视频线在精品| 五月天婷婷一区二区三区久久| xxx国产hd| 日本免费在线一区| 亚洲黄色成人| 产国语一级特黄aa大片| 国产牛仔裤系列在线观看| 看免费毛片| 韩国精品一区二区久久| 国产成人精品免费视频大全可播放的| 女人18毛片久久鬼色| 午夜亚洲精品久久久久久| 在线观看麻豆国产精品| 一级一级毛片看看| 久久久国产精品免费| 中文字幕yellow在线资源| 亚洲第一黄色网| 成人免费福利片在线观看| 欧美一级毛片一| 国产 在线 | 日韩| 国产欧美性综合视频性刺激 | 一级毛片免费不卡在线| 日本高清视频网址| 永久黄色免费网站| 亚洲高清视频网站| 成人欧美一区二区三区在线观看 | 激情伊人| 蝌蚪久久窝| 男女啪视频大全1000| 日本高清久久| 日韩欧免费一区二区三区| 午夜三级在线| 婷婷天堂| 日韩人成| 欧美精品v国产精品v| 免费涩涩在线视频网| 欧美二区三区| 免费国产在线视频|