<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      百度文心4.5來襲!英特爾Day0即支持端側部署

      0
      分享至



      今天,百度正式發布文心大模型4.5系列開源模型。英特爾OpenVINOTM與百度飛槳多年來一直保持著緊密的合作。在此次文心系列模型的發布過程中,英特爾借助OpenVINOTM在模型發布的第零日即實現對文心端側模型的適配和在英特爾酷睿Ultra平臺上的端側部署。
      OpenVINOTM工具套件是由英特爾開發的開源工具套件,旨在優化和加速深度學習模型的推理性能,支持跨平臺部署并充分利用英特爾硬件資源。OpenVINOTM助力行業中廣泛的先進模型在英特爾人工智能產品和解決方案中的性能,應用在AI PC、邊緣AI和更多人工智能的使用場景當中。
      從2021年開始,百度飛槳和英特爾OpenVINOTM進行深入合作,雙方進行深度適配,為開發者提供了更有效更便捷的AI開發工具鏈。經過雙方適配的眾多模型,如PaddleOCR,PaddleSeg,PaddleDection等,在金融、醫療、智能智造等領域被廣泛應用,開發者可以直接將飛槳模型用OpenVINOTM推理和部署,或通過OpenVINOTM的模型優化器轉化為IR格式,進一步部署和推理。
      今天,百度基于多年積累的雄厚的AI技術實力,為業界帶來了開源的文心4.5系列大模型。英特爾宣布OpenVINOTM已經對0.3B參數量的稠密模型成功適配,并在英特爾酷睿Ultra平臺上成功部署且獲得了優異的推理性能。
      英特爾助力百度文心大模型的首次亮相,共同為行業帶來全新的人工智能體驗。接下來,英特爾將持續與百度保持緊密合作,適配更多的文心系列模型,攜手拓寬AI技術的新邊界。
      快速上手指南 (Get Started)
      第一步,環境準備
      基于以下命令可以完成模型部署任務在Python上的環境安裝。
      python -m venv py_venv
      ./py_venv/Scripts/activate.bat
      pip install --pre -U openvino-genai --extra-index-url https://storage.openvinotoolkit.org/simple/wheels/nightly
      pip install nncf
      pip install git+https://github.com/openvino-dev-samples/optimum-intel.git@ernie
      第二步,模型下載和轉換
      在部署模型之前,我們首先需要將原始的PyTorch模型轉換為OpenVINOTM的IR靜態圖格式,并對其進行壓縮,以實現更輕量化的部署和最佳的性能表現。通過Optimum提供的命令行工具optimum-cli,我們可以一鍵完成模型的格式轉換和權重量化任務:
      optimum-cli export openvino --model baidu/ERNIE-4.5-0.3B-PT --task text-generation-with-past --weight-format fp16 --trust-remote-code ERNIE-4.5-0.3B-PT-OV
      開發者可以根據模型的輸出結果,調整其中的量化參數,包括:
      --model: 為模型在HuggingFace上的model id,這里我們也提前下載原始模型,并將model id替換為原始模型的本地路徑,針對國內開發者,推薦使用ModelScope魔搭社區作為原始模型的下載渠道,具體加載方式可以參考ModelScope官方指南:https://www.modelscope.cn/docs/models/download
      --weight-format:量化精度,可以選擇fp32,fp16,int8,int4,int4_sym_g128,int4_asym_g128,int4_sym_g64,int4_asym_g64
      --group-size:權重里共享量化參數的通道數量
      --ratio:int4/int8權重比例,默認為1.0,0.6表示60%的權重以int4表,40%以int8表示
      --sym:是否開啟對稱量化
      第三步,模型部署
      針對ERNIE-4.5系列的文本生成類模型,我們可以使用Optimum-Intel進行任務部署和加速。Optimum-Intel可以通過調用OpenVINOTM runtime后端,以實現在Intel CPU及GPU平臺上的性能優化,同時由于其兼容Transformers庫,因此我們可以直接參考官方示例,將其遷移至Optimum-Intel執行。
      from transformers import AutoTokenizer
      from optimum.intel import OVModelForCausalLM
      model_path = "ERNIE-4.5-0.3B-PT-OV"
      # load the tokenizer and the model
      tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
      model = OVModelForCausalLM.from_pretrained(model_path, trust_remote_code=True)
      # prepare the model input
      prompt = "Give me a short introduction to large language model."
      messages = [
      {"role": "user", "content": prompt}
      ]
      text = tokenizer.apply_chat_template(
      messages,
      tokenize=False,
      add_generation_prompt=True
      )
      model_inputs = tokenizer([text], add_special_tokens=False, return_tensors="pt").to(model.device)
      # conduct text completion
      generated_ids = model.generate(
      model_inputs.input_ids,
      max_new_tokens=1024
      )
      output_ids = generated_ids[0][len(model_inputs.input_ids[0]):].tolist()
      # decode the generated ids
      generate_text = tokenizer.decode(output_ids, skip_special_tokens=True).strip("\n")
      print("generate_text:", generate_text)
      輸入結果參考:
      generate_text: "Large Language Models (LLMs) are AI-powered tools that use natural language processing (NLP) techniques to generate human-like text, answer questions, and perform reasoning tasks. They leverage massive datasets, advanced algorithms, and computational power to process, analyze, and understand human language, enabling conversational AI that can understand, interpret, and respond to a wide range of inputs. Their applications range from customer support to academic research, from language translation to creative content generation."

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      南京博物院一陶俑撞臉郭德綱,院方:的確在歷史館展出

      南京博物院一陶俑撞臉郭德綱,院方:的確在歷史館展出

      上游新聞
      2026-02-03 14:41:06
      15萬億瞬間蒸發!特朗普終于動手:這是一場針對中國的金融屠殺?

      15萬億瞬間蒸發!特朗普終于動手:這是一場針對中國的金融屠殺?

      來科點譜
      2026-02-02 19:37:47
      金刻羽:比起其學術成就,人們更喜歡看一顆優質大白菜被野豬拱了

      金刻羽:比起其學術成就,人們更喜歡看一顆優質大白菜被野豬拱了

      廖保平
      2026-02-03 09:05:59
      新華社權威快報|2026年中央一號文件發布

      新華社權威快報|2026年中央一號文件發布

      新華社
      2026-02-03 18:17:08
      2032奧運會舉辦地確定,結果意外改變全球奧運格局

      2032奧運會舉辦地確定,結果意外改變全球奧運格局

      余憁搞笑段子
      2026-02-02 16:48:20
      哈登被曝申請離隊 美媒曬四次交易申請圖:哥們兒在哪都不開心

      哈登被曝申請離隊 美媒曬四次交易申請圖:哥們兒在哪都不開心

      Emily說個球
      2026-02-03 14:27:07
      深圳一家商場稱西貝門店“選擇了最不體面的方式逃場”,要求其恢復營業,當事雙方回應

      深圳一家商場稱西貝門店“選擇了最不體面的方式逃場”,要求其恢復營業,當事雙方回應

      極目新聞
      2026-02-03 16:25:44
      夫妻網購娃娃菜食用中毒系丈夫下毒,此前曾淡定接受媒體采訪

      夫妻網購娃娃菜食用中毒系丈夫下毒,此前曾淡定接受媒體采訪

      可達鴨面面觀
      2026-02-03 14:12:43
      受賄1.17億余元,李微微一審被判無期!中紀委曾通報:對家人失管失教,大搞“全家腐”

      受賄1.17億余元,李微微一審被判無期!中紀委曾通報:對家人失管失教,大搞“全家腐”

      每日經濟新聞
      2026-02-03 18:06:05
      “老子不是怕死的人”,改判死刑后,兇手竟口出狂言

      “老子不是怕死的人”,改判死刑后,兇手竟口出狂言

      南方都市報
      2026-02-03 14:31:45
      打虎!連輯被查

      打虎!連輯被查

      新京報政事兒
      2026-02-03 18:19:14
      大跌19.36%!福石控股50歲董事長兼總經理被留置

      大跌19.36%!福石控股50歲董事長兼總經理被留置

      紅星資本局
      2026-02-03 09:29:04
      真瘋了:襄陽有二十多家精神病醫院,競爭堪比街頭牛肉面館拉生意

      真瘋了:襄陽有二十多家精神病醫院,競爭堪比街頭牛肉面館拉生意

      李萬卿
      2026-02-03 14:39:22
      特斯拉4680電池起死回生!攻克瓶頸打臉寧德時代,已上車Model Y

      特斯拉4680電池起死回生!攻克瓶頸打臉寧德時代,已上車Model Y

      智能車參考
      2026-02-03 17:31:36
      薩摩耶被燒死后續:男孩家庭被扒,父母身份不一般,狗主人遭網暴

      薩摩耶被燒死后續:男孩家庭被扒,父母身份不一般,狗主人遭網暴

      古希臘掌管松餅的神
      2026-02-03 16:59:50
      零跑汽車員工吐槽“年會拉胯”,董事長朱江明回應,年會獎品和晚餐菜單曝光

      零跑汽車員工吐槽“年會拉胯”,董事長朱江明回應,年會獎品和晚餐菜單曝光

      紅星新聞
      2026-02-03 17:19:16
      吃他汀不能碰雞肉?醫生提醒:不只是雞肉,這7物也要忌嘴

      吃他汀不能碰雞肉?醫生提醒:不只是雞肉,這7物也要忌嘴

      蜉蝣說
      2026-02-01 20:30:25
      8.7萬億!史上最貴獨角獸誕生

      8.7萬億!史上最貴獨角獸誕生

      智東西
      2026-02-03 08:50:21
      小網紅稱給嫣然捐了5000W,被網友嘲諷是吹牛,李亞鵬卻出面證實

      小網紅稱給嫣然捐了5000W,被網友嘲諷是吹牛,李亞鵬卻出面證實

      新游戲大妹子
      2026-02-03 13:42:47
      日經225指數漲幅擴大至3%,最新報54233.93點

      日經225指數漲幅擴大至3%,最新報54233.93點

      每日經濟新聞
      2026-02-03 09:29:09
      2026-02-03 20:56:49
      GEEK極客 incentive-icons
      GEEK極客
      中國最具影響力的創意生活雜志
      1263文章數 2646關注度
      往期回顧 全部

      科技要聞

      1.25萬億美元!xAI員工贏麻了

      頭條要聞

      零跑年會被員工吐槽沒空調、自備干糧 董事長回應

      頭條要聞

      零跑年會被員工吐槽沒空調、自備干糧 董事長回應

      體育要聞

      “也許我的一小步,會成為中國足球的一大步”

      娛樂要聞

      小S致詞:感謝具俊曄陪伴大S的最后3年

      財經要聞

      中央一號文件:扎實推進鄉村全面振興

      汽車要聞

      上汽決定不再等那個“正確答案”了

      態度原創

      教育
      數碼
      親子
      旅游
      房產

      教育要聞

      保護孩子寶媽必學,你可以無知但不能愚蠢!

      數碼要聞

      1月全國家電以舊換新、數碼和智能產品購新補貼超1500萬臺

      親子要聞

      萌娃一本正經的教導老爸,媽媽生氣的時候要這樣做

      旅游要聞

      “馬上入川?蜀你好玩”亮相北京

      房產要聞

      大盤最低殺到8000+/㎡!???9盤,最新房價曝光!

      無障礙瀏覽 進入關懷版