<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      大模型本地部署,小號的vLLM來了

      0
      分享至

      大家好,我是 Ai 學習的老章

      一文中提到 2025 年最熱門的項目分布在 AI 基礎設施(vllm、ollama、huggingface/transformers)和持久的生態系統(vscode、godot、home-assistant)之間。

      • 一方面,像vllmollamaragflowllama.cpphuggingface/transformers這樣的項目占據主導地位,這表明貢獻者正在投資 AI 的基礎層——模型運行時、推理引擎和編排框架。

      • 另一方面,像vscodegodotexpohome-assistant這樣的主要生態系統繼續吸引穩定的貢獻者基礎,表明開源的勢頭遠遠超出了 AI 領域。



      vLLM——2025 年增長最快的開源 AI 項目之一。

      按貢獻者數量排名的頂級開源項目 按貢獻者數量增長最快的項目 吸引最多首次貢獻者的項目

      這個推理引擎也是我最喜愛的,本號測試部署的 N 多大模型都是用它來部署的

      唯一讓我不滿的是我在內網用 docker 起 vLLM,它太大了,足足 22 個 GB

      周末剛看到一個新項目:輕量級 vLLM 實現——Nano-vLLM

      項目地址:https://github.com/GeeeekExplorer/nano-vllm

      關鍵功能快速離線推理 - 推理速度與 vLLM 相當 易讀的代碼庫 - 約 1,200 行 Python 代碼的簡潔實現 ? 優化套件 - 前綴緩存、張量并行、Torch 編譯、CUDA 圖等

      一行命令安裝pip install git+https://github.com/GeeeekExplorer/nano-vllm.git

      手動下載模型權重,使用以下命令:

      huggingface-cli download --resume-download Qwen/Qwen3-0.6B \
      --local-dir ~/huggingface/Qwen3-0.6B/ \
      --local-dir-use-symlinks False

      網不通的話,可以使用我多次推薦的modelscope

      pip install modelscope 之后,即可使用 modelscope download 下載模型

      下載完整模型庫

      `modelscope download --model Qwen/Qwen3-0.6B

      下載單個文件到指定本地文件夾(以下載 README.md 到當前路徑下“dir”目錄為例)

      modelscope download --model Qwen/Qwen3-0.6B README.md --local_dir ./dir

      API 與 vLLM 的接口類似,LLM.generate方法有一些細微差別:

      from nanovllm import LLM, SamplingParams
      llm = LLM("/YOUR/MODEL/PATH", enforce_eager=True, tensor_parallel_size=1)
      sampling_params = SamplingParams(temperature=0.6, max_tokens=256)
      prompts = ["Hello, Nano-vLLM."]
      outputs = llm.generate(prompts, sampling_params)
      outputs[0]["text"]

      看官方測試配置:**

      • 硬件:RTX 4070 筆記本電腦(8GB)

      • 模型: Qwen3-0.6B

      • 總請求量: 256個序列

      • 輸入長度: 隨機采樣在100到1024個標記之間

      • 輸出長度: 隨機采樣在100到1024個標記之間

      性能結果:

      推理引擎

      輸出標記

      時間(秒)

      吞吐量(令牌/秒)

      vLLM

      133,966

      Nano-vLLM

      133,966

      這種小模型,時延更小,吞吐量更大,看起來是很不錯的樣子

      時間關系,我還沒有本地跑大參數模型,后續肯定要試一試的。

      文末薦書

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中國批準稀土出口,日媒歡呼:對華反制措施見效,下一秒遭打臉

      中國批準稀土出口,日媒歡呼:對華反制措施見效,下一秒遭打臉

      書紀文譚
      2026-02-10 18:32:15
      上海洗浴中心成新頂流,俄羅斯美女博主被圈粉,還有海外游客專門飛來打卡

      上海洗浴中心成新頂流,俄羅斯美女博主被圈粉,還有海外游客專門飛來打卡

      界面新聞
      2026-02-11 18:31:08
      四川成都一佳人好漂亮, 身高169cm,體重48kg 美的讓人移不開眼

      四川成都一佳人好漂亮, 身高169cm,體重48kg 美的讓人移不開眼

      喜歡歷史的阿繁
      2026-02-07 14:21:17
      退伍回村救了個落水女人,2天后縣長突然來電:明天來我辦公室

      退伍回村救了個落水女人,2天后縣長突然來電:明天來我辦公室

      秋風專欄
      2025-08-13 15:54:55
      頭部朝下落地!中國33歲冬奧老將出意外:被抬出雪場 目前意識清醒

      頭部朝下落地!中國33歲冬奧老將出意外:被抬出雪場 目前意識清醒

      風過鄉
      2026-02-11 20:52:27
      女子8年拒絕8次男友求婚,男友無奈另娶她人,女友:憑什么?

      女子8年拒絕8次男友求婚,男友無奈另娶她人,女友:憑什么?

      小蔣愛嘮嗑
      2026-02-11 05:33:41
      特朗普下達最后通牒,要求臺當局立即付款,否則將取消對臺軍售

      特朗普下達最后通牒,要求臺當局立即付款,否則將取消對臺軍售

      東極妙嚴
      2026-02-11 12:54:31
      亞馬爾連續5場破門+西甲24球,打破梅西和姆巴佩兩項紀錄

      亞馬爾連續5場破門+西甲24球,打破梅西和姆巴佩兩項紀錄

      晚霧空青
      2026-02-11 08:41:59
      從一晚三千到無人接盤,五星級酒店集體被甩賣,這場泡沫該誰買單

      從一晚三千到無人接盤,五星級酒店集體被甩賣,這場泡沫該誰買單

      青眼財經
      2026-01-19 23:37:28
      萬斯:伊朗人民想推翻政權,那得靠他們自己

      萬斯:伊朗人民想推翻政權,那得靠他們自己

      桂系007
      2026-02-11 23:38:09
      笑麻了!以為兩人相伴了一輩子,其實厭煩了幾十年!

      笑麻了!以為兩人相伴了一輩子,其實厭煩了幾十年!

      墻頭草
      2026-02-09 16:37:03
      生圖能打!孟子義青島逛街被偶遇,路人驚呼:白到發光比精修還美

      生圖能打!孟子義青島逛街被偶遇,路人驚呼:白到發光比精修還美

      心靈得以滋養
      2026-02-11 21:50:42
      女演員千萬別整容!看《夜色正濃》里40歲江疏影和36歲藍盈瑩

      女演員千萬別整容!看《夜色正濃》里40歲江疏影和36歲藍盈瑩

      章眽八卦
      2026-02-11 12:40:57
      回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

      回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

      就一點
      2025-11-22 10:36:39
      我去!塔圖姆被下放了!!

      我去!塔圖姆被下放了!!

      柚子說球
      2026-02-11 17:20:08
      利物浦遭重創!后場萬金油被擔架抬下 面臨長期傷停

      利物浦遭重創!后場萬金油被擔架抬下 面臨長期傷停

      球事百科吖
      2026-02-12 07:23:26
      3人共禁賽13場!這大概是年度最兇沖突了!

      3人共禁賽13場!這大概是年度最兇沖突了!

      柚子說球
      2026-02-12 07:52:13
      這跟不穿有什么區別?王楚然裙子太短露膚度極高,胡意旋身材曼妙

      這跟不穿有什么區別?王楚然裙子太短露膚度極高,胡意旋身材曼妙

      樂悠悠娛樂
      2026-02-10 12:44:32
      比賭博還狠的“隱形毒藥”,正慢慢掏空中國家庭,無數人被它拖垮

      比賭博還狠的“隱形毒藥”,正慢慢掏空中國家庭,無數人被它拖垮

      千秋文化
      2026-02-10 20:55:47
      梁朝偉過安檢可憐眼神向劉嘉玲求救前所未見 老婆搞笑反應曝光

      梁朝偉過安檢可憐眼神向劉嘉玲求救前所未見 老婆搞笑反應曝光

      達達哥
      2026-02-10 21:52:25
      2026-02-12 08:35:00
      機器學習與Python社區 incentive-icons
      機器學習與Python社區
      機器學習算法與Python
      3247文章數 11085關注度
      往期回顧 全部

      科技要聞

      Meta將斥資超100億美元建設數據中心

      頭條要聞

      環球:高市"豪賭"大勝 軍工業恐成日本經濟"搖錢樹"

      頭條要聞

      環球:高市"豪賭"大勝 軍工業恐成日本經濟"搖錢樹"

      體育要聞

      搞垮一個冬奧選手,只需要一首歌?

      娛樂要聞

      大孤山風波愈演愈烈 超50位明星扎堆

      財經要聞

      廣州前首富被判無期 200億集資窟窿何償

      汽車要聞

      比亞迪最美B級SUV? 宋Ultra這腰線美翻了

      態度原創

      教育
      房產
      本地
      親子
      游戲

      教育要聞

      高考地理中的木本植物擴張

      房產要聞

      999元開線上免稅店?海南爆出免稅大騙局,多人已被抓!

      本地新聞

      下一站是嘉禾望崗,請各位乘客做好哭泣準備

      親子要聞

      寒假在家卷運動,手眼協調練一練

      《英雄無敵5:重生》開發者將推出新地圖生成器

      無障礙瀏覽 進入關懷版