<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek-V3.2 量化版來了

      0
      分享至

      大家好,我是 Ai 學習的老章

      DeepSeek-V3.2 雖好,無奈太龐大了,完整模型文件 690 GB


      https://huggingface.co/unsloth/DeepSeek-V3.2

      DeepSeek-V3.2 原版 國內鏡像: https://modelscope.cn/models/unsloth/DeepSeek-V3.2
      https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Speciale

      時隔多天,各種量化版本的 DeepSeek-V3.2 陸續來了

      有點奇怪,這次 [[2025-04-01-大模型量化界翹楚:unsloth]] 有點遲到

      unsloth 出手,我估計 1bit 版模型能干到 100GB,

      先推薦幾個靠譜的 DeepSeek-V3.2 吧

      1, DeepSeek-V3.2-AWQ

      優點是 Safetensors 格式,vLLM 可以直接啟動模型

      AWQ 4bit 量化,模型文件 362GB


      https://huggingface.co/QuantTrio/DeepSeek-V3.2-AWQ

      國內鏡像:https://modelscope.cn/models/QuantTrio/DeepSeek-V3.2-AWQ/files 當然也有 Speciale 的鏡像:https://modelscope.cn/models/QuantTrio/DeepSeek-V3.2-Speciale-AWQ

      安裝及啟動腳本


      export VLLM_USE_DEEP_GEMM=0 # ATM, this line is a "must" for Hopper devices
      export TORCH_ALLOW_TF32_CUBLAS_OVERRIDE=1
      export VLLM_USE_FLASHINFER_MOE_FP16=1
      export VLLM_USE_FLASHINFER_SAMPLER=0
      export OMP_NUM_THREADS=4


      llm serve \
      __YOUR_PATH__/QuantTrio/DeepSeek-V3.2-Speciale-AWQ \
      --served-model-name MY_MODEL_NAME \
      --enable-auto-tool-choice \
      --tool-call-parser deepseek_v31 \
      --reasoning-parser deepseek_v3 \
      --swap-space 16 \
      --max-num-seqs 32 \
      --max-model-len $CONTEXT_LENGTH \
      --gpu-memory-utilization 0.9 \
      --tensor-parallel-size 8 \
      --enable-expert-parallel \ # optional
      --speculative-config '{"model": "__YOUR_PATH__/QuantTrio/DeepSeek-V3.2-Speciale-AWQ", "num_speculative_tokens": 1}' \ # optional, 50%+- throughput increase is observed
      --trust-remote-code \
      --host 0.0.0.0 \
      --port 8000
      2, Qwen3-8B-DeepSeek-v3.2-Speciale-Distill

      這是一個奇妙的組合,用 Qwen3-8B 蒸餾的 DeepSeek-v3.2-Speciale

      看到這組合,讓我想起之前非常喜愛,,與它大小差不多,都是 16GB 左右,默認參數 2 張 4090 極其順暢,如果這個可以正常關閉思考,那就太好了。


      https://huggingface.co/TeichAI/Qwen3-8B-DeepSeek-v3.2-Speciale-Distill/tree/main 3, mlx-community/DeepSeek-V3.2-4bit

      土豪專享

      蘋果 M 系列用戶可以試試,4bit 量化,模型文件 378GB,非土豪直接繞行


      https://huggingface.co/mlx-community/DeepSeek-V3.2-4bit/tree/main

      國內鏡像:https://modelscope.cn/models/mlx-community/DeepSeek-V3.2-Speciale-4bit/

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中國批準稀土出口,日媒歡呼:對華反制措施見效,下一秒遭打臉

      中國批準稀土出口,日媒歡呼:對華反制措施見效,下一秒遭打臉

      書紀文譚
      2026-02-10 18:32:15
      上海洗浴中心成新頂流,俄羅斯美女博主被圈粉,還有海外游客專門飛來打卡

      上海洗浴中心成新頂流,俄羅斯美女博主被圈粉,還有海外游客專門飛來打卡

      界面新聞
      2026-02-11 18:31:08
      四川成都一佳人好漂亮, 身高169cm,體重48kg 美的讓人移不開眼

      四川成都一佳人好漂亮, 身高169cm,體重48kg 美的讓人移不開眼

      喜歡歷史的阿繁
      2026-02-07 14:21:17
      退伍回村救了個落水女人,2天后縣長突然來電:明天來我辦公室

      退伍回村救了個落水女人,2天后縣長突然來電:明天來我辦公室

      秋風專欄
      2025-08-13 15:54:55
      頭部朝下落地!中國33歲冬奧老將出意外:被抬出雪場 目前意識清醒

      頭部朝下落地!中國33歲冬奧老將出意外:被抬出雪場 目前意識清醒

      風過鄉
      2026-02-11 20:52:27
      女子8年拒絕8次男友求婚,男友無奈另娶她人,女友:憑什么?

      女子8年拒絕8次男友求婚,男友無奈另娶她人,女友:憑什么?

      小蔣愛嘮嗑
      2026-02-11 05:33:41
      特朗普下達最后通牒,要求臺當局立即付款,否則將取消對臺軍售

      特朗普下達最后通牒,要求臺當局立即付款,否則將取消對臺軍售

      東極妙嚴
      2026-02-11 12:54:31
      亞馬爾連續5場破門+西甲24球,打破梅西和姆巴佩兩項紀錄

      亞馬爾連續5場破門+西甲24球,打破梅西和姆巴佩兩項紀錄

      晚霧空青
      2026-02-11 08:41:59
      從一晚三千到無人接盤,五星級酒店集體被甩賣,這場泡沫該誰買單

      從一晚三千到無人接盤,五星級酒店集體被甩賣,這場泡沫該誰買單

      青眼財經
      2026-01-19 23:37:28
      萬斯:伊朗人民想推翻政權,那得靠他們自己

      萬斯:伊朗人民想推翻政權,那得靠他們自己

      桂系007
      2026-02-11 23:38:09
      笑麻了!以為兩人相伴了一輩子,其實厭煩了幾十年!

      笑麻了!以為兩人相伴了一輩子,其實厭煩了幾十年!

      墻頭草
      2026-02-09 16:37:03
      生圖能打!孟子義青島逛街被偶遇,路人驚呼:白到發光比精修還美

      生圖能打!孟子義青島逛街被偶遇,路人驚呼:白到發光比精修還美

      心靈得以滋養
      2026-02-11 21:50:42
      女演員千萬別整容!看《夜色正濃》里40歲江疏影和36歲藍盈瑩

      女演員千萬別整容!看《夜色正濃》里40歲江疏影和36歲藍盈瑩

      章眽八卦
      2026-02-11 12:40:57
      回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

      回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

      就一點
      2025-11-22 10:36:39
      我去!塔圖姆被下放了!!

      我去!塔圖姆被下放了!!

      柚子說球
      2026-02-11 17:20:08
      利物浦遭重創!后場萬金油被擔架抬下 面臨長期傷停

      利物浦遭重創!后場萬金油被擔架抬下 面臨長期傷停

      球事百科吖
      2026-02-12 07:23:26
      3人共禁賽13場!這大概是年度最兇沖突了!

      3人共禁賽13場!這大概是年度最兇沖突了!

      柚子說球
      2026-02-12 07:52:13
      這跟不穿有什么區別?王楚然裙子太短露膚度極高,胡意旋身材曼妙

      這跟不穿有什么區別?王楚然裙子太短露膚度極高,胡意旋身材曼妙

      樂悠悠娛樂
      2026-02-10 12:44:32
      比賭博還狠的“隱形毒藥”,正慢慢掏空中國家庭,無數人被它拖垮

      比賭博還狠的“隱形毒藥”,正慢慢掏空中國家庭,無數人被它拖垮

      千秋文化
      2026-02-10 20:55:47
      梁朝偉過安檢可憐眼神向劉嘉玲求救前所未見 老婆搞笑反應曝光

      梁朝偉過安檢可憐眼神向劉嘉玲求救前所未見 老婆搞笑反應曝光

      達達哥
      2026-02-10 21:52:25
      2026-02-12 08:35:00
      機器學習與Python社區 incentive-icons
      機器學習與Python社區
      機器學習算法與Python
      3247文章數 11085關注度
      往期回顧 全部

      科技要聞

      Meta將斥資超100億美元建設數據中心

      頭條要聞

      環球:高市"豪賭"大勝 軍工業恐成日本經濟"搖錢樹"

      頭條要聞

      環球:高市"豪賭"大勝 軍工業恐成日本經濟"搖錢樹"

      體育要聞

      搞垮一個冬奧選手,只需要一首歌?

      娛樂要聞

      大孤山風波愈演愈烈 超50位明星扎堆

      財經要聞

      廣州前首富被判無期 200億集資窟窿何償

      汽車要聞

      比亞迪最美B級SUV? 宋Ultra這腰線美翻了

      態度原創

      手機
      教育
      本地
      公開課
      軍事航空

      手機要聞

      消息稱蘋果新版Siri開發遇阻,新功能可能跳票至iOS 26.5和iOS 27

      教育要聞

      高考地理中的木本植物擴張

      本地新聞

      下一站是嘉禾望崗,請各位乘客做好哭泣準備

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普:若美伊談判失敗 或再派一支航母打擊群

      無障礙瀏覽 進入關懷版