<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      迄今為止最強大的開源模型:Kimi K2 Thinking ,比肩閉源模型

      0
      分享至

      大家好,我是 Ai 學習的老章

      Kimi 也算我們的常客,尤其是 K2 模型,十分亮眼,目前也是我 Agent 常配模型之一

      昨晚 ,剛剛模型文件開源,技術博客也發布了,本文做個梳理。
      K2 Thinking 實測

      先看幾個網友實測:

      啟用 Kimi 工具調用,直接生成數學和物理解釋動畫

      將公式渲染進行量子場論的動畫推理

      太空侵略者游戲

      K2 Thinking 簡介

      kimi-k2-thinking模型是具有通用 Agentic 能力和推理能力的思考模型,它擅長深度推理,并可通過多步工具調用,幫助解決各類難題。

      什么讓它與眾不同:
      ? 原生 INT4 量化 → 2 倍快速推理
      占用內存減半,無精度損失
      256K 上下文,支持 200-300 次工具調用


      Kimi K2 Thinking 上下文長度為 256k。(從常規的 Kimi K2 的 128k 提升而來),總參數 1T,激活參數 32B

      官方釋放的基準測試結果:

      在 HLE (44.9%) 和 BrowseComp (60.2%) 上達到 SOTA
      最多可以執行 200 – 300 個連續的工具調用 無需人工干預
      在推理、自主搜索和編程方面表現出色


      需要指出的是,Kimi 非常自信的與最強的閉源模型進行對比,在多個基準中結果反超閉源模型。

      下面是更全面的對比結果,確實不需要與其他開源模型比參數了:


      artificialanalysis.ai 也對 Kimi K2 Thinking 做了基準測試,結果也十分優秀

      ? Kimi K2 Thinking 在 2-Bench Telecom 代理工具使用基準測試中獲得了 93% 的成績,這是一個 agentic tool 基準測試,模型作為客戶服務代理進行操作。在長期代理上下文中的工具使用是 Kimi K2 Instruct 的強項,而新的 Thinking 變體在此方面取得了顯著進步。


      K2 Thinking 本地部署

      K2 Thinking 的模型文件只有 594GB


      https://huggingface.co/moonshotai/Kimi-K2-Thinking

      K2 Instruct 和 K2 Instruct 0905 的大小則超過 1TB,為何 Thinking 之后 594GB 呢?

      這是因為 K2 Thinking 使用 INT4 精度而非 FP8,Moonshot 在后訓練階段使用量化感知訓練來實現這一點,這意味著推理和訓練的效率提升。使用 INT4 的一個潛在原因是,Blackwell 的 NVIDIA GPU 不支持 FP4,因此 INT4 更適合在較陳舊的硬件上實現效率提升。

      vLLM Day 0 支持 K2 Thinking 的部署,命令如下

      # 安裝
      uv venv
      source .venv/bin/activate
      uv pip install -U vllm --pre --extra-index-url https://wheels.vllm.ai/nightly --extra-index-url https://download.pytorch.org/whl/cu129 --index-strategy unsafe-best-match # for xformers

      # 部署
      vllm serve moonshotai/Kimi-K2-Thinking \
      --trust-remote-code \
      --tensor-parallel-size 8 \
      --enable-auto-tool-choice \
      --tool-call-parser kimi_k2 \
      --reasoning-parser kimi_k2 \

      ## `--reasoning-parser` 標志指定用于從模型輸出中提取推理內容的推理解析器。

      要啟動 Kimi-K2-Thinking 需要 8 個 141GB 的 H200/H20,成本還是蠻高的,不過即便再量化,估計向下空間也不大了吧?已經 int4 了,還能怎樣。

      推薦使用 解碼上下文(DCP)并行部署,添加 --decode-context-parallel-size number 來啟用解碼上下文并行:

      vllm serve moonshotai/Kimi-K2-Thinking \
      --trust-remote-code \
      --tensor-parallel-size 8 \
      --decode-context-parallel-size 8 \
      --enable-auto-tool-choice \
      --tool-call-parser kimi_k2 \
      --reasoning-parser kimi_k2 \

      配合 DCP 后,優勢顯著(43% 更快的 Token 生成,26% 更高的吞吐量),同時幾乎沒有缺點(中位數延遲改善微乎其微)

      指標

      TP8

      TP8+DCP8

      變更

      改進 (%)

      請求吞吐量 (req/s)

      1.25

      1.57

      +25.6%

      輸出標記吞吐量 (tok/s)

      +43.1%

      平均 TTFT(秒)

      +16.0%

      中位數 TTFT(秒)

      后面我會拿之前的用例詳細測試一下,同時也把 Claude code 后臺模型改成 K2 Thinking 多用一用

      如有能再量化同時保障效果不打大折扣,把部署成本控制在 4 卡就好了,我也可以本地部署試試了。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      就讓高市如愿,中方要上大菜!

      就讓高市如愿,中方要上大菜!

      楊風
      2026-02-10 22:12:20
      農村到底蕭條到了啥程度?我在村里住了三個月,說幾句刺耳的話

      農村到底蕭條到了啥程度?我在村里住了三個月,說幾句刺耳的話

      復轉這些年
      2026-02-11 23:59:46
      知恥后勇,中國短道速滑隊捷報頻傳,范可新落淚,林孝俊被犯規

      知恥后勇,中國短道速滑隊捷報頻傳,范可新落淚,林孝俊被犯規

      林子說事
      2026-02-11 11:34:44
      CBA官方罰單:趙睿嚴重不當評論停賽3場罰款5萬 首鋼罰5萬

      CBA官方罰單:趙睿嚴重不當評論停賽3場罰款5萬 首鋼罰5萬

      醉臥浮生
      2026-02-11 20:42:55
      律師:中國最高法院推翻加拿大涉毒男子死刑判決

      律師:中國最高法院推翻加拿大涉毒男子死刑判決

      俄羅斯衛星通訊社
      2026-02-11 19:37:23
      王晶談萬梓良晚年凄涼!稱其不懂江湖規矩,演戲夸張對手很難接

      王晶談萬梓良晚年凄涼!稱其不懂江湖規矩,演戲夸張對手很難接

      小徐講八卦
      2026-02-11 11:40:12
      力壓范戴克,維爾茨當選與桑德蘭一役利物浦隊內最佳球員

      力壓范戴克,維爾茨當選與桑德蘭一役利物浦隊內最佳球員

      懂球帝
      2026-02-12 07:56:08
      Seedance2.0刷爆全網!知名財作家:女主播找工作時間不會很多了

      Seedance2.0刷爆全網!知名財作家:女主播找工作時間不會很多了

      火山詩話
      2026-02-11 06:17:37
      大爆冷!倒數第1擒東部第二送哈登神助攻 布倫森轟40+5+8成背景板

      大爆冷!倒數第1擒東部第二送哈登神助攻 布倫森轟40+5+8成背景板

      鍋子籃球
      2026-02-11 12:29:36
      網友吐槽:“吃相難看!漲價離譜!”

      網友吐槽:“吃相難看!漲價離譜!”

      王二哥老搞笑
      2026-02-12 00:52:08
      湖北女子吃飯閑聊,被母親指責啃老:最錯的事就是生你,網友炸鍋

      湖北女子吃飯閑聊,被母親指責啃老:最錯的事就是生你,網友炸鍋

      離離言幾許
      2026-02-11 22:39:53
      麻六記年會破防!小菲首度狂夸張蘭,三孫將至喜上加喜!

      麻六記年會破防!小菲首度狂夸張蘭,三孫將至喜上加喜!

      鄉野小珥
      2026-02-12 00:36:46
      比賭博還狠的“隱形毒藥”,正慢慢掏空中國家庭,無數人被它拖垮

      比賭博還狠的“隱形毒藥”,正慢慢掏空中國家庭,無數人被它拖垮

      千秋文化
      2026-02-10 20:55:47
      2012年希拉里助手曝出驚天猛料:為報復克林頓出軌,她的私生活竟也亂成一鍋粥,這哪是原諒,分明是頂級復仇

      2012年希拉里助手曝出驚天猛料:為報復克林頓出軌,她的私生活竟也亂成一鍋粥,這哪是原諒,分明是頂級復仇

      歷史回憶室
      2026-01-13 22:46:09
      廣東一高端酒樓,突然宣布結業!早前還在宣傳年夜飯

      廣東一高端酒樓,突然宣布結業!早前還在宣傳年夜飯

      今日搞笑分享
      2026-02-12 00:17:12
      斯瓦泰克披露堅持送蛋不讓球原因,誰是1000賽史上送蛋女王

      斯瓦泰克披露堅持送蛋不讓球原因,誰是1000賽史上送蛋女王

      網球之家
      2026-02-11 22:49:53
      內存現泡沫信號!DDR4價格閃崩近20%已走到盡頭

      內存現泡沫信號!DDR4價格閃崩近20%已走到盡頭

      3DM游戲
      2026-02-11 17:41:04
      夸美國空氣香甜的楊舒平,已被美驅逐出境,如今回國下場怎么樣了

      夸美國空氣香甜的楊舒平,已被美驅逐出境,如今回國下場怎么樣了

      談史論天地
      2026-02-07 13:20:03
      我去!塔圖姆被下放了!!

      我去!塔圖姆被下放了!!

      柚子說球
      2026-02-11 17:20:08
      大風新聞調查:在小紅書注冊未成年人賬號,被推送擦邊內容,改年齡就能打賞直播間

      大風新聞調查:在小紅書注冊未成年人賬號,被推送擦邊內容,改年齡就能打賞直播間

      大風新聞
      2026-02-11 18:53:18
      2026-02-12 08:32:49
      機器學習與Python社區 incentive-icons
      機器學習與Python社區
      機器學習算法與Python
      3247文章數 11085關注度
      往期回顧 全部

      科技要聞

      Meta將斥資超100億美元建設數據中心

      頭條要聞

      環球:高市"豪賭"大勝 軍工業恐成日本經濟"搖錢樹"

      頭條要聞

      環球:高市"豪賭"大勝 軍工業恐成日本經濟"搖錢樹"

      體育要聞

      搞垮一個冬奧選手,只需要一首歌?

      娛樂要聞

      大孤山風波愈演愈烈 超50位明星扎堆

      財經要聞

      廣州前首富被判無期 200億集資窟窿何償

      汽車要聞

      比亞迪最美B級SUV? 宋Ultra這腰線美翻了

      態度原創

      藝術
      教育
      手機
      健康
      游戲

      藝術要聞

      這13個狂草字,您認出幾個?楷書練習多久就可以練行書了?

      教育要聞

      高考地理中的木本植物擴張

      手機要聞

      消息稱蘋果新版Siri開發遇阻,新功能可能跳票至iOS 26.5和iOS 27

      轉頭就暈的耳石癥,能開車上班嗎?

      《英雄無敵5:重生》開發者將推出新地圖生成器

      無障礙瀏覽 進入關懷版