四個月前 Kimi 發(fā)布了 K2 模型,憑借優(yōu)秀的質(zhì)量以及先進(jìn)的架構(gòu)優(yōu)化,一舉打破了持續(xù)了幾個月關(guān)于月之暗面的質(zhì)疑。
我當(dāng)時也寫了兩篇測評《》。
而且他們是首個頭部模型廠商開始主動適配 Claude Code 的,后面其他家紛紛跟進(jìn),到現(xiàn)在短短幾個月,這已經(jīng)是大家非常普遍的用法了。
![]()
當(dāng)時我還說 K2 沒有推理能力已經(jīng)這么猛了,要是有推理能力還會猛到什么地步。現(xiàn)在他來了,Kimi-K2-Thinking 模型開源。
主要的升級內(nèi)容有:
- Agent化升級: 原生「邊思考、邊用工具」,可自主持續(xù)多輪推理與調(diào)用,最高約300輪。
- 推理SOTA: HLE(44.9)和 IMO(76.8)都做到了目前的最高分,復(fù)雜檢索與長程規(guī)劃顯著增強(qiáng)。
- 編程增強(qiáng): Agentic Coding更穩(wěn),前端(HTML/React/組件化)與多語言工程基準(zhǔn)表現(xiàn)提升。
- 通用基礎(chǔ)能力升級 :創(chuàng)意寫作更有韻律與深度;學(xué)術(shù)與研究場景下分析更嚴(yán)謹(jǐn)、結(jié)構(gòu)清晰;可長篇任務(wù)中保持邏輯與風(fēng)格穩(wěn)定。
- 效率提升: 原生 INT4(QAT+MoE weight?only),長解碼下性能保持,生成速度約提升2×。
而且這段時間 Kimi 在編程領(lǐng)域不止專注于模型,也在考慮周邊生態(tài),如何讓大家在更方便和實(shí)惠的使用 K2 編程。
他們推出了自己的 AI 編程 CLI 工具 Kimi CLI,安裝方式和使用基本拉齊的 Claude Code,我這次也會用 Kimi CLI 進(jìn)行 Kimi-K2-Thinking 的測試。
![]()
Kimi 的包月會員也加上了編碼的 API 套餐他們叫 KFC(Kimi For Coding),199 元的每周提供 7168 次調(diào)用,非常夠用了。
![]()
所以這篇文章我會先教一下大家如何順暢優(yōu)惠的使用 Kimi 全家桶進(jìn)行編程,然后再用這套全家桶進(jìn)行一波 Kimi-K2-Thinking 的編碼測試。
首先來看一下如何通過 Kimi 全家桶,方便快捷的用上升級后的 K2-Thinking 模型。
我們需要購買一個 Kimi 登月計(jì)劃的會員,直接去官網(wǎng)買就行。
而且如果你之前打賞過 Kimi 的話,你打賞的錢會在你首次開通之后幫你充值到賬戶里面,非常的良心。
這里有個設(shè)計(jì)問題,如果你想要獲取 Kimi For Coding 的 API Key 的話,需要點(diǎn)擊下面圖片里面框住的文字,然后復(fù)制就行,希望后面改改,比如放到設(shè)置里面。
![]()
然后我們就可以去安裝 Kimi CLI 了,這里如果你沒有安裝 UV 的話需要先在終端安裝 UV:
curl -LsSf https://astral.sh/uv/install.sh | sh然后再通過這段代碼安裝 Kimi CLI 就行
uv tool install --python 3.13 kimi-cli安裝后在終端打開你的項(xiàng)目目錄輸入 kimi 就可以啟動 Kimi CLI 了。
首次啟動后會讓你選登錄方式,選第一個然后輸入剛才從 KFC 獲取的 API Key 就行。
進(jìn)去之后按 Tab 鍵就可以啟用思考,這時候用的就是 K2-Thinking 模型了Claude Code 啟用思考也是一樣的操作。
![]()
當(dāng)然這個依舊可以在 Cluade Code 里面使用,如果嫌配置環(huán)境變量麻煩的話,用我的《》項(xiàng)目就行,創(chuàng)建的時候填寫下面內(nèi)容。
URL: https://api.kimi.com/coding
Model: kimi-k2-thinking
API Key: 你剛才在 Kimi For Coding 獲取的 API ![]()
好了接下來就是模型測試了。
我們這次的測試邏輯改一下,盡量少的測試模型單次生成的能力,多測試實(shí)際使用中,頻繁迭代修改以及發(fā)現(xiàn)問題的能力。
首先測試連續(xù)編輯和生成的能力,隨著要求越來越多越來越復(fù)雜 K2-Thinking 會不會出現(xiàn)崩潰和沖突修改的問題。
我會先提一個基礎(chǔ)的 Todo 網(wǎng)頁應(yīng)用的需求,然后不斷的增加修改和功能添加要求,看一下十輪修改之后的結(jié)果。
初始提示詞:
創(chuàng)建一個待辦事項(xiàng)(Todo List)應(yīng)用,要求:
基礎(chǔ)功能:
- 添加新任務(wù)(輸入框 + 添加按鈕)
- 顯示任務(wù)列表
- 標(biāo)記任務(wù)完成/未完成(checkbox)
- 刪除任務(wù)
技術(shù)要求:
- 使用 HTML + TailwindCSS + Vanilla JavaScript
- 數(shù)據(jù)存儲在 localStorage
- 簡潔現(xiàn)代的設(shè)計(jì)風(fēng)格
- 添加適當(dāng)?shù)膱D標(biāo)(使用 Heroicons CDN)
請生成完整的單文件 HTML,可以直接在瀏覽器中運(yùn)行。
中間多輪修改的提示詞:
- 1.現(xiàn)在添加分類功能;
- 2.添加優(yōu)先級功能;
- 3.添加截止日期;
- 4.添加搜索和篩選;
- 5.添加數(shù)據(jù)導(dǎo)出功能;
- 6.改為看板視圖;
- 7.添加拖拽功能;
- 8.添加深色模式;
- 9.完成移動端和桌面端的自適應(yīng)適配;
可以看到這就是從第一步的簡陋 Todo 應(yīng)用不斷添加躬耕到最后幾乎已經(jīng)是一個完整產(chǎn)品的過程了。
約到后面需求是越來越難的,比如拖拽功能以及最后的移動端適配大改版,中間還伴隨著增加功能導(dǎo)致的 UI 變化,但是 K2-Thinking 全部都是一次搞定。
第三次的時候由于增加功能導(dǎo)致的 UI 問題,也在第四次修復(fù)了,有點(diǎn)頂。
![]()
我也用其他模型試了一下這個測試。Claude 4.5 可以搞定,但是 Codex 就不行了。
下面是 Codex CLI 第七輪修改的樣子,非常的凄涼,這產(chǎn)品幾乎不可用,讓他整廢了。
![]()
然后是考驗(yàn) Kimi CLI 搜索能力的一個測試,讓他搜索 Linear 這個產(chǎn)品的首頁設(shè)計(jì)風(fēng)格然后寫一個網(wǎng)頁復(fù)刻這個產(chǎn)品網(wǎng)頁的設(shè)計(jì)風(fēng)格看一下有多像。
重點(diǎn)是要他輸出他的思考和決策過程,看一下思考帶來的優(yōu)勢。
模仿 Linear 的動效設(shè)計(jì)風(fēng)格制作英文網(wǎng)頁
要求:
- 1.先搜索了解 Linear (linear.app) 的設(shè)計(jì)特點(diǎn):
- 深色主題為主
- 流暢的過渡動畫
- 磨砂玻璃效果(glassmorphism)
- 微妙的漸變和光效
- 簡潔的排版
- 調(diào)研 Linear 使用的前端和動效庫方案,并且參考
- 2.創(chuàng)建一個產(chǎn)品功能展示頁面,包含:
- Hero 區(qū)域:大標(biāo)題 + 副標(biāo)題 + CTA 按鈕
- 功能卡片(3-4個),鼠標(biāo)懸停有光效跟隨
- 實(shí)現(xiàn)滾動視差
- 背景網(wǎng)格動畫
- 3.技術(shù)要求:
- TailwindCSS
- 顏色方案參考 Linear
- 動畫要流暢(60fps)
- 4.核心特效:
- 鼠標(biāo)移動時背景有微妙的漸變跟隨
- 卡片懸停時有發(fā)光邊框
- 滾動時元素漸顯和位移
- 按鈕懸停有磁吸效果
請先簡單描述你搜索到的 Linear 設(shè)計(jì)特點(diǎn),然后實(shí)現(xiàn),我要看到你的完整思考和決策過程。
來看一下過程,他真的在調(diào)用搜索工具搜索一些 Linear 風(fēng)格的設(shè)計(jì)文章,然后總結(jié)了 Linear 的設(shè)計(jì)特點(diǎn)拓展了原來的提示詞和要求。
![]()
這里面最難的是那個磁吸按鈕以及卡片上鼠標(biāo) Hover 的光效,也是之前 Linear 的設(shè)計(jì)核心,他都搞定了。
我也用這個提示詞在 Claude Code 里面讓 Claude 4.5 嘗試了,磁吸按鈕動效以及鼠標(biāo) Hover 的漸變效果 Claude 4.5 都沒有搞定。
接下來是一個考驗(yàn)復(fù)雜業(yè)務(wù)邏輯的測試,讓他做一個流程圖工具,這里面隱藏著非常多的交互邏輯沖突陷阱,比如拖動和點(diǎn)擊的沖突、連線是跟組件的綁定等。
創(chuàng)建一個簡易流程圖編輯器(類似 draw.io,調(diào)研他的功能和實(shí)現(xiàn)方式),功能需求:
- 1.節(jié)點(diǎn)類型:
- 開始/結(jié)束(圓角矩形,綠色/紅色)
- 處理步驟(矩形,藍(lán)色)
- 判斷條件(菱形,橙色)
- 注釋(圓形,灰色)
- 2.核心功能:
- 左側(cè)工具欄:拖拽節(jié)點(diǎn)類型到畫布
- 畫布:可以自由放置節(jié)點(diǎn)
- 連線:點(diǎn)擊節(jié)點(diǎn)A再點(diǎn)擊節(jié)點(diǎn)B,自動連線
- 編輯:雙擊節(jié)點(diǎn)可以編輯內(nèi)文字
- 刪除:選中節(jié)點(diǎn)按 Delete 鍵刪除(連線自動斷開)
- 移動:拖拽節(jié)點(diǎn)重新定位,連線自動跟隨
- 3.連線規(guī)則:
- 自動選擇路徑,避免穿過其他節(jié)點(diǎn)(簡單的直線或折線)
- 箭頭指向終點(diǎn)
- 判斷節(jié)點(diǎn)可以連出多條線(標(biāo)注"是"/"否")
- 4.數(shù)據(jù)功能:
- 導(dǎo)出為 JSON(節(jié)點(diǎn)位置、類型、文字、連線關(guān)系)
- 清空畫布(需要確認(rèn))
- 5.技術(shù)要求:
- 使用 HTML Canvas 或 SVG
- TailwindCSS 做界面
- 平滑的拖拽體驗(yàn)
- 響應(yīng)式設(shè)計(jì)
- CDN 引用圖標(biāo)庫
關(guān)于拖動和連線容易造成的沖突問題這個機(jī)靈鬼直接整了個模式切換按鈕,不過倒是也解決問題了。
連線的時候功能正常而且路徑合理,不會瞎繞,同時邏輯判斷節(jié)點(diǎn)也會自動添加是和否的標(biāo)注,看起來帶了思考能力以后對于這種有陷阱的復(fù)雜邏輯處理的不錯。
在之后是 API 處理、數(shù)據(jù)調(diào)用以及可視化的能力測試,讓他整一個對于可視化要求比較高的區(qū)塊鏈看板。
創(chuàng)建一個加密貨幣行情實(shí)時看板,詳細(xì)規(guī)劃和分析需求后在執(zhí)行。
功能需求:
- 1.顯示 Top 20 加密貨幣的實(shí)時行情(使用 CoinGecko API)
- 2.展示內(nèi)容:
- 貨幣圖標(biāo) + 名稱 + 代碼(如 BTC)
- 當(dāng)前價格(USD)
- 24小時漲跌幅(綠漲紅跌)
- 24小時最高/最低價
- 市值
- 24小時交易量
- 3.功能:
- 可以按漲跌幅、市值、交易量排序
- 點(diǎn)擊幣種,展開查看簡易 K 線圖(最近 7 天)
- 搜索功能:輸入幣種名稱或代碼快速定位
- 價格刷新按鈕(手動刷新)
- 4.可視化:
- 使用 Chart.js 繪制 K 線圖或折線圖
- 漲跌用顏色區(qū)分
- 大漲/大跌(>10%)用特殊標(biāo)記
- 5.技術(shù)要求:
- CoinGecko API (免費(fèi),無需 key)
- Chart.js CDN
- TailwindCSS
- anime.js CDN
- 圖標(biāo)庫 CDN
- 數(shù)字格式化(價格、百分比)
- 響應(yīng)式設(shè)計(jì),移動端友好
- 6.交互細(xì)節(jié):
- 價格數(shù)字跳動動畫(數(shù)字滾動效果)
- 刷新時有加載提示
- 圖表展開/收起有過渡動畫
看一下結(jié)果執(zhí)行的相當(dāng)不錯,調(diào)用了正確的 API 獲取到了數(shù)據(jù),同時該有的可視化標(biāo)注和排序都實(shí)現(xiàn)了。
點(diǎn)擊詳細(xì)的數(shù)據(jù)之后展示詳細(xì)的折線圖也做了,增加了展開收起動畫以及詳細(xì)的 Hover 數(shù)據(jù)。
最后是一段寫好的代碼里面有些問題,看一下能不能識別并且解決。
我讓其他 AI 寫了一段有五個問題的列表網(wǎng)頁,一次性渲染一個超大列表,讓他修復(fù)卡頓問題和提高查詢速度。
上面這個商品列表頁面有嚴(yán)重的性能問題,在我的電腦上卡頓明顯,滾動和搜索都很慢。請你:
- 1.分析性能瓶頸:
- 找出代碼中所有的性能問題
- 解釋每個問題為什么會導(dǎo)致卡頓
- 用注釋標(biāo)注問題所在
- 2.提出優(yōu)化方案:
- 針對每個問題提出具體的優(yōu)化方案
- 說明優(yōu)化的原理
- 評估預(yù)期的性能提升
- 3.實(shí)現(xiàn)優(yōu)化:
- 重寫代碼,實(shí)現(xiàn)你提出的優(yōu)化方案
- 保持功能完整
請先分析問題,再實(shí)現(xiàn)優(yōu)化后的完整代碼。
雖然都是常見問題,但是可以找全并且提出合理的修復(fù)方案也挺麻煩的。
![]()
搞笑的是他不止修復(fù)了問題,而且還增加了一個性能監(jiān)控的組件,讓你在運(yùn)行和測試網(wǎng)頁的時候可以實(shí)時看到修復(fù)后的數(shù)據(jù)細(xì)節(jié),從數(shù)據(jù)而不是從感知上讓你看到效果。
![]()
最后來試一下這次更新以后 Kimi 的文案水平,直接讓他幫我寫一段文章結(jié)尾吧。
當(dāng)OpenAI卷通用能力、DeepSeek卷開源生態(tài)、Cursor卷工具體驗(yàn)時,月之暗面冷靜地看到:在AI編程領(lǐng)域,模型、工具、商業(yè)三者缺一不可。單個環(huán)節(jié)再強(qiáng),也無法提供完整的開發(fā)者體驗(yàn)。
Kimi全家桶的聰明之處在于:它不是在"補(bǔ)短板",而是在"建長板"。
月之暗面的核心優(yōu)勢是什么?是模型能力(K2-Thinking的300輪工具調(diào)用、搜索增強(qiáng)推理),是工程執(zhí)行力(快
速迭代全家桶),是對開發(fā)者需求的理解(從Claude Code適配到KFC套餐設(shè)計(jì))。全家桶不是防御,是把核心優(yōu)勢產(chǎn)品化、商業(yè)化的最優(yōu)解。
從戰(zhàn)略層面看,Kimi全家桶解決了三個行業(yè)級痛點(diǎn):
![]()
![]()
第一,API經(jīng)濟(jì)的"最后一公里"問題。OpenAI的API很強(qiáng),但開發(fā)者需要寫膠水代碼、做錯誤處理、算Token成本。Kimi CLI把這些封裝了,讓模型能力直接轉(zhuǎn)化為生產(chǎn)力。這不是鎖定,是價值封裝。
第二,開源模型的"集成負(fù)擔(dān)"問題。DeepSeek開源很香,但你需要自己部署、優(yōu)化、監(jiān)控、計(jì)費(fèi)。Kimi全家桶提供的是"拎包入住"的生產(chǎn)環(huán)境。這不是封閉,是工程完備性。
第三,純工具產(chǎn)品的"模型依賴"問題。Cursor依賴Claude/GPT,模型升級、價格調(diào)整、政策變化都會影響用戶體驗(yàn)。Kimi全家桶的"模型+工具"一體,保證了體驗(yàn)一致性和長期可用性。
這背后有個關(guān)鍵認(rèn)知:在AI時代,開發(fā)者的核心訴求不是"選擇自由",而是"交付確定性"。
選擇自由意味著你要做技術(shù)選型、性能調(diào)優(yōu)、成本控制。交付確定性意味著你有一個可靠的、端到端的、開箱即
用的解決方案,能幫你快速把想法變成產(chǎn)品。
Kimi全家桶的價值在于:它把"AI編程"從一個需要大量試錯的技術(shù)探索,變成了可依賴的生產(chǎn)工具。
最后,對月之暗面的戰(zhàn)略選擇,我的評價是:清醒、務(wù)實(shí)、有遠(yuǎn)見。
![]()
清醒在于,它沒有盲目追逐AGI理想,而是找到了可商業(yè)化的場景。
務(wù)實(shí)在于,它沒有執(zhí)著于技術(shù)領(lǐng)先,而是把模型能力轉(zhuǎn)化為產(chǎn)品價值。
有遠(yuǎn)見于,它看到了AI編程的終局不是"更好的模型",而是"更完整的工作流"。
K2-thinking的發(fā)布真的讓我很感慨,月之暗面雖然在國內(nèi)是六小龍之一,但是在全球范圍內(nèi),只有 Open AI 估值的 0.5%,Anthropic 的 2%。
就是以這樣的一個小體量的國產(chǎn)公司,竟然拿出了兩個高難度測試集里的 SOTA 成績,而且不是國內(nèi)SOTA,不是開源SOTA,是全球SOTA!
發(fā)布前在他們推特下面看到一個評論,這也是現(xiàn)在很多海外用戶的想法,最近類似的內(nèi)容我刷到很多次。
![]()
如果覺得內(nèi)容對你有幫助可以幫我點(diǎn)個贊或者喜歡,或者轉(zhuǎn)發(fā)給你有需要的朋友,期待在評論區(qū)看到你嘗試后的評價。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.