AI編程工具Cursor高調發布自研模型Composer 2,宣稱性能超越Claude Opus 4.6且價格大幅壓低,卻在不到3小時內遭開發者揭穿——其底層基座正是中國月之暗面的開源模型Kimi K2.5。
這場"自研"風波迅速席卷AI社區,馬斯克親自下場認證,最終以Cursor聯合創始人公開致歉、Kimi官方發文祝賀收場。
3月21日,據硬AI消息,Cursor聯合創始人Aman Sanger在事件發酵后發文承認,"沒有在博客中從一開始就提及Kimi基礎模型是我們的疏漏,會在下一個模型中修正這一點。"
月之暗面官方賬號隨即回應:"恭喜Cursor推出Composer 2,很驕傲看到Kimi K2.5成為基礎模型,這就是我們喜歡的開源生態。"月之暗面同時澄清,Cursor系通過Fireworks AI托管的強化學習與推理平臺訪問Kimi K2.5,屬于授權商業合作
性能超越Opus 4.6,價格"腳踝斬"
Cursor本周五正式上線Composer 2,并在發布博客中宣稱,該模型在其衡量的所有基準測試上均取得大幅提升,包括Terminal-Bench 2.0和SWE-bench Multilingual。
![]()
在衡量智能體終端操作能力的Terminal-Bench 2.0上,Composer 2的表現位于GPT-5.4和Claude Opus 4.6之間,在CursorBench基準上的性價比表現則明顯超過上述兩款模型。
定價是Cursor此次發布的核心賣點。標準版Composer 2的輸入價格為0.5美元/百萬tokens、輸出價格為2.5美元/百萬tokens,與Claude Opus 4.6相比幾乎是"腳踝斬"級別的降幅。
Cursor同步推出速度更快的變體Composer 2 Fast,定價為每百萬輸入tokens 1.5美元、每百萬輸出tokens 7.5美元,在延續價格優勢的同時主打響應速度。
Cursor將這一性價比突破歸因于一種新的強化學習方法,并強調這是"實實在在訓練出來的能力,而非推理技巧"。
發布不到3小時,底層基座遭曝光
然而,Composer 2的高光時刻極為短暫。發布后不到3小時,X平臺用戶@fynnso發現該模型的模型ID顯示為kimi-k2p5-rl-0317-s515-fast,隨即得出結論:"Composer 2其實就是經過強化學習的Kimi K2.5。"
![]()
這一發現迅速在X和Hacker News等技術社區擴散,梗圖與討論齊飛。馬斯克亦在@fynnso的帖子下直接回復"Yeah, it's Kimi 2.5",進一步放大了話題熱度。
![]()
Reddit社區r/singularity的討論同樣熱烈。有用戶評論稱:
"最搞笑的是,大家還在夸Composer 2是巨大飛躍,結果全程用的是別人的模型。這讓人不禁想,有多少所謂'專有模型'其實只是套了個logo的開源微調版。"
也有觀點認為,Cursor的真正護城河在于其從大量開發者使用中積累的任務解決數據,而非預訓練本身,"每個投資人都知道他們沒有在做自己的基礎模型,他們本應從一開始就坦誠說明。"
Cursor致歉,Kimi確認授權合作
面對輿論壓力,Cursor團隊做出正面回應。
Aman Sanger公開確認,團隊對多個基座模型進行了困惑度評測,Kimi K2.5"證明是最強的",隨后在此基礎上疊加了持續預訓練和4倍規模的高算力強化學習,并通過Fireworks AI的推理與RL采樣器進行部署。
![]()
Cursor開發者教育副總裁Lee Robinson補充披露了更多技術細節:最終模型中來自基座的算力約占1/4,其余3/4來自Cursor自身訓練。
Robinson同時表示,雖然Composer 2基于開源模型開發,但未來團隊也會進行完整的預訓練。
![]()
月之暗面官方隨后明確表態,強調此次合作符合許可證要求,屬于授權商業合作,并對Cursor發布Composer 2表示祝賀。
![]()
至此,這場爭議的法律與授權層面基本厘清,但Cursor在發布時刻意回避底座信息的做法,在開發者社區仍留有余波。
"做筆記"強化學習:Cursor的技術自述
盡管底座來源引發爭議,Cursor在技術層面的工作仍有其獨立價值。
Cursor在博客中詳細介紹了其核心方法——一種名為"自我總結(self-summary)"的強化學習機制,旨在解決AI編程助手在處理超長復雜任務時因上下文窗口有限而"跑偏"的痛點。
![]()
具體而言,模型在執行任務過程中,會在達到固定token長度觸發點時主動暫停,生成一段"階段總結",隨后基于壓縮后的上下文繼續推進任務。這種總結能力被納入強化學習的獎勵機制:總結質量越高、后續任務成功率越高,模型獲得的獎勵越大,反之則受到懲罰。
Cursor披露的內部測試數據顯示,與傳統摘要方法相比,該方法的token用量僅為傳統方法的1/5,而壓縮帶來的錯誤減少約50%
Cursor以"將Doom游戲跑在MIPS架構上"這一高難度任務為例,Composer在經過170輪交互后找到精確解法,并將10萬余tokens的上下文壓縮至約1000個。
![]()
開源生態與透明度之爭
此次事件的更深層討論,指向AI應用層與開源生態之間的互信問題。
Hugging Face聯合創始人兼CEO Clement Delangue從中看到了開源的價值,表示中國的開源模型如今已成為塑造全球AI技術棧的最大力量。
競爭對手Windsurf則迅速抓住時機,宣布未來一周將對用戶免費開放Kimi K2.5,借勢吸引Cursor用戶。
分析指出,對于Cursor而言,這場風波在融資關鍵節點上帶來了額外的輿論壓力。據報道,Cursor目前正以500億美元估值進行新一輪融資。
Cursor CEO Aman Sanger此前表示,Cursor是"既不是純粹的應用程序開發商,也不是模型提供商"的新型公司。
這次事件表明,當開源底座性能逐漸逼近頂尖閉源模型,下游應用廠商如何在商業包裝與技術透明度之間取得平衡,將成為行業無法回避的議題。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.