![]()
新智元報(bào)道
編輯:好困 Aeneas
【新智元導(dǎo)讀】大瓜驚爆AI圈:昨天Cursor新模型剛剛封神,24小時(shí)內(nèi)卻被扒是套殼Kimi?全網(wǎng)秒變吃瓜現(xiàn)場(chǎng),馬斯克、龍蝦之父都來(lái)圍觀了。這一次,中國(guó)開源模型,真的上大分了!
今天,整個(gè)AI圈都被這個(gè)大瓜震驚了。
3月19日凌晨,估值即將沖擊500億美元的AI編程獨(dú)角獸Cursor,高調(diào)發(fā)布了自家最新編程模型Composer 2。
這個(gè)模型一發(fā)布,立刻在整個(gè)開發(fā)者社區(qū)引發(fā)了轟動(dòng)!
據(jù)說(shuō),它不僅超越了Claude Opus 4.6,價(jià)格還直接腰斬,對(duì)于動(dòng)輒被Claude天價(jià)模型燒穿錢包的開發(fā)者,這簡(jiǎn)直是重大利好啊。
![]()
最令業(yè)內(nèi)側(cè)目的,就是這張「性能/價(jià)格比」坐標(biāo)軸了:Composer 2直接橫掃了Opus 4.6和GPT-5.4
超越Opus 4.6,這個(gè)令人吃驚的成績(jī)是怎么得到的?
根據(jù)Cursor官方博客的說(shuō)法,他們采用了不少關(guān)鍵技術(shù),比如繼續(xù)預(yù)訓(xùn)練、大規(guī)模強(qiáng)化學(xué)習(xí)、自主研發(fā)的自我摘要技術(shù)。
總之,靠自主研發(fā)造出最前沿模型的Cursor,這波是上大分了!
![]()
結(jié)果,不到24小時(shí),Cursor竟然就被啪啪打臉了??
一行模型ID
撕開500億美元估值的遮羞布
一位名叫Fynn的開發(fā)者在調(diào)試Cursor的API時(shí),截獲了一段不該出現(xiàn)的模型ID:
accounts/anysphere/models/kimi-k2p5-rl-0317-s515-fast
![]()
注意看這段——「kimi-k2p5-rl」。
翻譯過(guò)來(lái)就是,這個(gè)光環(huán)滿滿的Composer 2,底下跑的其實(shí)是Kimi K2.5的強(qiáng)化學(xué)習(xí)版本!
![]()
瞬間,這條推文迅速就引爆開發(fā)者社區(qū),瀏覽量直接飆過(guò)22萬(wàn)。
看熱鬧不嫌事大的馬斯克立馬下場(chǎng),在評(píng)論區(qū)留了一句話:「Yeah, it's Kimi 2.5」。
![]()
![]()
預(yù)訓(xùn)練負(fù)責(zé)人,在線打假
隨后,Kimi的預(yù)訓(xùn)練負(fù)責(zé)人立即發(fā)推表示,我們測(cè)試了Composer 2的分詞器,發(fā)現(xiàn)它跟Kimi的完全一致!
幾乎可以確認(rèn),這就是我們的模型被進(jìn)一步后訓(xùn)練的結(jié)果!
他直接@了Cursor的聯(lián)創(chuàng)Michael Truell,詢問(wèn)對(duì)方為何沒有遵守他們的MIT License許可條款,也沒有支付任何費(fèi)用?
![]()
后續(xù)已經(jīng)刪帖
要知道,這件事情的核心焦點(diǎn)就在于,根據(jù)Kimi K2.5的許可證要求,當(dāng)衍生產(chǎn)品月收入超過(guò)2000萬(wàn)美元時(shí),需在界面顯著展示「Kimi K2.5」字樣。
而Cursor的年收入超過(guò)20億美元,月收入約1.66億,是觸發(fā)署名義務(wù)門檻(2000萬(wàn)美元)的8倍以上。
這一波,Cursor算是丟臉丟大發(fā)了。社區(qū)的各個(gè)大V,都下場(chǎng)圍觀、轉(zhuǎn)發(fā)、熱議起來(lái)。
![]()
連龍蝦之父,都開始下場(chǎng)吃瓜了。
![]()
全網(wǎng)都在瘋狂刷起梗圖。
![]()
![]()
![]()
![]()
Cursor緊急回應(yīng)
承認(rèn)了,但只承認(rèn)一半
面對(duì)鋪天蓋地的質(zhì)疑,Cursor聯(lián)合創(chuàng)始人Aman Sanger不得不下場(chǎng)發(fā)聲。
他的回應(yīng)分三層。
第一,承認(rèn)基座:我們?cè)u(píng)估了大量基座模型的困惑度,Kimi K2.5表現(xiàn)最強(qiáng)。
第二,強(qiáng)調(diào)自研成分:在K2.5基礎(chǔ)上做了繼續(xù)預(yù)訓(xùn)練和4倍算力規(guī)模的高強(qiáng)度RL訓(xùn)練。
第三,道歉:沒在博客里提到Kimi基座,確實(shí)是疏忽,下一個(gè)模型會(huì)改。
![]()
Cursor的另一位核心成員Lee Robinson則在幾個(gè)小時(shí)內(nèi)連發(fā)四條推文,姿態(tài)一條比一條低。
最初,他只承認(rèn)是基于開源項(xiàng)目,并且甩出一組數(shù)據(jù)稱,最終模型的算力消耗中,只有約1/4來(lái)自基座模型,剩下3/4全是Cursor自己的訓(xùn)練。
所以跑分結(jié)果和原版差異很大。
言下之意:我們不是簡(jiǎn)單套殼,開源模型只是基礎(chǔ)。
![]()
然后架不住社區(qū)追問(wèn),直接攤牌:「既然大家非要我說(shuō)出這個(gè)名字——KIMI K2.5!!沒錯(cuò),就是我們的起點(diǎn)。」
![]()
最終,在兩個(gè)小時(shí)之后,和另一位聯(lián)創(chuàng)Aman Sanger在同一時(shí)間發(fā)了道歉。
他表示,開始沒在博客中提到Kimi基座模型,的確是犯錯(cuò)了,以后一定改正。
態(tài)度還算誠(chéng)懇,但問(wèn)題在于——發(fā)布時(shí)為什么不說(shuō)?
![]()
最終,Kimi也非常大度地下場(chǎng)和解,表示非常自豪看到K2.5為Composer 2提供基座。
![]()
至此,事情徹底圓滿了。
此前已有前科
2025年10月,Composer 1 發(fā)布時(shí),全球多地用戶就曾反饋:這個(gè)宣稱自研的編程助手,竟然在思考過(guò)程中偶爾蹦出地道的中文。
即便經(jīng)幾家媒體證實(shí),Cursor及其競(jìng)爭(zhēng)對(duì)手Windsurf確實(shí)都在底層套用了經(jīng)過(guò)微調(diào)的中國(guó)開源大模型,但Cursor選擇了冷處理——不解釋、不回訪,然后,在今年2月迅速迭代到1.5版本。
但這一次,Composer 2的翻車更加徹底,可以說(shuō)分明是利用別人研發(fā)投入進(jìn)行的「利潤(rùn)套利」。
目前,Cursor的估值是293億美元,正尋求500億美元融資;而提供底層能力的Kimi,上輪估值為43億美元。
以此在二級(jí)市場(chǎng)上換取12倍估值的操作,就更是令人嘆為觀止了。
Cursor為什么偏偏選了Kimi K2.5?
話說(shuō)回來(lái),開源模型那么多,Cursor為什么選Kimi K2.5當(dāng)基座?
答案可能沒那么復(fù)雜。
在Artificial Analysis的綜合排行榜上,K2.5就是當(dāng)前最強(qiáng)的開源模型之一。
從官方公布的跑分來(lái)看,K2.5在Agent能力上也是壓過(guò)了一眾閉源巨頭。
Humanity's Last Exam得分50.2,GPT-5.2只有45.5,Claude Opus 4.5是43.2;BrowseComp拿到74.9,把GPT-5.2的65.8甩開了近10個(gè)點(diǎn)。
在圖像和視頻理解上同樣全面領(lǐng)先,MathVision 84.2分排名第一,VideoMMMU和LongVideoBench也都拿到了最高分。
![]()
論文地址:https://github.com/MoonshotAI/Attention-Residuals/blob/master/Attention_Residuals.pdf
架構(gòu)上,K2.5是一個(gè)萬(wàn)億參數(shù)的MoE模型,但每次推理只激活320億參數(shù),用不到總量3.2%的算力撐起前沿級(jí)的能力。256K上下文窗口,原生支持文本、圖像、視頻三模態(tài)輸入。
編碼能力是K2.5最突出的長(zhǎng)板,尤其是前端開發(fā)場(chǎng)景。比如,給它一張UI設(shè)計(jì)稿,K2.5能直接輸出帶交互動(dòng)效和滾動(dòng)觸發(fā)效果的完整前端代碼。
同時(shí),K2.5還引入了Agent Swarm機(jī)制,最多可以同時(shí)調(diào)度100個(gè)子Agent并行執(zhí)行任務(wù),完成多達(dá)1500次工具調(diào)用,任務(wù)執(zhí)行速度提升4.5倍。
對(duì)于Cursor這種需要處理大型代碼庫(kù)、長(zhǎng)鏈任務(wù)的產(chǎn)品來(lái)說(shuō),K2.5幾乎是量身定做的底座。
![]()
數(shù)據(jù)和實(shí)力之外,這場(chǎng)Cursor風(fēng)波還意外地給K2.5送上了一波全球級(jí)的信用背書。
事實(shí)上,除了這次的抓包外,馬斯克一周內(nèi)已經(jīng)兩次點(diǎn)名Kimi。
3月16日,Kimi團(tuán)隊(duì)在arXiv發(fā)布了一篇名為「Attention Residuals」的架構(gòu)論文,馬斯克轉(zhuǎn)發(fā)并評(píng)價(jià)「Impressive work」。
![]()
Andrej Karpathy跟帖感慨,就連OpenAI前聯(lián)合創(chuàng)始人Jerry Tworek都直呼「deep learning 2.0」。
![]()
![]()
與此同時(shí),全球最大的CDN服務(wù)商Cloudflare也在同一周宣布,將Kimi K2.5作為Workers AI平臺(tái)上線的首個(gè)開源模型。
![]()
![]()
在官博中,Cloudflare透露了一個(gè)驚人的數(shù)字:他們內(nèi)部有一個(gè)基于K2.5的安全審計(jì)Agent,每天處理超過(guò)70億智元(token)。
如果是用中等水平的閉源模型,僅這一個(gè)場(chǎng)景、一個(gè)代碼庫(kù),年成本就要240萬(wàn)美元。切換到K2.5之后,成本直降77%。
![]()
一個(gè)中國(guó)開源模型,同時(shí)被估值500億美元的硅谷編程工具選為基座、被全球CDN巨頭用于生產(chǎn)環(huán)境。
這種認(rèn)可的含金量,不是隨便一次基準(zhǔn)跑分能替代的。
有一說(shuō)一
Composer 2確實(shí)能打
拋開基座爭(zhēng)議,Composer 2的性能本身還是值得一看得。
首先,它在跑分上實(shí)現(xiàn)了Cursor有史以來(lái)最大的單代際跳躍。
CursorBench上,Composer 2得分61.3,對(duì)比上一代Composer 1.5的44.2,提升近40%!
![]()
在測(cè)試AI在命令行環(huán)境中定位bug、編寫修復(fù)、驗(yàn)證結(jié)果等全鏈路能力的Terminal-Bench 2.0上,Composer 2同樣拿到了61.7的高分,一舉超過(guò)Claude Opus 4.6的58.0和Opus 4.5的52.1。
![]()
雖然能力不是最強(qiáng)的,但成本確實(shí)是Composer 2最鋒利的武器。
標(biāo)準(zhǔn)版定價(jià)每百萬(wàn)輸入智元(token)僅0.5美元,輸出2.5美元,比上一代Composer 1.5的3.5/17.5美元便宜了86%。
Composer 2 Fast不僅速度堪稱地表最快,而且定價(jià)也只提到了1.5/7.5美元,同樣比1.5版便宜57%。
相比之下,一個(gè)Claude Code訂閱月費(fèi)200美元,背后的計(jì)算成本約為5000美元。
![]()
![]()
這個(gè)定價(jià)策略的底氣,來(lái)自Cursor在訓(xùn)練層面做的真正有技術(shù)含量的事——compaction-in-the-loop強(qiáng)化學(xué)習(xí)。
Cursor的做法是把摘要過(guò)程直接嵌入RL訓(xùn)練循環(huán):當(dāng)生成過(guò)程觸發(fā)智元(token)長(zhǎng)度閾值時(shí),模型自行暫停并壓縮上下文,從5000+智元(token)濃縮到約1000 智元(token)。
由于強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)函數(shù)覆蓋了整個(gè)鏈條(包括摘要步驟),模型學(xué)會(huì)了哪些細(xì)節(jié)必須保留、哪些可以丟棄。
結(jié)果顯示,上下文遺忘率比前代方法降低50%,模型可以處理需要數(shù)百步連續(xù)操作的項(xiàng)目級(jí)重構(gòu)任務(wù)。也就是,智元(token)效率提升了5倍。
此外,Composer 2還深度集成了Cursor的Agent工具鏈。包括語(yǔ)義代碼搜索、文件和文件夾檢索、文件讀寫、shell命令執(zhí)行、瀏覽器控制和網(wǎng)頁(yè)訪問(wèn)。
這套工具棧意味著Composer 2不只是一個(gè)回答問(wèn)題的模型,而是一個(gè)可以在IDE里「動(dòng)手干活」的Agent。
一句話總結(jié):基座是別人的,但上層訓(xùn)練確實(shí)下了功夫。
打開引擎蓋,里面全是中國(guó)造
Composer 2的技術(shù)含量不假。但這件事真正的看點(diǎn),不在Cursor做了多少RL,而在于——當(dāng)它需要一個(gè)最強(qiáng)底座的時(shí)候,選了誰(shuí)。
而且Cursor不是個(gè)案,問(wèn)題也不止出現(xiàn)在硅谷。
有研究顯示,日本十大主流AI模型中,六個(gè)的基座來(lái)自DeepSeek或Qwen系列,多數(shù)公司在宣傳中淡化甚至隱去了與底層模型的關(guān)聯(lián)。
換句話說(shuō),全球AI應(yīng)用層的「地基」,正在被中國(guó)開源模型悄悄鋪滿。
從東京到舊金山,從獨(dú)立開發(fā)者到500億美元估值的公司,大家打開引擎蓋一看——里面跑的越來(lái)越多是中國(guó)造的發(fā)動(dòng)機(jī)。
而網(wǎng)友Yuchen Jin的預(yù)測(cè),則看得更遠(yuǎn):「開源模型實(shí)驗(yàn)室未來(lái)會(huì)靠授權(quán)分成賺錢——這才是真正的飛輪。」
如果這個(gè)邏輯成立,Kimi免費(fèi)放出K2.5,Cursor拿去做出20億美元年收入的產(chǎn)品,最終Kimi通過(guò)許可條款和品牌曝光把價(jià)值收回來(lái)。
開源不再是慈善,而是一種更高維度的商業(yè)策略。
![]()
這次事件最有趣的是,只需要一個(gè)開發(fā)者、一次API調(diào)試、一串沒改掉的模型ID,就把一家AI編程巨頭精心構(gòu)建的「自研」敘事拆穿了。
不得不說(shuō),技術(shù)世界里最難隱藏的東西,永遠(yuǎn)是代碼本身。
參考資料:
https://x.com/fynnso/status/2034706304875602030
https://x.com/aakashgupta/status/2035003184192630985
https://x.com/leerob/status/2035035355364081694
https://x.com/MillionInt/status/2033393130201059515
https://x.com/karpathy/status/2033400893346107835
https://x.com/elonmusk/status/2034941631871455262
https://x.com/Yuchenj_UW/status/2035012260008272007
https://blog.cloudflare.com/workers-ai-large-models/
https://cursor.com/cn/blog/composer-2
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.