![]()
去年1月,DeepSeek 讓整個(gè)硅谷陷入了恐慌。它不僅讓英偉達(dá)的股價(jià)單日暴跌 6000 億美元,還逼得 Sam Altman 不得不重寫(xiě)他的整個(gè)商業(yè)計(jì)劃。那次事件的沖擊波至今還在硅谷回蕩,投資人開(kāi)始質(zhì)疑那些動(dòng)輒要求百億美元融資的 AI 公司到底是不是在講故事。
現(xiàn)在,第二個(gè)挑戰(zhàn)者出現(xiàn)了。
最近的Kimi,迎來(lái)了一波令人眼花繚亂的高光時(shí)刻。估值飆升至 180 億美元(約合人民幣 1200 億),成為中國(guó)最快的十角獸公司。17 歲的天才高中生加入團(tuán)隊(duì),以一作身份發(fā)表論文撬了硅谷的地基。黃仁勛邀請(qǐng)創(chuàng)始人楊植麟在 GTC 2026 發(fā)表演講,這是唯一獲此殊榮的獨(dú)立大模型公司 CEO。Cursor新模型被曝“套殼”K2.5,馬斯克親自下場(chǎng)撐腰,一周內(nèi)兩次給予Kimi團(tuán)隊(duì)非常正面的評(píng)價(jià)。
一連串的好消息匯聚在一起,傳遞出一個(gè)清晰無(wú)比的信號(hào):Kimi 不僅是中國(guó)大模型領(lǐng)域當(dāng)之無(wú)愧的頭部玩家,更是全球 AI 競(jìng)賽中不容忽視的重要力量。而這一切都在傳遞一個(gè)更深層的信息:AI 競(jìng)賽的規(guī)則正在被改寫(xiě),中國(guó)團(tuán)隊(duì)不再是追趕者,而是開(kāi)始引領(lǐng)新的方向。
當(dāng) Cursor 成了 Kimi 的最佳廣告
這件事的戲劇性程度超出了我的想象。Cursor,這個(gè)估值 500 億美元、被硅谷奉為 AI 代碼編輯器標(biāo)桿的產(chǎn)品,最近推出了新模型。開(kāi)發(fā)者社區(qū)很快發(fā)現(xiàn),這個(gè)新模型的表現(xiàn)異常出色,甚至在某些方面超越了之前使用的 Claude 和 GPT-4。但當(dāng)技術(shù)人員深入研究后,發(fā)現(xiàn)了一個(gè)令人震驚的事實(shí):Cursor 的新模型是基于 Kimi K2.5 微調(diào)的。這個(gè)發(fā)現(xiàn)迅速在技術(shù)社區(qū)傳播開(kāi)來(lái),而 Kimi 官方的回應(yīng)更是耐人尋味:"聽(tīng)說(shuō)我,謝謝你。"這種淡定從容的態(tài)度,反而讓整個(gè)事件的影響力進(jìn)一步擴(kuò)大。
![]()
我仔細(xì)想了想這件事的深層含義。Cursor 選擇基于 Kimi K2.5 微調(diào),本質(zhì)上是對(duì) Kimi 技術(shù)能力的最強(qiáng)背書(shū)。要知道,Cursor 并不缺資金,也不缺技術(shù)資源,他們完全可以選擇任何一個(gè)模型作為基礎(chǔ)。但他們選擇了 Kimi,這說(shuō)明在他們的技術(shù)評(píng)估中,Kimi K2.5 在性價(jià)比、性能表現(xiàn)和實(shí)際應(yīng)用效果上,超越了市面上所有其他選擇。這不是一個(gè)簡(jiǎn)單的技術(shù)決策,而是一次公開(kāi)的技術(shù)投票。更重要的是,這件事讓全球的開(kāi)發(fā)者意識(shí)到:原來(lái)不需要花費(fèi)數(shù)百美元訂閱 OpenAI 的 API,也不需要等待 Claude 的配額限制,Kimi 的開(kāi)源模型就能提供同等甚至更好的效果。
這對(duì)硅谷的商業(yè)模式構(gòu)成了直接挑戰(zhàn)。OpenAI 目前對(duì)開(kāi)發(fā)者收取每月 200 美元的費(fèi)用來(lái)使用他們的模型,而這個(gè)模型在很多開(kāi)發(fā)者看來(lái)已經(jīng)"落后于曲線"。與此同時(shí),Kimi 不僅把模型開(kāi)源了,還免費(fèi)提供給所有人使用。這種對(duì)比太過(guò)鮮明,以至于讓人不得不重新思考:那些動(dòng)輒要求數(shù)十億美元融資的公司,他們的錢到底花在了哪里?是真的需要那么多資源來(lái)訓(xùn)練模型,還是說(shuō)有很大一部分被用于維持高昂的估值和商業(yè)包裝?
馬斯克的兩次點(diǎn)名背后的深意
馬斯克在一周內(nèi)兩次公開(kāi)提到 Kimi,這在他的社交媒體習(xí)慣中非常罕見(jiàn)。第一次是在 3 月 16 日,他轉(zhuǎn)發(fā)了關(guān)于 Kimi 注意力殘差新技術(shù)的文章。第二次是在 3 月 20 日,他直接評(píng)論了 Cursor 新模型基于 Kimi K2.5 微調(diào)的消息。我認(rèn)為馬斯克的關(guān)注不是偶然的,而是基于他對(duì) AI 行業(yè)發(fā)展趨勢(shì)的深刻理解。
![]()
馬斯克一直是開(kāi)源 AI 的支持者,他創(chuàng)立 xAI 的一個(gè)重要原因就是對(duì) OpenAI 轉(zhuǎn)向閉源的不滿。他多次公開(kāi)批評(píng) Sam Altman 背離了 OpenAI 最初的開(kāi)源使命,把公司變成了一個(gè)追求利潤(rùn)最大化的封閉組織。在這個(gè)背景下,Kimi 的開(kāi)源策略自然會(huì)引起他的共鳴。但我覺(jué)得更深層的原因在于,馬斯克看到了 Kimi 代表的技術(shù)路線對(duì)整個(gè) AI 行業(yè)的顛覆性影響。
美國(guó)的 AI 公司,無(wú)論是 OpenAI、Anthropic 還是 Google,都在走一條類似的路:堆疊海量的算力和數(shù)據(jù),通過(guò)暴力計(jì)算來(lái)提升模型能力。這條路需要天文數(shù)字般的資金投入,需要數(shù)百億美元的融資,需要數(shù)萬(wàn)塊 GPU 的集群。而 Kimi 代表的是另一條路:在有限的資源條件下,通過(guò)改進(jìn)底層架構(gòu)、優(yōu)化算法效率、創(chuàng)新技術(shù)方案來(lái)達(dá)到同等甚至更好的效果。這兩條路徑的差異不僅僅是技術(shù)層面的,更是哲學(xué)層面的。前者是資本密集型的路線,后者是技術(shù)密集型的路線。
馬斯克作為工程師出身的企業(yè)家,自然更欣賞后者。他在 SpaceX 和 Tesla 的成功,很大程度上也是依靠技術(shù)創(chuàng)新而非資本堆砌。當(dāng)他看到 Kimi 用更少的資源做出更好的模型時(shí),這種工程師式的欣賞是發(fā)自內(nèi)心的。而他的公開(kāi)點(diǎn)名,實(shí)際上是在向整個(gè)硅谷傳遞一個(gè)信號(hào):AI 的未來(lái)不在于誰(shuí)融資更多,而在于誰(shuí)的技術(shù)更扎實(shí)、更高效、更可持續(xù)。
黃仁勛的邀請(qǐng)說(shuō)明了什么
GTC(GPU Technology Conference)是英偉達(dá)每年最重要的技術(shù)大會(huì),被看作AI界的春晚,黃仁勛在這個(gè)舞臺(tái)上的每一個(gè)選擇都有深刻的戰(zhàn)略考量。而在 GTC 2026 上,黃仁勛邀請(qǐng)楊植麟作為唯一的獨(dú)立大模型公司 CEO 發(fā)表演講。這個(gè)決定的分量有多重,只有了解 GTC 歷史的人才能真正理解。
![]()
英偉達(dá)作為 AI 基礎(chǔ)設(shè)施的提供者,他們的利益在于推動(dòng)整個(gè) AI 行業(yè)的發(fā)展,而不是綁定某一個(gè)特定的公司或者技術(shù)路線。從這個(gè)角度看,Kimi 的開(kāi)源策略和技術(shù)創(chuàng)新正是英偉達(dá)希望看到的。開(kāi)源意味著更多的開(kāi)發(fā)者可以參與進(jìn)來(lái),更多的應(yīng)用場(chǎng)景可以被探索,整個(gè)生態(tài)系統(tǒng)會(huì)更加繁榮。而 Kimi 在算法優(yōu)化上的創(chuàng)新,也意味著同樣的硬件資源可以產(chǎn)生更大的價(jià)值,這對(duì)英偉達(dá)來(lái)說(shuō)同樣是好消息。
Kimi K2.5 的技術(shù)突破到底有多重要
讓我們回到技術(shù)本身。Kimi K2.5 到底做對(duì)了什么,讓它能夠在性能和成本之間找到如此完美的平衡點(diǎn)?我研究了他們最近公布的注意力殘差技術(shù),發(fā)現(xiàn)這是一個(gè)非常巧妙的創(chuàng)新。
傳統(tǒng)的 Transformer 架構(gòu)在處理長(zhǎng)文本時(shí)會(huì)遇到計(jì)算復(fù)雜度呈平方增長(zhǎng)的問(wèn)題。簡(jiǎn)單來(lái)說(shuō),文本越長(zhǎng),計(jì)算量增長(zhǎng)得越快,這就是為什么很多模型在處理長(zhǎng)上下文時(shí)會(huì)變得非常慢或者非常貴。Kimi 的注意力殘差技術(shù)通過(guò)改進(jìn)注意力機(jī)制的計(jì)算方式,在保持模型性能的同時(shí)大幅降低了計(jì)算復(fù)雜度。這不是簡(jiǎn)單的工程優(yōu)化,而是從算法層面的創(chuàng)新。
更重要的是,這種創(chuàng)新的成果是可以被驗(yàn)證的。Cloudflare 最近推出的 Workers AI 新服務(wù)就是基于 Kimi K2.5 打造的,他們?cè)诠俜讲┛椭袑iT有一段講"The price-performance sweet spot"(性價(jià)比最優(yōu)點(diǎn))。Cloudflare 作為全球最大的 CDN 服務(wù)商之一,他們選擇技術(shù)方案時(shí)會(huì)進(jìn)行嚴(yán)格的性能測(cè)試和成本分析。他們最終選擇了 Kimi K2.5,說(shuō)明這個(gè)模型在實(shí)際應(yīng)用中確實(shí)達(dá)到了性價(jià)比的最優(yōu)平衡。
![]()
我特別注意到,Kimi K2.5 不僅在模型能力上得到認(rèn)可,在實(shí)際調(diào)用使用上也獲得了廣泛好評(píng)。這兩個(gè)維度的認(rèn)可非常重要。很多模型在實(shí)驗(yàn)室測(cè)試中表現(xiàn)出色,但在真實(shí)應(yīng)用場(chǎng)景中卻會(huì)遇到各種問(wèn)題,比如響應(yīng)速度慢、穩(wěn)定性差、成本過(guò)高等。Kimi K2.5 能夠同時(shí)在這兩個(gè)維度上獲得認(rèn)可,說(shuō)明它是一個(gè)真正經(jīng)過(guò)實(shí)戰(zhàn)檢驗(yàn)的產(chǎn)品,而不只是一個(gè)實(shí)驗(yàn)室里的 demo。
兩條路徑:算力堆疊 vs 架構(gòu)創(chuàng)新
美國(guó)和中國(guó)在 AI 發(fā)展上走的是兩條完全不同的路徑,這種差異不僅反映在技術(shù)選擇上,更深層次地反映了資源稟賦和創(chuàng)新文化的差異。
美國(guó)的路徑是算力堆疊。OpenAI 的 GPT-4 訓(xùn)練使用了超過(guò) 25000 塊 GPU,耗時(shí)數(shù)月,成本據(jù)估算超過(guò) 1 億美元。Google 的 Gemini 項(xiàng)目投入更是天文數(shù)字。這種路徑的背后是美國(guó)在半導(dǎo)體制造、數(shù)據(jù)中心建設(shè)和資本市場(chǎng)融資方面的優(yōu)勢(shì)。他們可以動(dòng)員巨額資金,可以獲得最先進(jìn)的硬件,可以建設(shè)世界上最大的 GPU 集群。這是一種資本密集型的路線,依賴于持續(xù)的大規(guī)模投資。
中國(guó)的路徑則是架構(gòu)創(chuàng)新。受限于算力資源的獲取,中國(guó)的 AI 實(shí)驗(yàn)室不得不在算法和架構(gòu)層面尋找突破。DeepSeek 通過(guò)創(chuàng)新的訓(xùn)練方法,用遠(yuǎn)少于預(yù)期的算力訓(xùn)練出了性能卓越的模型。Kimi 通過(guò)注意力殘差等技術(shù)創(chuàng)新,在推理效率上實(shí)現(xiàn)了重大突破。這種路徑的背后是中國(guó)工程師文化中的"在約束條件下優(yōu)化"的思維方式。當(dāng)資源有限時(shí),就必須更聰明地使用資源,這反而激發(fā)了更多的技術(shù)創(chuàng)新。
我認(rèn)為這兩條路徑在長(zhǎng)期競(jìng)爭(zhēng)中,后者會(huì)顯示出更強(qiáng)的生命力。算力堆疊是一種線性增長(zhǎng)的策略,你投入的資源越多,模型能力提升越大,但邊際效益會(huì)遞減。而架構(gòu)創(chuàng)新是一種非線性增長(zhǎng)的策略,一個(gè)好的算法創(chuàng)新可能帶來(lái)數(shù)量級(jí)的性能提升,而且這種提升是可持續(xù)的,可以在不同規(guī)模的模型上復(fù)制。更重要的是,架構(gòu)創(chuàng)新是知識(shí)的積累,一旦掌握了這些技術(shù),就可以在未來(lái)的競(jìng)爭(zhēng)中持續(xù)受益。
從商業(yè)角度看,這兩條路徑的成本結(jié)構(gòu)也完全不同。算力堆疊需要持續(xù)的巨額投入,模型訓(xùn)練一次就要花費(fèi)數(shù)千萬(wàn)甚至上億美元,這種成本最終會(huì)轉(zhuǎn)嫁到用戶身上,導(dǎo)致使用成本居高不下。而架構(gòu)創(chuàng)新雖然在研發(fā)階段需要投入,但一旦技術(shù)成熟,邊際成本會(huì)快速下降,可以為用戶提供更低價(jià)甚至免費(fèi)的服務(wù)。這就解釋了為什么 Kimi 可以開(kāi)源并免費(fèi)提供模型,而 OpenAI 卻要收取每月 200 美元的訂閱費(fèi)。
我對(duì)未來(lái)的思考
站在現(xiàn)在這個(gè)時(shí)間點(diǎn),回看 Kimi 最近幾個(gè)月的表現(xiàn),我越來(lái)越確信,中國(guó)在 AI 領(lǐng)域正在完成從追趕到并跑甚至局部領(lǐng)先的轉(zhuǎn)變。Kimi 就是這種轉(zhuǎn)變最鮮明的代表。1200 億估值、GTC 演講邀請(qǐng)、馬斯克點(diǎn)贊、Cursor 的技術(shù)背書(shū),這些不是孤立的事件,而是一個(gè)完整的證明鏈條,證明中國(guó)的 AI 技術(shù)已經(jīng)得到了全球最挑剔的評(píng)判者的認(rèn)可。而 Kimi 在國(guó)內(nèi)的領(lǐng)先地位,也從這些事件中得到了充分的印證。我對(duì) AI 行業(yè)的未來(lái)發(fā)展有一些思考,而這些思考很大程度上都是基于觀察 Kimi 的發(fā)展軌跡得出的。
開(kāi)源將成為主流。雖然 OpenAI 和 Anthropic 這樣的閉源公司短期內(nèi)仍會(huì)保持影響力,但長(zhǎng)期來(lái)看,開(kāi)源模式的優(yōu)勢(shì)會(huì)越來(lái)越明顯。開(kāi)源意味著更快的迭代速度、更廣泛的應(yīng)用場(chǎng)景、更低的使用成本,這些都是閉源模式無(wú)法比擬的。Kimi 和 DeepSeek 的成功只是開(kāi)始,我們會(huì)看到更多高質(zhì)量的開(kāi)源模型出現(xiàn),而這些模型會(huì)逐漸侵蝕閉源模型的市場(chǎng)份額。
技術(shù)創(chuàng)新將超越資本規(guī)模成為競(jìng)爭(zhēng)的核心。過(guò)去兩年,AI 行業(yè)的競(jìng)爭(zhēng)很大程度上是融資能力的競(jìng)爭(zhēng),誰(shuí)能融到更多錢,誰(shuí)就被認(rèn)為更有可能勝出。但隨著 Kimi 這樣的公司證明技術(shù)創(chuàng)新可以彌補(bǔ)資源劣勢(shì),這種認(rèn)知會(huì)發(fā)生改變。投資人會(huì)更關(guān)注技術(shù)團(tuán)隊(duì)的創(chuàng)新能力,而不只是看融資規(guī)模和估值增長(zhǎng)。
Kimi 的快速崛起給整個(gè)行業(yè)帶來(lái)了重要啟示:在 AI 時(shí)代,真正的競(jìng)爭(zhēng)力不在于你有多少 GPU、融了多少錢,而在于你的技術(shù)創(chuàng)新能力、你對(duì)用戶需求的理解、你愿意開(kāi)放和分享的程度。那些試圖通過(guò)封閉和壟斷來(lái)保持競(jìng)爭(zhēng)優(yōu)勢(shì)的公司,最終會(huì)被更開(kāi)放、更創(chuàng)新的力量所超越。這不是預(yù)測(cè),而是技術(shù)發(fā)展的必然規(guī)律。開(kāi)源的力量正在改寫(xiě) AI 的游戲規(guī)則。
- END -
兩個(gè)“特別坑”的AI產(chǎn)品創(chuàng)業(yè)方向,你知道嗎
![]()
速度將成為AI時(shí)代唯一的護(hù)城河
![]()
a16z重磅預(yù)測(cè):Vibe coding贏者通吃?錯(cuò)了,垂直專業(yè)化才是未來(lái)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.