<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      Kimi用戶“被勸退”,都怪中國大模型Token調(diào)用量領(lǐng)跑全球?

      0
      分享至

      3月15日,全球最大AI模型聚合平臺(tái)OpenRouter發(fā)布了一組數(shù)據(jù),中國大模型在這一周的調(diào)用量達(dá)到4.69萬億Token,連續(xù)第二周壓過美國,全球調(diào)用量排名前三的位置被中國模型包攬。

      同一時(shí)期,月之暗面公司的Kimi正經(jīng)歷一場(chǎng)從資本到市場(chǎng)的連環(huán)爆發(fā)。

      據(jù)證券時(shí)報(bào)報(bào)道,2025年12月底至今,Kimi完成三輪融資,估值在不到三個(gè)月內(nèi)翻了四倍,升至180億美元,成為國內(nèi)估值最快突破百億美元的“十角獸”公司。

      新一輪10億美元融資正在進(jìn)行。

      受Kimi K2.5模型及Kimi Claw火爆出圈帶動(dòng),1月底以來,Kimi20天收入超過2025年全年。

      全球支付巨頭Stripe的數(shù)據(jù)顯示,Kimi個(gè)人訂閱用戶1月支付訂單數(shù)環(huán)比增長8280%,2月環(huán)比再漲123.8%,沖進(jìn)Stripe全球榜單前十。

      海外開發(fā)者發(fā)現(xiàn)知名AI編程工具Cursor發(fā)布的新模型Composer 2疑似基于Kimi K2.5開發(fā),馬斯克在社交平臺(tái)回復(fù)“是的,這就是Kimi 2.5”,Kimi隨后表示感謝。


      此前馬斯克還曾對(duì)月之暗面的技術(shù)報(bào)告表示“令人印象深刻的結(jié)果”。

      兩件事,一個(gè)指向中國AI基建的整體水位,另一個(gè)指向單一明星公司的聲量與資本神話。

      表面上看,都是好消息。

      但如果把這兩條線放在一起,用同一個(gè)用戶視角去觀察,就會(huì)看到一種被高速增長掩蓋的緊張感。

      我使用Kimi查資料時(shí),最常遇到的就是那句“高峰時(shí)段算力不足”。

      起初以為只是個(gè)別產(chǎn)品的運(yùn)營波動(dòng),直到看到4.69萬億Token這個(gè)數(shù)字,才意識(shí)到那句提示語背后站著的不是某個(gè)公司的服務(wù)器告急,而是整個(gè)行業(yè)的供需方程式正在被改寫。

      Kimi的算力不足,是中國大模型4.69萬億Token周調(diào)用量這個(gè)宏觀數(shù)據(jù)在個(gè)體身上的具體折射。

      宏觀數(shù)據(jù)講的是總盤子,但總盤子是由無數(shù)個(gè)用戶每一次點(diǎn)擊、每一個(gè)智能體晝夜不停的輪詢堆積出來的。

      Kimi作為頭部應(yīng)用,它的算力緊張恰恰說明那個(gè)“總盤子”已經(jīng)大到了讓供給端出現(xiàn)明顯缺口的程度。

      AI智能體是這一輪需求爆炸的直接推手。

      以O(shè)penClaw為代表的智能體框架,把大模型從回答問題的工具變成了自動(dòng)執(zhí)行任務(wù)的數(shù)字員工。

      一個(gè)配置合理的智能體可以全天候工作,消耗的Token是普通聊天的幾十倍甚至上百倍。

      Kimi K2.5恰好成為開源智能體框架OpenClaw的首選模型,海外開發(fā)者的調(diào)用量因此激增,直接加劇了算力緊張。

      這個(gè)細(xì)節(jié)很重要,Kimi的算力緊張不是來自國內(nèi)用戶的自然增長,而是被一個(gè)技術(shù)范式轉(zhuǎn)變推到了風(fēng)口。

      AI智能體正在從極客玩物變成規(guī)模化部署的生產(chǎn)力工具,每一輪調(diào)用都是持續(xù)的、長鏈路的、高度密集的,不再像人類聊天那樣有間歇和停頓。

      其模式對(duì)算力的消耗方式,與過去的應(yīng)用場(chǎng)景完全不同。

      與此同時(shí),4.69萬億Token的周調(diào)用量里,智能體貢獻(xiàn)了巨大份額。

      摩根大通預(yù)測(cè),中國的AI推理Token消耗量將從2025年的約10千萬億增長到2030年的約3900千萬億,五年增長約370倍。

      數(shù)字所指向的,正是眼下發(fā)生的智能體浪潮。

      另一個(gè)容易被忽略的細(xì)節(jié),是應(yīng)用場(chǎng)景的深化。

      AI正在從聊天走向編程、多模態(tài)處理這些更消耗Token的復(fù)雜任務(wù)。

      Kimi K2.5的技術(shù)報(bào)告中提到的視覺文本聯(lián)合優(yōu)化,本身就是因?yàn)樘幚硪曨l和長圖文時(shí)的令牌生成效率成為瓶頸。

      一個(gè)視頻的處理任務(wù),其單次消耗遠(yuǎn)超日常對(duì)話。

      而編程場(chǎng)景中,模型需要反復(fù)生成、調(diào)試、修正,每一輪都是Token的密集消耗。

      用戶規(guī)模也在加速擴(kuò)張。

      微信兼容OpenClaw這件事,預(yù)示著AI應(yīng)用正從小眾工具走向全民應(yīng)用。

      當(dāng)智能體嵌入到國民級(jí)社交產(chǎn)品中,需求的基數(shù)將不再是幾十萬開發(fā)者,而是數(shù)億普通用戶。

      全民化的擴(kuò)散速度,遠(yuǎn)比芯片產(chǎn)能的擴(kuò)張要快。

      供給側(cè)的物理極限,則是更硬的約束。

      高性能芯片獲取難、成本高,在當(dāng)前國際環(huán)境下,即便Kimi資金充裕,也難以在短時(shí)間內(nèi)獲得足夠的高性能計(jì)算芯片來滿足暴漲的需求。

      全球范圍內(nèi),高性能計(jì)算芯片的產(chǎn)能擴(kuò)張速度遠(yuǎn)慢于需求的增長速度,供應(yīng)短缺是普遍現(xiàn)象。

      中國大模型總調(diào)用量的增長,并非建立在算力無限供應(yīng)的基礎(chǔ)上,而是在全球芯片供應(yīng)緊張、硬件成本持續(xù)上漲的硬約束下實(shí)現(xiàn)的。

      Kimi作為其中的一員,自然也受制于這個(gè)天花板。

      2026年3月,阿里云、百度智能云、騰訊云相繼宣布上調(diào)AI算力產(chǎn)品價(jià)格或調(diào)整Token計(jì)費(fèi)標(biāo)準(zhǔn),算力成本壓力已經(jīng)傳導(dǎo)到終端。

      全行業(yè)都在為算力短缺買單,Kimi的高峰時(shí)段算力不足,正是成本壓力傳導(dǎo)到用戶體驗(yàn)層面的直接體現(xiàn)。

      從技術(shù)層面看,Kimi應(yīng)對(duì)算力瓶頸的方式是從架構(gòu)、推理、系統(tǒng)三個(gè)層面進(jìn)行系統(tǒng)性重構(gòu)。

      架構(gòu)層通過混合注意力機(jī)制將長程記憶計(jì)算復(fù)雜度降至線性,結(jié)合稀疏化專家模型與動(dòng)態(tài)路由讓簡單任務(wù)僅激活少量專家網(wǎng)絡(luò),并通過視覺文本聯(lián)合優(yōu)化實(shí)現(xiàn)負(fù)載均衡,視頻處理長度提升四倍而算力消耗未同比例增長。

      推理層借助Toggle Token策略將輸出Token減少25%至30%,以智能體集群編排將復(fù)雜任務(wù)拆解為多模型并行處理,延遲降低4.5倍,再通過分級(jí)服務(wù)將簡單問答路由至輕量級(jí)模型,精準(zhǔn)配置算力資源。

      系統(tǒng)層通過解耦編碼器進(jìn)程使多模態(tài)效率達(dá)到純文本訓(xùn)練的90%,利用顯存管理與KV Cache復(fù)用緩解顯存壓力,并以異構(gòu)算力適配擴(kuò)大可用算力池邊界。

      以上技術(shù)優(yōu)化的方向非常清晰,從“暴力堆料”轉(zhuǎn)向“精細(xì)運(yùn)營”,用算法換取算力,用效率緩解短缺。

      但一個(gè)必須面對(duì)的事實(shí)是,在4.69萬億Token的宏觀需求面前,物理算力的絕對(duì)缺口依然存在。

      高峰期的“算力不足”,實(shí)際上是平臺(tái)在保障核心用戶體驗(yàn)與控制運(yùn)營成本之間做出的動(dòng)態(tài)平衡結(jié)果。

      技術(shù)優(yōu)化可以緩解壓力,但無法從根本上消除供給與需求之間的巨大落差。

      接下來,大模型在算力消耗上的技術(shù)改善空間依然巨大。

      但更值得關(guān)注的,是中美大模型在算力效率這個(gè)維度上正在展開的競爭。

      過去幾年,中美AI競賽的核心指標(biāo)是模型參數(shù)量、上下文長度、多模態(tài)能力。

      現(xiàn)在,算力效率正在成為新的制高點(diǎn)。

      美國企業(yè)憑借高端芯片的供給優(yōu)勢(shì),長期沿用大力出奇跡的路徑,用更強(qiáng)的單卡性能掩蓋架構(gòu)上的粗放。

      中國企業(yè)則在芯片供應(yīng)受限的硬約束下,被迫在架構(gòu)創(chuàng)新、推理優(yōu)化、系統(tǒng)調(diào)度上走得更深。

      Kimi Linear架構(gòu)、Toggle Token策略、Agent Swarm并行、異構(gòu)算力適配,這些都是在供給受限條件下長出來的能力。

      阿里云推出的Aegaeon GPU池化系統(tǒng),通過Token級(jí)別的精細(xì)調(diào)度讓一個(gè)GPU同時(shí)服務(wù)多個(gè)模型,將所需GPU數(shù)量削減82%,也是這種壓力倒逼創(chuàng)新的典型。

      國金證券的判斷值得關(guān)注,國產(chǎn)算力全鏈景氣加速,有望量價(jià)齊升。

      在供需雙側(cè)強(qiáng)邏輯的擠壓下,2026年算力產(chǎn)業(yè)鏈將進(jìn)入“全鏈通脹”周期,行業(yè)景氣度從核心芯片向AIDC、云與算力服務(wù)、配套電力設(shè)備及服務(wù)器等環(huán)節(jié)全面外溢。

      判斷的背后,是算力從“夠不夠”變成“貴不貴”的轉(zhuǎn)折點(diǎn)。

      OpenClaw重塑云計(jì)算的供需結(jié)構(gòu),云廠商的商業(yè)邏輯從單純的底層算力租賃躍升為Agent數(shù)字員工的工位提供商。

      通過一鍵部署和價(jià)格補(bǔ)貼搶占應(yīng)用入口,云廠商逐步掌控下一代AI應(yīng)用的底層分發(fā)權(quán)。

      如此變化意味著,算力不再只是基礎(chǔ)設(shè)施,而是成為應(yīng)用層競爭的門票。

      回到用戶最直接的感受。

      使用Kimi時(shí)遇到“高峰時(shí)段算力不足”,表面看是一個(gè)產(chǎn)品體驗(yàn)問題,深層次看是中國AI產(chǎn)業(yè)在Token時(shí)代初期,需求爆發(fā)式增長與供給結(jié)構(gòu)性短缺之間矛盾的典型體現(xiàn)。

      那個(gè)提示語告訴我們,中國AI已經(jīng)走到了一個(gè)臨界點(diǎn),再往前每一步,都需要技術(shù)、資本、產(chǎn)業(yè)鏈三端協(xié)同發(fā)力。

      技術(shù)優(yōu)化可以緩解燃眉之急,融資能夠解決短期的現(xiàn)金流問題,但高性能算力全球供給緊張的基本面,不是光靠技術(shù)優(yōu)化和錢就能馬上解決的。

      也因此,4.69萬億Token這個(gè)數(shù)字帶來的不只是自豪感,更是一個(gè)清醒的提醒,需求的狂飆已經(jīng)撞上了物理世界的墻。

      中美大模型在算力效率上的競爭,將是未來幾年最值得觀察的維度。

      美國企業(yè)擁有更寬松的芯片供給環(huán)境,但未必在架構(gòu)創(chuàng)新和系統(tǒng)調(diào)度上擁有絕對(duì)優(yōu)勢(shì)。

      中國企業(yè)在供給受限條件下被迫打磨出來的精細(xì)化運(yùn)營能力,反而可能成為一種差異化的競爭壁壘。

      Kimi K2.5被Cursor模型套用,馬斯克公開表示認(rèn)可,種種細(xì)節(jié)本身就說明技術(shù)層面的能力已經(jīng)跨越了某種門檻。

      算力效率的競爭,是一場(chǎng)軟硬一體化的綜合較量。


      誰的架構(gòu)更省算力,推理策略更精簡,系統(tǒng)調(diào)度更極致,誰就能在同樣的硬件條件下支撐更多的用戶和更復(fù)雜的應(yīng)用場(chǎng)景。

      眼下,Kimi用戶的“算力不足”提示,4.69萬億Token的周調(diào)用量,馬斯克的技術(shù)認(rèn)可,180億美元的估值躍升,共同構(gòu)成這一轉(zhuǎn)型的多面鏡像。

      鏡像之中,既有中國AI產(chǎn)業(yè)的創(chuàng)新活力與商業(yè)潛力,也有物理約束與供給短缺的現(xiàn)實(shí)壓力。

      未來的勝負(fù)手,在于技術(shù)優(yōu)化、商業(yè)模式、生態(tài)協(xié)同、政策支持的系統(tǒng)整合能力。

      月之暗面披露的技術(shù)方案,是這一整合能力的初步展示;而完全釋放這一能力,仍需跨越算力供給的漫長隧道。

      全文完

      愿本文令有緣讀到的朋友滿意,如您喜歡,煩請(qǐng)給文章一個(gè)點(diǎn)贊、在看或者轉(zhuǎn)發(fā),也請(qǐng)關(guān)注我的公號(hào)。

      感恩生命里與你的每一次相逢,都是時(shí)光饋贈(zèng)的溫柔奇跡。

      作者簡介


      當(dāng)你關(guān)注財(cái)經(jīng)和時(shí)事熱點(diǎn)時(shí),我愿與你分享背后的故事和觀點(diǎn)

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      23歲法蒂身價(jià)回升至1500萬歐,此前一度從8000萬跌落至500萬

      23歲法蒂身價(jià)回升至1500萬歐,此前一度從8000萬跌落至500萬

      懂球帝
      2026-03-27 21:13:06
      國足2-0爆冷僅1小時(shí)!慶祝畫面曝光,韓媒罕見肯定

      國足2-0爆冷僅1小時(shí)!慶祝畫面曝光,韓媒罕見肯定

      生活新鮮市
      2026-03-27 18:55:21
      木頭姐拋售Meta股票,重倉押注這只AI標(biāo)的 | 巴倫投資

      木頭姐拋售Meta股票,重倉押注這只AI標(biāo)的 | 巴倫投資

      新浪財(cái)經(jīng)
      2026-03-27 18:57:46
      權(quán)勢(shì)滔天的戴笠,都不敢惹的那些人,是怎樣的存在

      權(quán)勢(shì)滔天的戴笠,都不敢惹的那些人,是怎樣的存在

      翰林冷知識(shí)
      2026-03-25 23:09:45
      兒子被搶走17年之后,她補(bǔ)上了18年的生日禮物

      兒子被搶走17年之后,她補(bǔ)上了18年的生日禮物

      新京報(bào)
      2026-03-27 07:51:55
      新消息!伊朗突然宣布了!

      新消息!伊朗突然宣布了!

      達(dá)文西看世界
      2026-03-23 20:29:16
      全線跳水,超9萬人爆倉!

      全線跳水,超9萬人爆倉!

      每日經(jīng)濟(jì)新聞
      2026-03-26 20:29:17
      日本反華走向極端!商店禁止中國人入內(nèi),日本網(wǎng)友反應(yīng)更扎心

      日本反華走向極端!商店禁止中國人入內(nèi),日本網(wǎng)友反應(yīng)更扎心

      好賢觀史記
      2026-03-02 16:42:05
      美國千萬不要誤判形勢(shì)

      美國千萬不要誤判形勢(shì)

      明叔雜談
      2026-03-26 22:55:25
      新冠后遺癥對(duì)人體的最大影響,很多人深受其害,有些人還不自知

      新冠后遺癥對(duì)人體的最大影響,很多人深受其害,有些人還不自知

      呼吸科大夫胡洋
      2026-02-22 11:39:12
      沒想到不翻不知道,一翻嚇一跳,張雪峰幾乎每個(gè)月都在網(wǎng)上喊累

      沒想到不翻不知道,一翻嚇一跳,張雪峰幾乎每個(gè)月都在網(wǎng)上喊累

      歲月有情1314
      2026-03-26 12:13:10
      勢(shì)不可擋!薩巴倫卡兩盤橫掃萊巴金娜,陽光雙賽背靠背晉級(jí)決賽

      勢(shì)不可擋!薩巴倫卡兩盤橫掃萊巴金娜,陽光雙賽背靠背晉級(jí)決賽

      全景體育V
      2026-03-27 10:03:58
      3連勝!米切爾轟27+7,哈登20+6你再超神下去,騎士讓東部大結(jié)局

      3連勝!米切爾轟27+7,哈登20+6你再超神下去,騎士讓東部大結(jié)局

      巴叔GO聊體育
      2026-03-27 10:20:46
      炎黃子孫身上3大神秘印記,如果全有,說明是純正華夏族后人

      炎黃子孫身上3大神秘印記,如果全有,說明是純正華夏族后人

      銘記歷史呀
      2026-03-26 11:27:10
      伊朗用導(dǎo)彈拼出尊嚴(yán),中國導(dǎo)彈實(shí)力藏不住了,俄專家給出硬核定論

      伊朗用導(dǎo)彈拼出尊嚴(yán),中國導(dǎo)彈實(shí)力藏不住了,俄專家給出硬核定論

      探源歷史
      2026-03-25 13:22:35
      今日最慘股,昨天地天板,今日跌停板,本來不會(huì)跌停的,但因…

      今日最慘股,昨天地天板,今日跌停板,本來不會(huì)跌停的,但因…

      有范又有料
      2026-03-27 15:54:17
      蘋果官網(wǎng) Apple Store 上新,398 元起!

      蘋果官網(wǎng) Apple Store 上新,398 元起!

      花果科技
      2026-03-27 12:39:52
      伊朗發(fā)大招!徹底關(guān)閉霍爾木茲海峽,東大兩艘貨輪折返回波斯灣!

      伊朗發(fā)大招!徹底關(guān)閉霍爾木茲海峽,東大兩艘貨輪折返回波斯灣!

      阿龍聊軍事
      2026-03-27 20:02:12
      村民揭秘“梅姨”真面目:高調(diào)媒婆,財(cái)力驚人!

      村民揭秘“梅姨”真面目:高調(diào)媒婆,財(cái)力驚人!

      三農(nóng)老歷
      2026-03-27 12:46:37
      哈哈哈!伊朗吹牛都不打草稿了

      哈哈哈!伊朗吹牛都不打草稿了

      廖保平
      2026-03-27 09:25:53
      2026-03-28 01:08:49
      冷觀互聯(lián)網(wǎng) incentive-icons
      冷觀互聯(lián)網(wǎng)
      畢舸個(gè)人的財(cái)經(jīng)自媒體
      354文章數(shù) 278關(guān)注度
      往期回顧 全部

      科技要聞

      楊植麟張鵬夏立雪羅福莉,聊龍蝦、聊漲價(jià)

      頭條要聞

      男醫(yī)生給孕妻做彩超 丈夫崩潰撞墻:不過了 明天就離婚

      頭條要聞

      男醫(yī)生給孕妻做彩超 丈夫崩潰撞墻:不過了 明天就離婚

      體育要聞

      邵佳一:足球就像一場(chǎng)馬拉松

      娛樂要聞

      范瑋琪加盟,官宣《浪姐7》遭全網(wǎng)抵制

      財(cái)經(jīng)要聞

      我在小吃培訓(xùn)機(jī)構(gòu)學(xué)習(xí)“科技與狠活”

      汽車要聞

      與眾08,金標(biāo)大眾不能輸?shù)囊粦?zhàn)

      態(tài)度原創(chuàng)

      房產(chǎn)
      親子
      家居
      旅游
      游戲

      房產(chǎn)要聞

      6.8萬方!天河員村再征地,金融城西區(qū)開發(fā)全面提速

      親子要聞

      太空玩具沙超大沙盤

      家居要聞

      曲線華爾茲 現(xiàn)代簡約

      旅游要聞

      日照嵐山“打飛的”賞春成新時(shí)尚

      分析師稱PS5漲價(jià)或只是開始!任天堂與微軟或跟進(jìn)

      無障礙瀏覽 進(jìn)入關(guān)懷版