![]()
出品|虎嗅科技組
作者|宋思杭
編輯|苗正卿
頭圖|中關村論壇現場
上一次智譜AI與月之暗面同臺,還是在1月10日。那天是智譜通過港交所聆訊后的第三天,一個周六,在中關村國際創(chuàng)新中心舉行了一場名為AGI-Next的前言峰會。
兩個半月后,故事推進得更快了。
市場消息顯示,月之暗面正考慮在香港進行首次公司募股(IPO),目前已與中金公司及高盛展開磋商,相關事件仍處于初期階段,具體時間尚未確定。對此,虎嗅向月之暗面方面求證,對方不予置評。
幾乎在同一時間,兩家公司再次同臺,還是中關村國際創(chuàng)新中心,在中關村論壇的現場。
![]()
臺上坐著的,是這一輪大模型浪潮中最核心的一批玩家:月之暗面創(chuàng)始人楊植麟、智譜CEO張鵬、無問芯穹創(chuàng)始人夏立雪、小米MiMo負責人羅福莉,以及香港大學助理教授黃超。
他們討論的,是最近一個月,讓整個行業(yè)“重新忙起來”的那只龍蝦OpenClaw。
過去一個月,這只“龍蝦”幾乎把大模型的調用曲線重新拉了一遍。包括智譜、Kimi,以及小米MiMo在內的多家模型廠商,都在這一波中吃到了最直接的紅利。
3月下旬,在全球最大的模型API聚合平臺OpenRouter上,一款代號為 Hunter Alpha 的模型調用量迅速沖上榜首。隨后小米認領,這一模型正是MiMo-V2-Pro。
更重要的是,龍蝦帶來的,并不只是調用量的暴漲。它讓行業(yè)清晰地看到:大模型開始“干活”之后,一整套新的技術與商業(yè)邏輯,正在被同時改寫。
這場討論,指向的是推理階段正在出現的幾條新分水嶺。
1、模型開始承擔“完整任務鏈路”
首先,在這場對話中,點出了這只龍蝦的價值,首先是幾位模型玩家對它的定義,以及它能帶來什么。
過去,用戶是給大模型提問題,大模型還無法幫用戶做任務,或者說過去的那條鏈路是斷的。
而現在,OpenClaw帶來的最大變化,是把模型拉進了任務執(zhí)行環(huán)節(jié)。用戶給出的不再是問題,而是目標;系統需要完成拆解、嘗試、修正和交付。
在張鵬的定義里,它更像一個“腳手架”——普通人可以在其上調用頂級模型,完成完整任務鏈路。用戶與模型的關系,也從“提問—回答”,轉向“目標—執(zhí)行—迭代”。
這直接改變了評價方式。單輪回答已經不重要,關鍵在于復雜任務能否穩(wěn)定收斂。模型第一次被放進交付結果的語境里。隨之出現的,是“慢”的感知。系統在做規(guī)劃、調度和試錯,這些都在消耗時間,也在堆疊能力。
2、繼“水電煤”之后,Token開始具備生產力屬性
一個被反復提及的信號是:Token正在失控式增長。
夏立雪提到,公司Token用量從1月底開始,每兩周翻一倍;而在Agent場景下,單個任務的Token消耗,是傳統問答的10倍甚至100倍。
過去,在大模型對話問答時代,Token消耗量低,普通用戶免費就能用得AI。但龍蝦出現之后,這個共識被推翻了。Token用量在短時間內呈指數增長,已經成為新的共識。Agent任務的消耗量,遠高于傳統對話。
但Token不再只是成本指標。它對應的是規(guī)劃、執(zhí)行、調用工具的全過程,接近一種“機器工時”。這會重塑價格體系。成本上升不再是單純壓力,而是和任務價值綁定,成為新的定價基礎。
3、從訓練時代,快進到推理時代
簡單來說,在智譜、MiniMax等大模型公司還未上市的時間段里,“訓練”依然是主流。但龍蝦的出現,一下加速了推理時代的到來。
而具體來解釋,隨著任務復雜度上升,Context長度正在迅速拉長到1M甚至10M級別。這迫使廠商開始在推理側做結構創(chuàng)新,例如:Hybrid架構、Linear Attention、Long Context Efficient設計。
這些創(chuàng)新架構的核心目的只有一個,就是如何在更長Context下,把成本打下來、把穩(wěn)定性提上去。
這也意味著競爭維度在下沉:從模型參數規(guī)模,轉向推理效率、系統調度,甚至能源成本。
4、系統能力開始抵消模型差距
在Agent框架下,模型之間的能力差距被部分壓縮。通過Skill和工具組合,次頂級模型也能完成復雜任務。
在這個時候,用戶關注點隨之變化,更看重任務結果,而非模型本身的指標。
參與門檻也在降低。構建能力逐漸向系統工程傾斜,而不再局限于算法本身。
以下是月之暗面創(chuàng)始人楊植麟、智譜CEO張鵬、無問芯穹創(chuàng)始人夏立雪、小米MiMo負責人羅福莉,以及香港大學助理教授黃超的精選部分對話:
楊植麟:現在最火的無疑就是openclaw,大家在日常使用或者類似產品時,覺得什么最有想象力或印象深刻?我們從技術角度,先請張鵬談談對openclaw和相關Agent的看法。
張鵬:我把它稱作一個“腳手架”。它提供了在模型基礎上搭建非常牢固、方便且靈活的可能性。普通人可以極低門檻地使用頂尖模型,尤其是編程和整體能力。以前想法受限于不會編程等技能,現在通過簡單交流就能完成,這是一個非常大的突破。
夏立雪:我最開始用不太適應,習慣了聊天式交互,感覺openclaw很慢。后來發(fā)現它其實是能幫我完成大型任務的。從按Token聊天到現在能完成任務的Agent,想象力空間提升了,但對系統能力要求也變大了,這就是為什么一開始會覺得卡。
作為基礎設施廠商,我看到的是機遇和挑戰(zhàn)。我們的資源要支撐起這個快速增長的時代。比如我們公司從1月底開始,每兩周Token量翻一番。現在的Token用量就像當年100兆手機流量的時代。我們需要更好的優(yōu)化和整合,讓每一個鮮活的人都能用起來。這對整個社區(qū)是巨大的優(yōu)化空間。
羅福莉:我認為openclaw是一個非常革命性和顛覆性的事件。雖然深度Coding的人首選可能還是Code,但用過openclaw的人會感受到它在Agent框架設計上是領先于Code的,Code的最新更新其實都在向openclaw靠近。
它給我的最大價值在于“開源”:這有利于社區(qū)深入參與。它把國內次頂級閉源模型的上限拉得非常高,在絕大部分場景下任務完成度已非常接近最新模型,同時又靠Skill體系保證了下限。
此外,它點燃了大家的想象力。大家發(fā)現大模型外的Agent層有巨大空間,更多人,不僅是研究員,開始參與AGI變革,這在一定程度上替代了重復工作,釋放了時間去做更有想象力的事。
黃超:首先是從交互模式上,openclaw給了大家一種“更有活人感”的體驗。之前的Agent工具感更強,而openclaw以“軟件切入”的方式,更接近大家想象中的個人賈維斯(J.A.R.V.I.S.)。
其次,它證明了架構Agent的框架可以既簡單又高效。它讓我們重新思考:是否需要一個All in one的超級智能體,還是需要一個輕量級操作系統或腳手架式的小管家?它讓大家更有“玩起來”的心態(tài),撬動生態(tài)里的所有工具,通過Skills或Tool的設計,賦能各行各業(yè)。
楊植麟:順著剛才大家一直在討論 OpenClaw,我也想接著問張鵬一個問題。智譜最近發(fā)布了新的GLM Turbo模型,這個模型在相關能力上也做了很大的增強。能否介紹一下新舊模型的不同?以及觀察到的提價策略反映了什么市場情況?
張鵬:發(fā)布Turbo主要是為了從“簡單的對話”轉向“干活”。openclaw讓大家看到大模型能干活,但干活背后的Token消耗非常高,需要規(guī)劃、嘗試、Debug、處理模糊需求。Turbo在這些方面做了優(yōu)化,本質上是多智能體協同架構,但在能力上有偏向性加強。
關于提價,因為干活消耗的Token量是簡單問答的10倍甚至100倍,成本大幅提高。長期低價競爭不利于行業(yè)發(fā)展,調整價格是為了回歸正常的商業(yè)價值,讓我們能持續(xù)優(yōu)化模型,提供更好的服務。
![]()
楊植麟:小米最近通過發(fā)布新模型和開源技術對社區(qū)做出了貢獻,小米做大模型有什么獨特優(yōu)勢?
羅福莉:我想先不談小米的獨特優(yōu)勢,而是談談中國大模型團隊的優(yōu)勢。
兩年前,中國團隊在算力受限,尤其是互聯帶寬受限的情況下,做出了突破:在低端算力限制下,通過模型結構創(chuàng)新(如DPCV3、M1、MA等)去追求最高效率。這給了我們勇氣和信心。
雖然現在國產芯片不再受限,但這種對高效率、低推理成本的探索依然重要。例如,現在的Hybrid、SPA、Linear attention結構等。
為什么結構創(chuàng)新重要?因為openclaw越用越聰明的前提是推理Context。現在的難題是:怎么在1M或10M的長上下文下,做到成本夠低、速度夠快?只有這樣,才能激發(fā)高生產力任務,實現模型自迭代,在復雜環(huán)境中依靠超長Context完成自我進化。
我們現在正在探索Long Context Efficient架構,以及如何在真實長距離任務上做到穩(wěn)定和高上限。
更長期看,隨著推理需求爆發(fā),今年可能增長100倍,競爭維度將下探到算力、推理芯片甚至能源層面。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4846022.html?f=wyxwapp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.