3月27日,中關村論壇大會期間,一場主題為OpenClaw與AI開源的圓桌人頭攢動,主持人是月之暗面創始人楊植麟,嘉賓包括智譜華章CEO張鵬、無問芯穹聯合創始人兼CEO夏立雪、小米MiMo大模型負責人羅福莉、香港大學助理教授黃超,各方針對時下熱點和未來發展給出了自己的觀點。
過去兩年,大模型的主線還是“更聰明地回答問題”,從 OpenClaw 爆火開始,行業的敘事已經悄然切換——AI不再只是對話者,而是開始成為“干活的人”。
OpenClaw的意義,恰恰在于它像一個“腳手架”,把原本分散在模型、工具、算力之間的能力重新組織起來,讓普通用戶也能調用原本只屬于工程師的復雜能力。從寫代碼、調接口,到執行長任務、自動調試,這種能力的下沉,本質上是在降低“創造力的門檻”。與此同時,它也放大了另一面:token消耗呈指數級增長,推理成本迅速抬升,基礎設施開始承壓,整個行業被迫進入“推理時代”的真實考驗。
也正因此,圍繞OpenClaw展開的討論,早已超出一個產品或框架本身。它牽動的是一整套新的問題:模型如何支撐長上下文與復雜規劃?基礎設施如何適配毫秒級調用與海量token?多Agent協作、記憶管理、工具生態如何形成閉環?以及最現實的——算力與成本,能否跟上這場爆發式需求。
在這場對話中,產業鏈各方的參與者給出了各自的答案,也共同勾勒出一個清晰趨勢:未來12個月,大模型競爭的核心,將從“誰更聰明”,轉向“誰能讓AI真正工作起來”。
![]()
以下為對話實錄,經編輯:
OpenClaw帶來的變革
楊植麟:很榮幸今天能邀請到各位重磅嘉賓,覆蓋了從模型層到底層算力層,再到上層Agent層的不同層面。今天最主要的關鍵詞是開源和Agent。
我們先從第一個問題開始——現在最流行的OpenClaw,大家日常使用OpenClaw或類似產品時,覺得最有想象力或印象深刻的是什么?從技術角度如何看待OpenClaw和相關Agent的演進?
張鵬:我很早就開始玩OpenClaw,當時還不叫OpenClaw,最早叫Clawdbot。作為程序員出身,自己動手折騰這些東西有一些獨特體驗。
OpenClaw最大的突破點在于,這件事不再是程序員或極客們的專利,普通人也可以方便地使用頂尖模型的能力,尤其是在編程和智能體方面。
我更愿意把OpenClaw稱作"腳手架"。它在模型基礎之上搭起了一個牢固、方便又靈活的腳手架,大家可以按照自己的意愿使用底層模型提供的新奇能力。原來一些想法受限于不會寫代碼或其他技能,今天終于可以通過簡單交流完成。這對我來說是一個非常大的沖擊,讓我重新認識了這件事。
夏立雪:我最開始用OpenClaw時不太適應,因為習慣了跟大模型聊天的交流方式,感覺OpenClaw反應很慢。但后來我意識到,它和之前的聊天機器人有一個很大不同,它應該是一個能幫我完成大型任務的"人"。
當我開始提交更復雜任務時,發現它能做得很好。這讓我感觸很深,模型從最初按token聊天,到現在能變成Agent、變成Claw幫你完成任務,對整個AI的想象力空間做了很大提升。但同時,它對系統能力的要求也變得很大,這也是為什么一開始會覺得有點卡。
作為基礎設施層廠商,我看到OpenClaw給整個系統和生態帶來了更多的機遇和挑戰。我們現有的資源想要支撐這樣一個快速增長的時代是不夠的。以我們公司為例,從一月底開始,基本上每兩周token量翻一番,到現在翻了十倍。上次見到這個速度還是3G時代手機流量的感覺。
現在的token用量就像當年每月一百兆手機流量的時代,所有資源需要進行更好地優化和整合,讓每一個人都能把OpenClaw這樣的AI能力用起來。作為基礎設施玩家,我對這個時代是非常激動和感觸的,認為這里邊有很多的優化空間值得探索。
羅福莉:我把OpenClaw當作框架的一個非常革命性和顛覆性的事件來看待。雖然身邊進行深度coding的人第一選擇還是Claude Code,但只有用過OpenClaw的人會獨特地感受到這個框架在Agent框架設計上的領先性。最近Claude Code的很多更新其實都在向OpenClaw靠近。
OpenClaw給我帶來更多是想象力的隨時隨地擴展。Claude Code最開始只能在桌面上延展創意,但OpenClaw可以隨時隨地延展創意。
OpenClaw的核心價值在于兩點:
第一是開源。開源是非常有利于整個社區深入參與、改進、投入一線框架的重要前置條件。像OpenClaw、Claude Code這樣的Agent框架,把國內可能沒有非常接近閉源模型、但水平仍在頭部賽道上的模型上限拉到非常高。在絕大部分場景中,任務完成度已經非常接近最新模型,同時把下限保證得非常好,靠一套Harness系統或Skills體系等諸多設計,保證任務完成度和準確率。
從基座大模型角度來說,OpenClaw保證了模型的下限,拉伸了它的上限。此外,大家發現原來在大模型之外,更重要的Agent層有非常多想象力和空間可以做。我看到最近社區有更多除了研究員以外的人參與到AGI變革中,更多人借助更強的Agent框架替代自己的工作,釋放時間去做更有想象力的事情。
黃超:從交互模式來講,OpenClaw這次爆火的第一個原因,是給了大家一種更有"活人感"的感覺。我們做Agent也有一兩年了,但之前像Cursor、Claude Code這些Agent給人更強的是工具感。OpenClaw第一次以IM軟件嵌入的方式,讓大家更有活躍感,更接近想象中個人賈維斯的概念。
另一個啟發是,它的架構——Agent loop這種非常簡單但高效的框架再次被證明。這讓我們重新思考,是否需要一個all-in-one非常強大的智能體幫我們做很多事情,還是需要一個像輕量級操作系統或腳手架一樣的小管家?
OpenClaw可以通過一個小的super system生態,讓整個社區更有"玩起來"的心態,撬動整個生態里的所有工具。隨著Skills或Harness等越來越多人設計更面向OpenClaw系統的應用,賦能各行各業。這與整個開源生態結合得非常緊密。這兩點帶給我們最大啟發。
OpenClaw改變了什么
楊植麟:順著OpenClaw的話題,想問張鵬,最近智譜發布了新的GLM-5 Turbo模型,對Agent能力做了很大增強。能否介紹一下這個新模型與其他模型的不同之處?我們也觀察到有提價策略,這反映了什么市場信號?
張鵬:這是個很好的問題。前兩天我們確實緊急更新了一波,這在我們整個發展路標中是其中一個階段,提前放出來。最主要目的還是要主打從原來簡單的對話到干活。正如剛才各位講的,OpenClaw真的讓大家覺得大模型不再是簡單聊天,真的能幫我干活。
但"干活"背后隱含的能力需求非常高。它需要自己長程做任務規劃、不斷重試、壓縮上下文、debug等,還可能涉及多模態信息處理。這對模型本身能力的要求與傳統的面向對話的通用泛用模型不一樣。GLM-5 Turbo在這方面做了專門加強,尤其是讓它能7×24小時不停地loop。
關于token消耗量,讓聰明模型干復雜任務,token消耗量非常巨大。一般人可能體會不出來,只會看到賬單上的錢不停往下掉。這方面我們也做了優化,面臨復雜任務時用更高效的token效率完成。本質上模型架構還是多任務協同的通用架構,只是能力有偏向性加強。
提價這事很好解釋。我們現在不再是簡單問一個問題他回答,背后思考鏈路很長。很多任務通過寫代碼方式與底層基礎設施打交道,還要debug、隨時改正錯誤,消耗量非常大。完成一個任務需要的token量可能是原來回答簡單問題的十倍甚至百倍。所以價格上需要成本提高,模型變得更大,推理成本相應提高,我們把它回歸到正常商業價值。長期靠低價競爭不利于整個行業發展,這讓我們能在商業化路徑上有良性閉環,持續優化模型能力。
楊植麟:現在開源模型和推理算力開始形成生態,各種開源模型可以在各種推理算力上為用戶提供更多價值。隨著token量暴漲,逐漸從訓練時代變成推理時代。想請教夏立雪,從infra層面,推理時代對無問意味著什么?
夏立雪:我們是誕生在AI時代的基礎設施廠商,現在和Kimi、DeepSeek等合作,也在跟小米MiMo合作,讓大家能把token工廠更高效用起來。
我們一直在思考,AI時代需要的基礎設施會是什么樣子?怎么一步步實現和推演?我們做好了充分準備,看到短期、中期、長期不同階段需要解決的問題。
當前的問題就是OpenClaw帶起來的token暴增,對系統效率帶來更大優化需求。價格增長也是需求下的一種解決方式。我們一直以來從軟硬件打通方式布局解決,接入了幾乎所有種類的計算芯片,把國內幾十種芯片和幾十個不同算力集群統一連接起來,解決算力資源緊缺問題。資源不足時,最好辦法是,第一把能用資源都用起來,第二,讓每個算力都用在刀刃上,讓每個資源發揮最大轉化效率價值。
我們要打造更高效的token工廠,做了很多優化,讓模型和硬件上各種顯存、技術進行最優適配,也在看最新模型結構和硬件結構下能否進行更深層次化學反應。
但解決當前效率問題只是打造了標準化token工廠,面向Agent時代還不夠。Agent更像一個人,能交給他一個任務。當前很多云計算時代的基礎是為服務程序、服務人類工程師設計的,而不是為AI設計的。
有點像我們做了一個基礎設施,上面接口是為人類工程師做的,再包一層接入Agent,這種方式用人的操作能力限制了Agent發揮空間。舉例來說,Agent能做到秒到毫秒級別思考和發起任務,但之前底層K8s等能力沒做好這個準備,因為人類大概發起任務是分鐘級別的。
我們需要進一步優化,打造更智慧化的調控工廠,這是無問芯穹正在做的事。從更長遠的未來,真正AGI時代到來時,連基礎設施都應該是智能體。
我們打造的這套工廠本身應該是能自我進化、自我迭代的自主組織,相當于有個CEO,這個CEO是Agent,可能是CLaw在管理整個基礎設施,根據AI客戶需求自己提需求、迭代基礎設施,這樣AI和AI之間才能更好耦合。我們也在做讓Agent和Agent之間更好通信等能力。
我們一直思考基礎設施和AI發展不應該是隔離狀態,而應該產生豐富化學反應。這才是真正做到軟硬協同、算法和基礎設施協同,也是無問芯穹想實現的使命。
楊植麟:接下來問問羅福莉。小米最近發布新模型、開源一些背后技術,對社區做出很大貢獻。小米在大模型方面有什么獨特優勢?
羅福莉:先拋開小米有什么獨特優勢,我更想談中國做大模型的團隊在大模型上的優勢,這個話題更具廣泛價值。
大概兩年前,我看到中國基座大模型團隊已經開始非常好的突破。這個突破是,在有限算力下,尤其在NV-Link互聯帶寬受限的算力情況下,怎么突破低端算力限制,做一些看似為效率妥協的模型結構創新。像DeepSeek V2、V3系列、細粒度MoE和MLA等。
但后面能看到,這些創新引發的是變革,在算力一定情況下,怎么發揮一定算力的最高智能水平。這是DeepSeek帶給所有國內機構、大模型團隊的一個勇氣和信心。
雖然今天國產芯片尤其是推理芯片和訓練芯片不再受這個限制,但在這樣的限制下催生了我們對更高訓練效率、更低推理效率的模型結構全新探索。像最近的Hybrid Sparse Attention或Lite Attention架構,DeepSeek的DSA、Kimi也有 KSA,小米也有面向下一代的架構。
這是區別于MoE這一代架構,面向AGI時代思考如何在Agent時代做更好模型架構構創新。為什么架構創新如此重要?
大家真實去用OpenClaw會發現,越用越好用、越用越聰明的前提是推理的context。
Context是我們談論很久的話題,但現在真正發現有模型在long-context情況下表現非常好、性能強勁、推理成本低。很多模型不是做不到1M或10M context,而是推1M、10M成本太貴、速度太慢。
怎么做到在1M或10M context情況下推理成本夠低、速度夠快,這樣才會有真正高生產力價值的任務交給模型,從而激發在long-context情況下完成更高復雜度任務,才可能在10M甚至100M context情況下實現模型自迭代。
所謂模型自迭代,就是它可以在復雜環境里依靠超長context完成自我進化。這個進化有可能是對Agent框架本身,也有可能是對模型參數本身。我們認為long-context本身就是對參數的進化。所以怎么實現long-context efficient架構,以及怎么在推理側做到long-context efficient,是全方位競爭。
除了預訓練做好long-context架構(這是一年前就探索的問題),當今怎么做到在真實長距離任務上的穩定性和非常高上限效果,是后訓練再迭代的創新范式。我們在想怎么構造更有效的機器學習算法,怎么采集到真實在1M、10M、100M上下文里都具有長期依賴的文本等,這是我們現在后訓練正在經歷的事。
更長期的事是大模型本身飛速進步,加上Agent框架更好加持。像夏立雪說的,推理需求今年已發生近十倍增長,今年整個token增長會不會到100倍?這里又到了另外維度競爭——算力或推理芯片,甚至下到能源。
楊植麟:下面問問黃超。你開發了一些非常有影響力的Agent項目,包括NanoBot,也有很多社區粉絲。從Agent harness或應用層面,接下來有什么技術方向你覺得比較重要、大家需要關注?
黃超:如果把Agent技術抽象出來,關鍵幾個點是planning、memory和tool use。
Planning方面,現在問題還是面向長任務或非常復雜上下文,比如500步甚至更長部署。很多模型不一定能做很好planning,本質上可能不具備隱性知識,特別是在復雜垂直領域。未來可能需要把已有的各種復雜任務知識固化到模型里面。Harness一定程度上緩解了planning帶來的錯誤,因為它提供高質量skill,本質上是蓋住模型去完成比較難的task。
Memory方面,memory永遠存在信息壓縮不準確等問題。長任務和復雜場景下memory會暴增,帶來壓力。現在各類CLaw都采用最簡單文件系統,這種markdown格式的memory,通過共享文件方式來做。未來memory應該走向分層設計,包括如何更通用。
現在memory機制很難做到很通用。Coding場景、Deep Research、多媒體領域數據模態差別很大,如何對這些memory做很好檢索索引、更高效,永遠在做rade-off。
另外,OpenClaw讓創建Agent門檻大幅降低后,未來可能不止一個CLaw。我看到Kimi也有Agent Swarm機制,未來每個人會擁有一群CLaw。一群CLaw相比一個CLaw,上下文暴增會非常大,這也是帶給memory的壓力。現在還沒有很好機制管理一群CLaw帶來的整個上下文,特別是復雜coding、科研發現,帶給模型和Agent架構壓力挺大。
Tool Use方面,skill現在存在一些問題。MCP當時存在質量不保障、安全問題,現在skill也存在類似問題。看似確實會有很多skill,但高質量skill比較少,低質量skill會影響Agent任務完成度,還有就是skill注入安全問題。
從tool use這塊,可能需要靠整個社區把skill發展更好,甚至通過執行過程中進化出新skill。這是planning、memory和skill當下存在的痛點和未來潛在方向。
楊植麟:可以看到兩位嘉賓從不同視角討論同一個問題——隨著任務復雜度增加,上下文會暴漲。模型層面可以提升原生上下文長度,Agent harness層面像planning、memory、multi-Agent harness也能在特定模型能力下支持更復雜任務。這兩個方向接下來會有更多化學反應,提升任務完成難度。
未來12個月,大模型向何處去
楊植麟:最后來個開放式展望。請各位用一個詞描述接下來12個月大模型發展趨勢及期望。從黃超開始。
黃超:生態。
12個月在AI看起來好遙遠,都不知道12個月后會發展成什么樣。
我覺得一個詞應該叫生態。現在CLaw讓大家活躍,但未來Agent真的要真正從個人助手轉換為"打工人"很重要。現在大家玩CLaw也是新鮮感、好玩,但未來真的得讓CLaw們沉淀下來,成為大家的搬磚工具,成為真正的AI worker。這需要整個生態的努力。
開源很重要,把所有相關技術探索、模型都開出去后,需要整個生態一起來共建。不管是模型迭代、skills平臺迭代還是各種工具,都需要更好面向CLaw創造更好生態。
未來很多軟件可能不一定會面向人類,因為人類需要GUI,可能是面向Agent原生使用的。人會只使用讓自己快樂的GUI。整個生態又從GUI或MCP轉到CLI模式,需要整個生態變成Agent原生、Agent-native模式,才能讓Agent發展更加豐富。
羅福莉:自主化
把問題縮小到一年很有意義。五年從我心目中對于AGI定義而言已經實現了。如果用一個詞描述接下來一年AGI歷程最關鍵的事情,我認為是自主化。
雖然這個詞有點玄幻概念,過去一年大家多次提到,但我最近才對它有更深體會,具體怎么做會有更務實可行的方案。
借助強大模型,之前在chat范式下根本沒發揮預訓練模型上限,現在被Agent框架激活到了。觸到上限后執行更長時間任務時,發現模型可以自己學習和進化。
很簡單嘗試:在現有框架疊加可verify的條件限制,設置loop讓模型不停迭代優化目標,就能發現模型會持續拿出更好方案。這種自主化國內模型基本能跑一兩天,當然跟任務難度有關。在一些科學研究上,比如探索更好模型結構(有評估標準如更低PPL),在這種確定任務上已能自主運行兩三天。
從我的角度,自主化是唯一可以創造新東西的地方。它不是替代現有生產力,而是像頂尖科學家一樣探索世界上沒有的東西。
一年前我覺得時間歷程會拉到3-5年,但近期覺得應縮小到最近1-2年。我們可以讓大模型疊加非常強的自主化Agent框架,實現科學研究至少指數級加速。最近組內做大模型研究的同學workflow非常不確定、高度創造力,借助Claude Code加非常頂尖模型已基本能加速研究效率近十倍。期待這種范式輻射到更廣學科和領域,自主化非常重要。
夏立雪:可持續Token。
我的關鍵詞叫可持續Token。現在整個發展還在長期持續過程中,希望有長久生命力。作為基礎設施角度看到的很大問題是資源終究有限,就像當年講可持續發展。
作為token工廠,能否給大家提供持續穩定、大規模能用的token,讓頂尖模型真正繼續為更多下游服務,是很重要的問題。需要把視角放寬到整個生態,從最早能源轉化到算力,再轉化到token,最終轉化成GDP鏈路,進行持續經濟化迭代。不止把國內各種算力用起來,也在把這些能力輸出到海外,讓全球資源打通整合。
這也是想把中國特色token經濟學做起來。之前時代是Made in China,能把中國低價制造能力變成好商品輸出全球。現在想做的是AI Made in China——把中國能源優勢通過token工廠持續轉化成優質token輸出全球,成為世界的token工廠。這是我想要在今年看到的中國給世界人工智能帶來的價值。
張鵬:算力。
我就簡短一點,大家可能都在仰望星空,我就落地一點。未來12個月面臨的最大問題可能就是算力。
所有技術包括智能體框架讓很多人有很好創造力、效率提升十倍,但前提條件是大家能夠用得起、用得起來。不能因為算力不夠,問題提出讓他思考半天也不給答案,這肯定不行。也因為這種原因,可能連研究進展、很多想做的事都受阻了。
前兩年我記得沈向洋院士應該也是在中關村論壇說了一句話:"沒卡沒感情,談卡傷感情"。我覺得今天又到了這個地步,但情況又不一樣了——我們又到了推理階段。推理階段是因為需求真在爆發,十倍百倍爆發。需求是100倍,還有大量需求沒滿足怎么辦,大家一起來想想辦法。
楊植麟:感謝各位的精彩分享!(本文作者 | 張帥,編輯 | 楊林)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.