網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

幾乎都在掛羊頭賣(mài)狗肉，AI Agent的泡沫現(xiàn)在到底有多大？（上）

2025-10-14 19:03:36　來(lái)源: 知危

浙江舉報(bào)

分享至

Agent、Agnet？Agent！說(shuō)起今年的 AI 浪潮，除了年初 DeepSeek 引領(lǐng)的一波強(qiáng)化學(xué)習(xí)熱，行業(yè)內(nèi)最受關(guān)注的，莫過(guò)于各種各樣的 AI Agent 以及 “ 類(lèi) Agent ”。

不知從什么時(shí)候開(kāi)始，Agnet 變成了一種萬(wàn)能公式，什么都可以套進(jìn)去一下。但，Agent 真的有那么好嗎？真的有競(jìng)爭(zhēng)力嗎？

“ Manus 前陣子剛推出的新功能Wide Research，我覺(jué)得非常不具備競(jìng)爭(zhēng)力，對(duì)提高產(chǎn)品競(jìng)爭(zhēng)力沒(méi)有什么用。” 某大型金融企業(yè) AI 技術(shù)專(zhuān)家王顯（化名）向知危表示。

從 “ 次日即舊 ” 的榜單到被基礎(chǔ)模型一輪升級(jí)清場(chǎng)的產(chǎn)品，2025 年的Agent 創(chuàng)業(yè)，熱鬧背后是可憐的留存率與漸趨同質(zhì)的體驗(yàn)。

幾乎所有 Agent 產(chǎn)品都在講 “ 更聰明、更全能、更自動(dòng)化 ”，但用戶(hù)只試用一次就離開(kāi)的比例居高不下，Demo 能飛，落地常摔，這是否意味著通用型 Agent 的敘事正在透支？

本文，知危把鏡頭拉遠(yuǎn)，看看泡沫究竟來(lái)自資本驅(qū)動(dòng)、技術(shù)錯(cuò)配，還是場(chǎng)景誤判？

我們將邀請(qǐng)來(lái)自大型企業(yè)、創(chuàng)業(yè)公司的多位一線(xiàn)實(shí)踐者，以 Manus 近期的新產(chǎn)品 Wide Research 和公司跑路、撤資事件為引，追問(wèn)國(guó)內(nèi)外 Agent 泡沫亂象現(xiàn)實(shí)、背后的原因，以及未來(lái) Agent 賽道的生存規(guī)則。

在交流過(guò)程中，知危發(fā)現(xiàn)，通用與垂直的取舍和統(tǒng)合是決定去留的關(guān)鍵。

實(shí)際上，今年 Agent 大火，主要是在 tool-use 上取得突破，《知識(shí)圖譜：認(rèn)知智能理論與實(shí)戰(zhàn) 》、《知識(shí)增強(qiáng)大模型》與《比 RAG 更強(qiáng)- 知識(shí)增強(qiáng) LLM 型應(yīng)用程式實(shí)戰(zhàn) 》作者、大模型技術(shù)專(zhuān)家王文廣向知危表示，“ 具體來(lái)看，從編程到browser-use，再到 computer-use，以及隨著 MCP 通用接口普及率的提升，Agent 的 tool use 能力得到增強(qiáng)，能夠更高效地從外部獲取信息，以及與外部系統(tǒng)進(jìn)行交互?！?/p>

平安保險(xiǎn)技術(shù)平臺(tái)組負(fù)責(zé)人張森森進(jìn)一步向知危解釋道，“ 技術(shù)層面上，協(xié)議逐漸成熟，能力外延擴(kuò)大，可以通過(guò) MCP 協(xié)議等方式應(yīng)用到更多場(chǎng)景。應(yīng)用層面上，有些長(zhǎng)尾場(chǎng)景得到了覆蓋，比如從瀏覽器信息助手到執(zhí)行動(dòng)作的轉(zhuǎn)變：過(guò)去只是提供答案，現(xiàn)在能幫助完成動(dòng)作。生態(tài)層面也降低了一些成本。”
“ 過(guò)去廠(chǎng)商比拼模型參數(shù)，現(xiàn)在還要比拼模型加生態(tài)工具的組合能力，市場(chǎng)競(jìng)爭(zhēng)焦點(diǎn)已經(jīng)發(fā)生轉(zhuǎn)移?！?/p>

但這其中，以 Manus 為代表的通用 Agent 類(lèi)產(chǎn)品一直飽受爭(zhēng)議。

一方面，資本甚是青睞，另一方面，用戶(hù)詬病不止。直到最近，Manus 先是跑路，把公司總部從國(guó)內(nèi)搬遷到新加坡，隨后推出了 Wide Research 產(chǎn)品，再之后又被曝出將可能因?yàn)榘踩珜彶閱?wèn)題被強(qiáng)制撤銷(xiāo)融資。

在整個(gè)賽道中，炒作了大半年的 Agent 概念，也開(kāi)始面臨越來(lái)越顯性的質(zhì)疑。

王顯向知危詳細(xì)解釋了為何 Wide Research 缺乏競(jìng)爭(zhēng)力，“ 第一，Wide Research確實(shí)提高了并行處理的效率，但也非常消耗計(jì)算資源和調(diào)用額度，所以它的定價(jià)非常貴?！?br/>“ 第二，沒(méi)有看到它與單體高性能的 Deep Research 在性能準(zhǔn)確度、成本效率上的公開(kāi)對(duì)比或測(cè)試，所以不能確定它在使用大量并行任務(wù)后，效果是否真的得到提升?！?/p>

“ 最重要的一點(diǎn)是，它仍然沒(méi)有解決場(chǎng)景壁壘的問(wèn)題?！?/strong>
“ 它沒(méi)有專(zhuān)業(yè)數(shù)據(jù)、沒(méi)有專(zhuān)屬工具鏈、沒(méi)有行業(yè)認(rèn)證、沒(méi)有與業(yè)務(wù)深度綁定的集成，也沒(méi)有與高價(jià)值業(yè)務(wù)場(chǎng)景的綁定，也就是任何人都能做。所以，它更偏向工程能力的延伸，而不是在構(gòu)建場(chǎng)景護(hù)城河。”

“ 當(dāng)然，早期采用淺而寬的策略來(lái)獲客沒(méi)有問(wèn)題，但長(zhǎng)期來(lái)看，Manus無(wú)法抵御模型廠(chǎng)商的下沉和垂直廠(chǎng)商的滲透?！?/p>

“ 所以在我看來(lái)，Manus 自始至今，從產(chǎn)品角度而言，思路是完全失敗的。”

AI 技術(shù)專(zhuān)家和創(chuàng)業(yè)者陳為也基本持一致的觀點(diǎn)：“ Wide Research 的本質(zhì)是 ‘ 規(guī)?；ㄓ萌蝿?wù)執(zhí)行器 ’，效率高，但沒(méi)有解決 ‘ 決策 ’ 問(wèn)題?！?/p>

“ 用戶(hù)會(huì)發(fā)現(xiàn)，當(dāng)他們遇到真正復(fù)雜的問(wèn)題時(shí)，這個(gè)通用 Agent 還是幫不上忙，最終不得不轉(zhuǎn)向?qū)I(yè)的垂直產(chǎn)品或人工服務(wù)，導(dǎo)致用戶(hù)留存率不高。”

如果擴(kuò)大到任意的通用 Agent，則它們都具備一個(gè)看似有吸引力但實(shí)則致命的特點(diǎn)：任務(wù)范圍模糊。

知言吉智 CEO 付瑞吉向知危表示，“ 任務(wù)范圍模糊一定會(huì)對(duì)產(chǎn)品帶來(lái)不利的影響。一方面，當(dāng)一個(gè) Agent 宣稱(chēng)能做所有事情時(shí)，它往往在任何一個(gè)領(lǐng)域都做不到最好；另一方面，任務(wù)范圍模糊，意味著用戶(hù)對(duì)于這個(gè) Agent 到底能幫自己解決什么問(wèn)題也會(huì)有困惑，那么這個(gè)產(chǎn)品的認(rèn)知成本就非常高。”

付瑞吉進(jìn)一步向知危解釋了近期 Agent 泡沫興起的創(chuàng)業(yè)者心態(tài)：“ 大模型的出現(xiàn)讓大家覺(jué)得開(kāi)發(fā)門(mén)檻降低了，感覺(jué) ‘ 人人都能做 Agent ’。許多開(kāi)發(fā)者和創(chuàng)業(yè)公司認(rèn)為將其包裝成一個(gè)能解決各種問(wèn)題的 ‘ 超級(jí)助手 ’，能迅速吸引大量 C 端用戶(hù)。通用型 Agent 的核心賣(mài)點(diǎn)就是 ‘ 解決所有問(wèn)題 ’。但現(xiàn)實(shí)是，目前為止沒(méi)有任何一個(gè) Agent 能真正做到這一點(diǎn)。”

王顯更是認(rèn)為這場(chǎng)泡沫的興起是創(chuàng)業(yè)公司和資本共謀的產(chǎn)物，“ Manus 根本不是在做產(chǎn)品，而是在走資本路線(xiàn)，通過(guò)不斷推高市場(chǎng)知名度以獲得更高融資。至于創(chuàng)始人是拿到融資后真正深入場(chǎng)景做產(chǎn)品還是卷錢(qián)跑路，只有創(chuàng)始人自己才知道。產(chǎn)品非常失敗，但營(yíng)銷(xiāo)可以說(shuō)非常成功。”

付瑞吉補(bǔ)充道，“ 營(yíng)銷(xiāo)只能負(fù)責(zé)將大眾的注意力吸引過(guò)來(lái)，但 Agent 不同于內(nèi)容類(lèi)的產(chǎn)品（如短視頻）只要用戶(hù)的注意力就夠了，它還是要解決用戶(hù)的實(shí)際問(wèn)題的，如果用戶(hù)發(fā)現(xiàn)產(chǎn)品 ‘ 華而不實(shí) ’，則很難留存?！?/p>

沐瞳科技大數(shù)據(jù)負(fù)責(zé)人薛趙明則認(rèn)為這種產(chǎn)品模式有一定合理性，但還是要區(qū)分 ToC 和 ToB 的邏輯，“ ToC 和 ToB 是兩種邏輯，ToC 需要具備多樣性，這個(gè)多樣性也代表了用戶(hù)選擇的多樣性，產(chǎn)品力不足的會(huì)很快在市場(chǎng)的浪潮中褪去，因?yàn)檫@是一個(gè)非常燒錢(qián)的賽道，沒(méi)有用戶(hù)的沉淀和付費(fèi)是很難長(zhǎng)期堅(jiān)持的。ToB 又是另一個(gè)商業(yè)邏輯，必須強(qiáng)調(diào)可落地和可交付，否則便是無(wú)用的。”

王顯以 Wide Research 為例解釋了為何通用 Agent 產(chǎn)品現(xiàn)階段對(duì)于企業(yè)用戶(hù)無(wú)用，“ 對(duì)于企業(yè)而言，Wide Research 并沒(méi)有說(shuō)明 Agent 是如何分工、如何合作、如何整合各自結(jié)果的，它們之間的協(xié)調(diào)協(xié)議和調(diào)度機(jī)制也不明確。那我最后怎么去做審計(jì)呢？作為企業(yè)，我必須審計(jì)這個(gè)過(guò)程是否合規(guī)，以及在執(zhí)行過(guò)程中到底發(fā)生了什么。所以我沒(méi)辦法信任它給出的最終結(jié)果。”

“ 尤其是在金融行業(yè)，我們可能花了很長(zhǎng)時(shí)間跑出一個(gè)結(jié)果，如果它直接告訴我買(mǎi)哪只股票、投哪家公司，我不可能只憑這個(gè)結(jié)果就去執(zhí)行。”

Manus 雖然接受了中外多個(gè)基金的投資，但運(yùn)營(yíng)主要面向海外市場(chǎng)，而且總部已經(jīng)搬遷到新加坡，其代表的只是 Agent 泡沫的一小部分組成。

但聚焦到國(guó)內(nèi)，情況也并不樂(lè)觀，甚至可以說(shuō)有太多相似之處。

薛趙明表示，“ 實(shí)際上，當(dāng)前無(wú)論是創(chuàng)業(yè)公司，還是一線(xiàn)的云廠(chǎng)商的產(chǎn)品，大部分的產(chǎn)品都還是在一個(gè)特定場(chǎng)景下去演示，真正的規(guī)?；涞剡€是偏少?！?/p>

張森森表示，“ 國(guó)內(nèi)很多 Agent 產(chǎn)品功能繁多，但基本都是快速堆疊，痛點(diǎn)不聚焦?！?/strong>

“ 比如有大量集成了寫(xiě)文案、做 PPT、查資料、生成圖片等功能的產(chǎn)品，不乏大廠(chǎng)參與其中。它們都有通用 Agent 的特點(diǎn)，功能多但不精。寫(xiě)代碼準(zhǔn)確率不高，數(shù)據(jù)分析缺少可解釋性，設(shè)計(jì)產(chǎn)出質(zhì)量參差不齊。初次使用可能覺(jué)得新鮮，但要長(zhǎng)期依賴(lài)則難以實(shí)現(xiàn)。很少有明確與工作流、KPI 綁定的可交付結(jié)果。”

“ 具體到一些金融類(lèi)工具型 APP（公司主體一般沒(méi)有正式的金融業(yè)務(wù)牌照），比如炒股平臺(tái)，會(huì)提供所謂的智能投顧功能。當(dāng)我打開(kāi)某只股票時(shí)，它可能提示該股票出現(xiàn)‘紅三兵’，未來(lái)可能上漲，但這樣的判斷缺乏準(zhǔn)確性。”
“ 因?yàn)樗皇钦涍^(guò)去的一些市場(chǎng)信息，而二級(jí)市場(chǎng)的信息來(lái)源非常多，決策點(diǎn)也很多，這類(lèi)產(chǎn)品完全無(wú)法體現(xiàn)這些復(fù)雜因素?？雌饋?lái)像是做了一個(gè)智能投顧，但實(shí)際上既沒(méi)有真正實(shí)現(xiàn)投資組合優(yōu)化、風(fēng)險(xiǎn)控制，也無(wú)法對(duì)接交易系統(tǒng)，無(wú)法支撐其宣傳的定位?！?/p>

“目前市面上沒(méi)有一家能真正把智能投顧功能做好。實(shí)際上，大部分經(jīng)紀(jì)公司都有相關(guān)部門(mén)去做這件事。問(wèn)題在于，一方面他們覺(jué)得必須做，另一方面看到大模型似乎能解決問(wèn)題，就開(kāi)始投入開(kāi)發(fā)，完成后立刻做宣傳，聲稱(chēng)接入了大模型并具備某種能力?！?/p>

“但這里的問(wèn)題在于，他們的宣傳能力與實(shí)際能力并不匹配，并非能力完全無(wú)用，而是存在明顯落差。”

王文廣表示，“ 成功演示的往往是任務(wù)中那 20% 的標(biāo)準(zhǔn)化部分，而真正構(gòu)成工作核心的，是那 80% 的、充滿(mǎn)‘長(zhǎng)尾異?！膹?fù)雜現(xiàn)實(shí)。”

就連大家目前普遍主動(dòng)或被動(dòng)接觸過(guò)的AI搜索，其實(shí)也還很初級(jí)，Jina AI 前 CTO 王楠向知危表示，“ Agent 目前能夠多輪使用簡(jiǎn)單工具或者單輪使用復(fù)雜工具，但是多輪使用復(fù)雜工具（例如搜索工具）的能力還沒(méi)有達(dá)到生產(chǎn)可用。從BrowseComp Benchmark 上看，搜索大模型在使用搜索工具方面還有很大的提升空間。這種差距的原因在于大模型在使用通用工具上的能力還沒(méi)有迎來(lái)ChatGPT時(shí)刻。”

白鯨開(kāi)源 CEO 郭煒向知?？偨Y(jié)道，“ 目前整體來(lái)看，各種 Agent 產(chǎn)品給人的驚喜度確實(shí)不夠。因?yàn)楝F(xiàn)在 Agent 技術(shù)本身還沒(méi)有進(jìn)入成熟或真正可用階段，技術(shù)生態(tài)不完善。甚至關(guān)于Agent 的理念，大家都還沒(méi)有想清楚。”

“ 國(guó)內(nèi)大多數(shù)所謂的 Agent 其實(shí)并不是真正的 Agent，只是為了吸引眼球而這么命名。在我理解中，能夠替代 ToB SaaS 和 ToC APP 的那種 Agent 產(chǎn)品還沒(méi)有出現(xiàn)。國(guó)內(nèi)品牌都是如此?！?/p>

“ 換句話(huà)說(shuō)，現(xiàn)在的 Agent 大多是套了自然語(yǔ)言交互外殼的 RPA（軟件機(jī)器人流程自動(dòng)化），普遍缺乏深度。那為什么不直接用 RPA 呢？RPA 還沒(méi)有幻覺(jué)?！?/strong>

這種 “ 名不副實(shí) ”的現(xiàn)象，王文廣指出，是所謂的“智能體洗白”（ Agent Washing ），在行業(yè)中已非常普遍。

“ 這是 ‘ 能力泡沫 ’ 的直接產(chǎn)物。公司利用市場(chǎng)對(duì) ‘ Agent ’ 一詞的追捧來(lái)吸引投資和用戶(hù)。最直接的例子是，有權(quán)威報(bào)道指出，全球幾乎所有在 2022 年底 ChatGPT 之前就在所謂的 RPA 等賽道上有所成就的企業(yè)，都在掛智能體的羊頭賣(mài) RPA 的狗肉?！?/strong>

Gartner 今年 6 月的市場(chǎng)分析報(bào)道表明，其在測(cè)試的 ‘ 數(shù)千款 ’ 所謂的 Agent 產(chǎn)品中，只有約 130 款真正符合標(biāo)準(zhǔn)。

“ 所以，可以做個(gè)簡(jiǎn)單的排除法，尋找智能體或大模型落地的供應(yīng)商，首先排除掉以往做過(guò) RPA 的企業(yè)，這可以避免一半的坑。投資也是一樣。”

王文廣還總結(jié)了 C 端和 B 端 Agent 泡沫的一般特征，“ToC 泡沫主要由對(duì) ‘ 通用個(gè)人助理 ’ 的夢(mèng)想驅(qū)動(dòng)，ToB 泡沫更多是由企業(yè)的提高生產(chǎn)力、降低成本的焦慮所驅(qū)動(dòng)?！?/strong>

“ ToC 的這種愿景極具吸引力，容易引發(fā)病毒式傳播和媒體的廣泛關(guān)注，從而在短期內(nèi)催生出極高的估值和用戶(hù)增長(zhǎng)預(yù)期，但當(dāng)產(chǎn)品體驗(yàn)達(dá)不到預(yù)期，用戶(hù)會(huì)毫不猶豫地離開(kāi)。”

“ ToB 領(lǐng)域則由于企業(yè)軟件的銷(xiāo)售周期長(zhǎng)、決策鏈條復(fù)雜，并且一旦部署，即使效果不佳，替換成本也相對(duì)較高，從而顯得其泡沫更具欺騙性，也更慢地顯現(xiàn)。”

如果將國(guó)內(nèi)外的 Agent 泡沫現(xiàn)象綜合起來(lái)，則又是另一番景象。

張森森解釋道，“ 國(guó)內(nèi)外的 Agent 泡沫表現(xiàn)并不相同。比如美國(guó)，其優(yōu)勢(shì)是在 B 端，但泡沫不在 B 端，而是在 C 端，一些通用型消費(fèi)級(jí)助手類(lèi) Agent 的投資方可能來(lái)自硅谷大基金。這些機(jī)構(gòu)在早期投資時(shí)，美國(guó)對(duì)數(shù)據(jù)安全還沒(méi)有嚴(yán)格限制。但隨著數(shù)據(jù)隱私法比如 GDPR、CCPA 等監(jiān)管措施落地，尤其是在跨境場(chǎng)景下，AI的安全審核要求變高，很多競(jìng)爭(zhēng)者被迫增加合規(guī)與差異化投入，結(jié)果加快了行業(yè)洗牌速度，把不少做通用型 APP 的企業(yè)淘汰出局。”

“ 國(guó)內(nèi)的泡沫很特殊，雖然用戶(hù)集中在 C 端，但泡沫幾乎只存在于 B 端。原因是 B 端企業(yè)受補(bǔ)貼、國(guó)產(chǎn)化等政策影響，同時(shí)市場(chǎng)內(nèi)卷嚴(yán)重，用戶(hù)更注重實(shí)用性而非炒作。B 端用戶(hù)相對(duì)冷靜，因此很多 ToB 初創(chuàng)公司迅速倒閉，一些去年還在討論的公司今年已經(jīng)消失，泡沫破滅速度會(huì)很快。”

當(dāng)前的 Agent 產(chǎn)品普遍缺陷明顯，可以從產(chǎn)品、工程、場(chǎng)景等多方面理解。

產(chǎn)品層面主要是可靠性不足。對(duì)于為何大部分 ToC Agent 產(chǎn)品中，90% 的用戶(hù)用一次就離開(kāi)，郭煒表示，“ 這很正常，因?yàn)樗€不如直接用 APP。真正的 Agent 應(yīng)該比 APP 更方便、更簡(jiǎn)單。”

“ 而如果是 To B 產(chǎn)品，必須比現(xiàn)有軟件更簡(jiǎn)單、準(zhǔn)確、方便。本來(lái)用戶(hù)點(diǎn)三下鼠標(biāo)就能完成的事，現(xiàn)在用 Agent 卻要用自然語(yǔ)言先說(shuō)一句話(huà)，然后再跟它說(shuō)十句話(huà)，才能替代原本三次點(diǎn)擊的工作。這樣的體驗(yàn)讓人寧愿直接點(diǎn)鼠標(biāo)?！?/strong>

王文廣表示，“ 換句話(huà)說(shuō)，最根本的原因是，對(duì)于大多數(shù)真實(shí)世界任務(wù)，用戶(hù)為驗(yàn)證和修正 AI Agent 輸出所付出的心智成本和時(shí)間成本，超過(guò)了 Agent 本身所節(jié)省的成本。”

“ ‘ 通用個(gè)人助理 ’ 承諾的是一個(gè)科幻級(jí)別的未來(lái)。其所要處理的任務(wù)，如預(yù)訂家庭旅行、管理個(gè)人財(cái)務(wù)、安排重要會(huì)議，都具有一個(gè)共同點(diǎn)：高信任要求。例如，用戶(hù)需要確信 Agent 不會(huì)訂錯(cuò)機(jī)票、不會(huì)泄露財(cái)務(wù)信息、不會(huì)搞砸會(huì)議時(shí)間?！?/p>

“ 然而，當(dāng)前大模型的 ‘ 幻覺(jué) ’、知識(shí)陳舊等問(wèn)題和 Agent 執(zhí)行的脆弱性，使得其可靠性極低。”

“ 這種 ‘ 高信任要求 ’ 與 ‘ 低可靠性 ’ 之間的巨大鴻溝，或未能穩(wěn)定地跨越從 ‘ 新奇玩具 ’ 跨越到 ‘ 可靠工具 ’，是 C 端通用 Agent 無(wú)法獲得用戶(hù)長(zhǎng)期留存的根本原因。用戶(hù)可以容忍一個(gè)聊天機(jī)器人講錯(cuò)一個(gè)歷史知識(shí)，但絕不能容忍一個(gè) Agent 訂錯(cuò)一張機(jī)票?！?/strong>

而且目前 Agent 產(chǎn)品有從訂閱制走向按結(jié)果付費(fèi)的趨勢(shì)，這其實(shí)也給通用 Agent 創(chuàng)業(yè)公司帶來(lái)了壓力。 “ 這種商業(yè)模式的演進(jìn)，本質(zhì)上是一次風(fēng)險(xiǎn)轉(zhuǎn)移，將產(chǎn)品無(wú)效的風(fēng)險(xiǎn)從客戶(hù)身上轉(zhuǎn)移到了服務(wù)提供商身上，而 ToC 的通用 Agent 的不可靠性使其極難承受這種風(fēng)險(xiǎn)。反倒是 ToB 領(lǐng)域，可以選擇合適的場(chǎng)景，通過(guò)效果所創(chuàng)造的價(jià)值進(jìn)行分成，是有利的。”

張森森從工程角度總結(jié)了許多 Agent 產(chǎn)品無(wú)法落地的原因：“ 第一，真實(shí)環(huán)境非常復(fù)雜，不可能像實(shí)驗(yàn)環(huán)境那樣數(shù)據(jù)干凈。現(xiàn)實(shí)中數(shù)據(jù)質(zhì)量往往較差，接口口徑不一致。”

“ 第二，很多接口需要跨系統(tǒng)權(quán)限訪(fǎng)問(wèn)，要做 SSO（單點(diǎn)登錄），還涉及數(shù)據(jù)脫敏，這些環(huán)節(jié)很容易卡住，導(dǎo)致平臺(tái)間的對(duì)接受阻。工具本身存在脆弱性，比如瀏覽器系統(tǒng)自動(dòng)化可能對(duì) DOM 版本極其敏感，API 的速率限制等問(wèn)題也可能導(dǎo)致頻繁重試?！?/p>

“ 第三，存在狀態(tài)和記憶缺失的問(wèn)題。就像長(zhǎng)鏈路任務(wù)中缺乏持久狀態(tài)，上下文無(wú)法保存，狀態(tài)機(jī)失效，無(wú)法接著上次任務(wù)繼續(xù)，只能從頭開(kāi)始?！?/p>

“ 第四，缺少驗(yàn)證和回滾機(jī)制，沒(méi)有二次校驗(yàn)或回滾策略?！?/p>

“ 第五，SLA（服務(wù)商與客戶(hù)之間對(duì)質(zhì)量標(biāo)準(zhǔn)、性能指標(biāo)等的約定）和成本存在約束。企業(yè)使用時(shí)必須考慮成本，服務(wù)需要有保障，確保 TCO（總擁有成本）大于業(yè)務(wù)收益?！?/p>

“ 第六，缺乏合規(guī)與審計(jì)能力。生產(chǎn)過(guò)程要可追溯、可解釋?zhuān)⒕邆錂?quán)限與操作流程控制。但在各個(gè)平臺(tái)的演示中幾乎看不到這一點(diǎn)，而這恰恰是企業(yè)最重要的需求。”

在場(chǎng)景層面，郭煒認(rèn)為，這個(gè)原因可以非常簡(jiǎn)單，“ 沒(méi)有真正深入到用戶(hù)場(chǎng)景中去做。”

“ 大部分 Agent 仍是由處在特別早期階段的創(chuàng)業(yè)者在推動(dòng)。但真正有價(jià)值的 Agent，需要在某個(gè)業(yè)務(wù)領(lǐng)域有深厚積累的人或公司來(lái)做?！?/strong>

張森森持相似觀點(diǎn)，“ 實(shí)際上，國(guó)內(nèi)外當(dāng)前都太把技術(shù)當(dāng)回事了，太關(guān)注技術(shù)使得大家在做大模型和Agent都是圍繞技術(shù)來(lái)構(gòu)建的。通俗來(lái)說(shuō)就是，技術(shù)有什么東西，我做什么東西。”

王文廣補(bǔ)充道，“ 當(dāng)前，AI 公司往往不了解業(yè)務(wù)，業(yè)務(wù)公司則沒(méi)有準(zhǔn)確理解AI智能體技術(shù)。對(duì) AI 方或業(yè)務(wù)方來(lái)說(shuō)，都應(yīng)該了解技術(shù)邊界，知道智能體能做什么不能做什么，同時(shí)結(jié)合業(yè)務(wù)，才會(huì)做好這事。”

但 Agent 不只是獨(dú)立地去攻克一個(gè)個(gè)場(chǎng)景就可以了，其帶來(lái)的變革是生態(tài)級(jí)別的。

郭煒表示，“ Agent 本身是一個(gè)大的生態(tài)，就像軟件或 SaaS 生態(tài)一樣。未來(lái)它會(huì)形成一個(gè)完整的生態(tài)體系，只有這個(gè)生態(tài)真正建立起來(lái)，才能形成所謂的 Agentic Stack，在 Agent 時(shí)代承接并轉(zhuǎn)化原有生態(tài)?！?/strong>

“ 這個(gè)生態(tài)規(guī)模很大。以 ToC 的手機(jī)端為例，目前手機(jī)端還沒(méi)有出現(xiàn)通用型APP，需要在垂直領(lǐng)域中出現(xiàn)對(duì)應(yīng)的 Agent，例如類(lèi)似國(guó)內(nèi)的攜程、小紅書(shū)等級(jí)別并且更方便的Agent，才能支撐起生態(tài)的第一層?！?/strong>
“ 生態(tài)的第二層才是通用型 Agent，通用 Agent 的核心在于入口，例如 Apple Intelligence 就是一個(gè)入口?！?/strong>

“ 而入口之爭(zhēng)本質(zhì)是流量之爭(zhēng)，而不是技術(shù)或產(chǎn)品本身。誰(shuí)能夠搶占新一代 Agent 的流量，誰(shuí)就能在通用 Agent 領(lǐng)域占據(jù)優(yōu)勢(shì)。”

從這個(gè)角度看，似乎 Manus 的流量打法也有一定的合理性？但王顯并不這么認(rèn)為，他指出應(yīng)用層的創(chuàng)業(yè)公司沒(méi)有機(jī)會(huì)去搶占這個(gè)流量入口。

也就是說(shuō)，創(chuàng)業(yè)公司無(wú)法繞過(guò)生態(tài)的第一層，直接跳到第二層，成為流量入口?！?創(chuàng)業(yè)公司現(xiàn)有的 Agent 產(chǎn)品要結(jié)合到生態(tài)鏈中去，比如蘋(píng)果或者微信的生態(tài)，再把AI能力融合進(jìn)去，相當(dāng)于通過(guò) AI 對(duì)已有生態(tài)鏈做增強(qiáng)。要實(shí)現(xiàn)這一點(diǎn)，要么擁有場(chǎng)景，要么擁有數(shù)據(jù)。”

如果想直接跳躍到第二層生態(tài)，就會(huì)面臨 Manus 當(dāng)前的困境，“ 從用戶(hù)視角來(lái)看，Manus 這類(lèi)產(chǎn)品已經(jīng)出現(xiàn)用戶(hù)數(shù)量下滑、使用意愿不足的情況。無(wú)論是創(chuàng)業(yè)公司還是老牌公司，首先要解決的就是生存問(wèn)題。產(chǎn)品必須有正向 ROI，要能價(jià)值兌現(xiàn)，且使用成本不能太高。但 Manus 的產(chǎn)品正好存在價(jià)值兌現(xiàn)不足的問(wèn)題，而且時(shí)間、學(xué)習(xí)和金錢(qián)成本都過(guò)高?！?/p>

王顯還認(rèn)為，流量入口也不是 OpenAI 這類(lèi)公司的發(fā)展方向。“ OpenAI 是創(chuàng)業(yè)公司，但也是大模型廠(chǎng)商，肯定不會(huì)去做流量入口。相比 Anthropic、Google，OpenAI 更面向大眾，比如 ChatGPT、Sora 這樣的產(chǎn)品，特征是注重體驗(yàn)、規(guī)?；蜕鷳B(tài)擴(kuò)展。他們的目標(biāo)是底層基礎(chǔ)設(shè)施供應(yīng)，同時(shí)在 C 端和長(zhǎng)尾 B 端場(chǎng)景做推廣?！?/p>

郭煒表示，“ 像蘋(píng)果這樣的公司，天然具備優(yōu)勢(shì)去打造移動(dòng)端的完全通用型 Agent。理想狀態(tài)下，用戶(hù)只需說(shuō)一句 ‘ 幫我訂一張去上海的機(jī)票 ’，通用助手Agent 就能自動(dòng)調(diào)用多個(gè) APP 或 Agent 服務(wù)協(xié)同完成整個(gè)流程?！?/p>

“ 在 ToB 領(lǐng)域也是類(lèi)似的邏輯，每個(gè)垂直方向的 SaaS 都會(huì)出現(xiàn)對(duì)應(yīng)的 Agent，需要是真正意義上屬于 Agent 時(shí)代的軟件，之后才會(huì)出現(xiàn)入口級(jí)通用 Agent。否則，入口級(jí)通用 Agent 即使想做，也無(wú)法與底層垂直領(lǐng)域的 Agent 有效銜接。即便使用 MCP 的 Server 來(lái)連接，中間也會(huì)損失大量信息，導(dǎo)致結(jié)果不準(zhǔn)確，無(wú)法滿(mǎn)足客戶(hù)需求?！?/strong>

“ 現(xiàn)階段應(yīng)優(yōu)先在垂直領(lǐng)域啟動(dòng) Agent 落地，無(wú)論是 To B 還是 To C，都應(yīng)在原有賽道中先行深耕，逐步培育生態(tài)。”

以上，我們描述了 Agent 泡沫的總體情況，可以看到，造成這一現(xiàn)象的根本，還是在技術(shù)受限、行業(yè)規(guī)律甚至一些痼疾的背景下，創(chuàng)業(yè)公司和大廠(chǎng)對(duì) Agent 產(chǎn)品在生態(tài)中的定位有著錯(cuò)誤的認(rèn)識(shí)。

接下來(lái)，知危將對(duì)這些背景進(jìn)行更加細(xì)致的闡述。

其中，技術(shù)受限包括 MCP 協(xié)議限制、AI 幻覺(jué)限制、多智能體擴(kuò)展限制、上下文長(zhǎng)度限制、大模型智能限制等。

行業(yè)規(guī)律、痼疾則指向資本炒作、大模型行業(yè)競(jìng)爭(zhēng)的殘酷規(guī)律以及國(guó)內(nèi)特有的老問(wèn)題。

郭煒表示，“ 關(guān)于使用 MCP Server 會(huì)導(dǎo)致信息損失，這一點(diǎn)非常重要。最終，Agent 應(yīng)該采用 A2A（ Agent to Agent ）的協(xié)議，服務(wù)于垂直Agent之間的通信，才能完整完成任務(wù)?！?/strong>

“ 而 MCP 是通用 Agent 與外部數(shù)據(jù)源之間的通信協(xié)議。當(dāng)調(diào)用 MCP 時(shí)，不可避免地會(huì)將自然語(yǔ)言信息轉(zhuǎn)換成結(jié)構(gòu)化的 query 或結(jié)構(gòu)化的 ADB 請(qǐng)求來(lái)執(zhí)行操作，這一轉(zhuǎn)換的準(zhǔn)確率需要由調(diào)用方來(lái)保證。但通用 Agent 要在專(zhuān)業(yè)領(lǐng)域內(nèi)準(zhǔn)確地將專(zhuān)業(yè)詞匯翻譯成精確指令，再交由原有程序執(zhí)行，在現(xiàn)實(shí)中非常困難。”
“ 以我們正在做的 Data Agent 為例，這項(xiàng)工作需要較長(zhǎng)時(shí)間推進(jìn)，因?yàn)楸仨氉缘紫蛏贤瓿山ㄔO(shè)。過(guò)去的數(shù)據(jù)底層通常是裸數(shù)據(jù)，例如 CSV 文件，里面是各種原始數(shù)據(jù)。未來(lái)需要將這些數(shù)據(jù)轉(zhuǎn)化為帶有語(yǔ)義的 Contextual Data Unit（ CDU ），才能被上層 Agent 有效消費(fèi)。因此必須了解企業(yè)所有表的字段含義及數(shù)據(jù)意義，需要非常專(zhuān)業(yè)的數(shù)據(jù)獲取廠(chǎng)商來(lái)完成?！?/p>

“ 例如，‘ 消費(fèi)金額 ’ 必須明確對(duì)應(yīng)哪個(gè)系統(tǒng)、什么業(yè)務(wù)的消費(fèi)金額，Agent 才能理解。否則，如果上層 Agent 僅接到 ‘ 獲取消費(fèi)金額 ’ 的指令，它必須再去解析并定位到 Salesforce 系統(tǒng)中的特定交易表及其規(guī)則。比如讓 MCP Server 將請(qǐng)求翻譯成 SQL 再下發(fā)到 Salesforce 查詢(xún)數(shù)據(jù)，但它并不知道 ‘ 消費(fèi)金額 ’ 在當(dāng)前語(yǔ)境下的具體含義，是來(lái)自 Salesforce、SAP，還是其他系統(tǒng)。它甚至不了解 Salesforce、SAP 分別是什么。”

“ 這不僅是當(dāng)前 Agent 技術(shù)無(wú)法實(shí)現(xiàn)的，甚至人類(lèi)在缺乏上下文的情況下也很難完成。”

“ 因此，通用 ToB Agent 并不是 ‘ 在 MCP 上套一層通用 Agent ’ 就能實(shí)現(xiàn)的，而必須由基于 A2A 的多個(gè)專(zhuān)業(yè)領(lǐng)域的 Agent 相互協(xié)作（ Agent + Agent ）實(shí)現(xiàn)。”

“ 相比之下，提示詞專(zhuān)業(yè)性、token 成本爆炸等都是更加次要的，會(huì)隨著時(shí)間自然解決。”

Agent 還有一個(gè)永遠(yuǎn)無(wú)法解決的問(wèn)題，那就是底層大模型的幻覺(jué)。已有研究證明，大模型無(wú)法從理論上完全消除幻覺(jué)。
“ 在現(xiàn)有大模型技術(shù)下，有許多場(chǎng)景嘗試進(jìn)行完全 Agent 化，但效果并不理想。”

“ 以自動(dòng)編碼為例，各種號(hào)稱(chēng)能夠代替人類(lèi)編碼的工具，無(wú)論是帶 Agent 的 Claude Code、Cursor，還是Augment Code等，都無(wú)法真正替代程序員的工作。無(wú)論是初級(jí)、中級(jí)還是高級(jí)崗位，都仍需配備人類(lèi)程序員進(jìn)行檢驗(yàn)和監(jiān)督。否則一旦幻覺(jué)出現(xiàn)且缺乏有效控制，風(fēng)險(xiǎn)極高。例如，近期某公司在使用自動(dòng)化工具 Replit 時(shí)出現(xiàn)誤操作，導(dǎo)致數(shù)據(jù)庫(kù)被刪除?！?/p>

“ 目前也沒(méi)有特別好的方式來(lái)自動(dòng)定位和追溯幻覺(jué)。在校驗(yàn)中，雖然無(wú)法校驗(yàn)所有環(huán)節(jié)，但可以抽檢一兩個(gè)關(guān)鍵點(diǎn)，并用傳統(tǒng)方法或知識(shí)庫(kù)進(jìn)行糾錯(cuò)和約束?！?/p>

“ 幻覺(jué)在前期溝通階段有一定優(yōu)勢(shì)，因?yàn)樗赡軒?lái)一些創(chuàng)新性想法。但在企業(yè)落地執(zhí)行階段，應(yīng)盡量控制甚至避免使用大模型。在 Agent 執(zhí)行任務(wù)時(shí)，為緩解幻覺(jué)，只有借助 workflow 才能保證足夠的確定性?！?/strong>

“ 總之，大模型和 Agent 在目前更多是作為效率工具，顯著提升了開(kāi)發(fā)能力。例如，我自己現(xiàn)在幾乎沒(méi)有時(shí)間寫(xiě)代碼，對(duì)一些新發(fā)布的 Python 函數(shù)也不了解，但大模型能夠知曉并直接為我生成代碼，還能解釋邏輯。這樣我只需驗(yàn)證邏輯是否正確并運(yùn)行，就能快速完成任務(wù)。這種方式不僅比我親自編寫(xiě)代碼更快，有時(shí)生成的算法思路甚至比我原本設(shè)想的更好?！?/p>

王文廣指出，思維鏈的幻覺(jué)其實(shí)在 Agent 產(chǎn)品中也非常常見(jiàn)，“ 這通常被稱(chēng)為過(guò)程幻覺(jué)，即 AI 編造了一個(gè)它并未執(zhí)行或執(zhí)行失敗的操作過(guò)程。”

“ 它輸出的不是真實(shí)的操作日志，而是它生成的一個(gè) ‘ 看起來(lái)像是成功了的 ’ 操作日志。例如，它聲稱(chēng) ‘ 我已經(jīng)成功運(yùn)行了測(cè)試，所有測(cè)試都通過(guò)了 ’，但實(shí)際上它可能根本沒(méi)有能力或權(quán)限去運(yùn)行測(cè)試，或者實(shí)際測(cè)試運(yùn)行失敗了?！?/p>

“ 從這點(diǎn)也可以看出，在許多情況下，單純依靠大模型，存在非常多無(wú)法解決的問(wèn)題。如果把所有問(wèn)題當(dāng)做一個(gè)平面，大模型能夠解決的問(wèn)題是平面上的布，無(wú)法解決的問(wèn)題是孔，那么可以看到，這個(gè)平面是千瘡百孔的?！?/strong>

在 Agent 框架設(shè)計(jì)方面，目前領(lǐng)域內(nèi)有一個(gè)被過(guò)分炒作的概念，那就是多智能體。

當(dāng)前實(shí)際應(yīng)用中，智能體之間的交互主要限于兩個(gè)智能體。編程體驗(yàn)后來(lái)居上的 Claude Code 也沒(méi)有使用多智能體協(xié)作機(jī)制。

張森森表示，“ 單智能體或雙智能體已經(jīng)能覆蓋 80% 的企業(yè)業(yè)務(wù)場(chǎng)景，此外，限于雙智能體也是出于成本考量。”

“ 具體來(lái)說(shuō)，多智能體會(huì)顯著增加復(fù)雜度，容錯(cuò)設(shè)計(jì)難度提升，開(kāi)發(fā)、維護(hù)、算力成本更高，收益和成本不匹配。引入更多智能體未必能提升效果，同時(shí)也難以抵消延遲，并會(huì)使得系統(tǒng)更加不穩(wěn)定。用戶(hù)體驗(yàn)最終取決于響應(yīng)速度，穩(wěn)定性方面，智能體越多越容易跑偏，可能出現(xiàn)循環(huán)對(duì)話(huà)、信息丟失等問(wèn)題，還需要額外監(jiān)督和約束，復(fù)雜度會(huì)越來(lái)越高?！?/p>

“ 多智能體的案例也有，比如一些游戲公司在做 AI 團(tuán)隊(duì)游戲，在沙盒環(huán)境里嘗試多智能體交互。但對(duì)大部分企業(yè)而言，并不需要這種復(fù)雜度?！?/p>

王文廣補(bǔ)充道，“雖然在一些對(duì)協(xié)調(diào)和優(yōu)化要求極高的特定領(lǐng)域，已經(jīng)出現(xiàn)了更復(fù)雜的、已實(shí)際落地的多智能體系統(tǒng)案例，但絕大多數(shù)情況下，應(yīng)該優(yōu)先解決簡(jiǎn)單的問(wèn)題。”

基礎(chǔ)模型能力方面，當(dāng)前非常核心的一個(gè)限制還是上下文長(zhǎng)度。雖然 OpenAI、Anthropic、谷歌等 AI 公司一直宣稱(chēng)模型上下文達(dá)到數(shù)十萬(wàn)、上百萬(wàn) token，但Reddit 社區(qū)反饋其中水分很大，有時(shí)幾萬(wàn) token 輸入下，模型準(zhǔn)確率就大幅下降。

張森森表示，“ 實(shí)際體驗(yàn)來(lái)看，大部分廠(chǎng)商宣稱(chēng)的上下文長(zhǎng)度確實(shí)水分很大，別說(shuō)兩三千行代碼，甚至一千多行時(shí)就開(kāi)始丟失信息了?！?/strong>

“上下文長(zhǎng)度代表了基礎(chǔ)模型能力的天花板，特別在 Coding Agent 場(chǎng)景中，基本就是硬天花板的程度?！?/strong>

“ 在企業(yè)內(nèi)部?jī)?yōu)化這個(gè)問(wèn)題不僅很難，而且也不是靠企業(yè)自己能完全解決的。可選的方案有：代碼檢索以及更加智能的代碼檢索；動(dòng)態(tài)上下文管理，只加載與本次修改相關(guān)的依賴(lài)文件。但這些都治標(biāo)不治本。”

“ 對(duì)資深程序員來(lái)說(shuō)影響不大，他們能很快發(fā)現(xiàn)邏輯缺口?！?/p>

“ 但對(duì)初學(xué)者來(lái)說(shuō)，一旦項(xiàng)目規(guī)模大，IDE 頻繁加載就會(huì)崩潰。項(xiàng)目規(guī)模一大，就會(huì)涉及很多模塊和依賴(lài)，甚至是跨模態(tài)的復(fù)雜系統(tǒng)。模型不得不頻繁丟失上下文、重新加載信息，導(dǎo)致迭代過(guò)程完全斷裂，忘記之前的決策，甚至可能出現(xiàn)重復(fù)造輪子的情況?！?/p>

郭煒補(bǔ)充道，“ 當(dāng)前的限制不僅來(lái)自模型本身，還與底層芯片架構(gòu)有關(guān)，包括顯存、外部存儲(chǔ)等都需要進(jìn)一步提升?！?/strong>

王顯認(rèn)為，在硬件基礎(chǔ)設(shè)施的限制下，上下文長(zhǎng)度瓶頸對(duì)于國(guó)內(nèi)而言將是更嚴(yán)峻的問(wèn)題。

“ 國(guó)外芯片比如英偉達(dá) H100、A100 這樣的高端 GPU，能夠更高效地進(jìn)行分片計(jì)算，處理幾十萬(wàn)、上百萬(wàn) token 上下文。同時(shí)它們也有軟件層面的優(yōu)化，比如 FlashAttention 工具、針對(duì)張量計(jì)算的優(yōu)化配置等，這些都是通過(guò)軟硬件結(jié)合來(lái)提升性能的?！?/p>

“ 相比之下，國(guó)內(nèi)主要通過(guò)算法優(yōu)化和軟件工程做一些 ‘ 曲線(xiàn)救國(guó) ’ 的工作。類(lèi)似的，DeepSeek、Kimi 等團(tuán)隊(duì)也在發(fā)布各種上下文剪裁、分層記憶、稀疏 Attention 等方法，其實(shí)都是一些面向低成本的方案?！?/p>

“ 一些國(guó)內(nèi)廠(chǎng)商號(hào)稱(chēng)自己的高端 GPU 在浮點(diǎn)性能、顯存、寬帶等各方面和 H100 很相近，但其實(shí)還是有很大差距的。國(guó)外的頂配集群，比如 H100 加 NVLink Switch，能輕松地應(yīng)對(duì)百萬(wàn)級(jí) token 推理。”

王文廣表示，“ 實(shí)際上就是 AI 芯片的存儲(chǔ)容量和帶寬限制了推理的極限，不管是國(guó)內(nèi)外都是這樣的?！?/strong>

“ HBM 是通用 GPGPU 最好的選擇，但專(zhuān)用的推理芯片有很多不同的路線(xiàn)，比如使用 3D 堆疊的專(zhuān)門(mén)的 AI 芯片。

“ 國(guó)內(nèi)有一些如 CiMicro.AI 這樣非常前沿的AI芯片公司，和寒武紀(jì)、華為、海光等走了不同的路線(xiàn)，將 3D DRAM 用于 AI 推理芯片上，如果成功流片，帶寬能夠得到極大的提升，比英偉達(dá)用的 HBM 還高一個(gè)量級(jí)，從而大模型的推理速度將得到極大的提升，長(zhǎng)上下文和深度思考則會(huì)對(duì) Agent 有極大的促進(jìn)。”

除了上下文長(zhǎng)度之外，更大的限制，自然來(lái)自基礎(chǔ)模型的智能極限了，特別是近期被詬病平庸的 GPT-5 發(fā)布后。

客觀來(lái)看，GPT-5 的更新點(diǎn)是在產(chǎn)品層面，把幻覺(jué)降得特別低，這在消費(fèi)級(jí)用戶(hù)看來(lái)不太友好，但對(duì)編程來(lái)說(shuō)非常有用，可靠性很高。對(duì)于專(zhuān)業(yè)用戶(hù)而言，有時(shí)甚至比 Claude 4 還好用一些，因?yàn)?GPT-5 在 Agentic Coding 中傾向 “ 精準(zhǔn)定位問(wèn)題 ” 和 “ 最小侵入修改 ”，而 Claude 4 自主性更強(qiáng)，寫(xiě)的代碼更復(fù)雜，需要特別提醒才會(huì)選用最簡(jiǎn)方案。

那么，從這個(gè)角度看，一直以消費(fèi)級(jí)用戶(hù)為主體的 OpenAI 未來(lái)是否想更多向 B 端推進(jìn)？

張森森表示，“ 如果是，那也是不得已而為之?，F(xiàn)在 GPT-5 是通過(guò)多模型路由來(lái)提高上限，基本意味著大模型的 Scaling Law 幾乎已經(jīng)失效，單模型上很難再高效提升。其實(shí) GPT-5 的發(fā)布本身就有點(diǎn) ‘ 難產(chǎn) ’ 的意味，更像是一種形式，而不是自然的過(guò)程。未來(lái)基礎(chǔ)模型能否進(jìn)一步進(jìn)化，還需要觀察。”
“ 這也是為什么大家都在強(qiáng)化 Agent 能力。相比基礎(chǔ)模型，Agent 的可解釋性相對(duì)更好一些，能更好結(jié)合具體業(yè)務(wù)場(chǎng)景去提升實(shí)際能力。但基礎(chǔ)模型往往也決定了 Agent 的上限?！?br/>“ 后面大模型的走向可能更多會(huì)朝垂直方向發(fā)展，參數(shù)量未必再無(wú)限增大，而是聚焦在更細(xì)分的場(chǎng)景。”

大模型廠(chǎng)商經(jīng)常在營(yíng)銷(xiāo)中刻意忽視模型當(dāng)前的智能上限，而過(guò)分強(qiáng)調(diào)可以放心地依賴(lài)大模型全權(quán)執(zhí)行工作，比如 Claude 甚至介紹了一種簡(jiǎn)單粗暴的使用經(jīng)驗(yàn)，他們內(nèi)部用 Claude Code 寫(xiě)代碼的時(shí)候，有一個(gè)原則就是 “ 不行就重來(lái) ”。

王文廣表示，“ ‘ 不行就重來(lái) ’ 的策略，跟金錢(qián)和時(shí)間等無(wú)關(guān)，跟解決問(wèn)題的復(fù)雜程度有關(guān)。簡(jiǎn)單來(lái)說(shuō)，在原型探索階段或者簡(jiǎn)單的應(yīng)用中，是一種有效的捷徑，但在嚴(yán)肅的、可維護(hù)的較為復(fù)雜的生產(chǎn)環(huán)境中，這是一種不可持續(xù)且極具破壞性的工作模式?！?/strong>

對(duì)于基礎(chǔ)模型本身，王文廣則認(rèn)為還會(huì)繼續(xù)進(jìn)步，“ 整個(gè) Agent 生態(tài)系統(tǒng)，也都在等待基礎(chǔ)模型的下一次重大突破。一旦新的、更強(qiáng)大的基礎(chǔ)模型出現(xiàn)，它將立刻抬高整個(gè) Agent 生態(tài)系統(tǒng)的能力天花板，催生出新的應(yīng)用?！?/p>

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網(wǎng)易首頁(yè) 下載網(wǎng)易新聞客戶(hù)端

相關(guān)推薦

熱點(diǎn)推薦

PixelRefer ：讓AI從“看大圖”走向“看懂每個(gè)對(duì)象”

機(jī)器之心Pro 2025-11-11 12:49:23
0 跟貼 0

凌晨三點(diǎn)，徹底失眠：Seedance 2.0告訴我們，AI對(duì)現(xiàn)實(shí)世界工作流“壓縮”正在加速

華爾街見(jiàn)聞官方 2026-02-09 07:57:50
27 跟貼 27

ICLR 2026｜UIUC：一行代碼徹底解決LLM推理的過(guò)度思考！

機(jī)器之心Pro 2026-02-09 12:26:23
0 跟貼 0

當(dāng)AI公司都在產(chǎn)品層內(nèi)卷，這家公司卻在思考Frontier Research

36氪 2026-02-09 17:53:45
0 跟貼 0

深扒Rentahuman，AI雇傭人類(lèi)是假，幣圈“割韭菜”才是真？

鈦媒體APP 2026-02-07 16:26:17
0 跟貼 0

蘋(píng)果開(kāi)放第三方大模型：開(kāi)發(fā)工具接入AI，小白10分鐘造APP不是夢(mèng)

雷科技 2026-02-07 16:46:36
2 跟貼 2

小米給KV Cache減負(fù)80%！MiMo團(tuán)隊(duì)推出混合稀疏注意力架構(gòu)

量子位 2026-02-07 18:48:49
1 跟貼 1

唯快不破：上海AI Lab 82頁(yè)綜述帶你感受LLM高效架構(gòu)的魅力

機(jī)器之心Pro 2025-08-25 18:03:35
0 跟貼 0

你刷到的視頻是真的么？用物理規(guī)律拆穿Sora謊言

機(jī)器之心Pro 2025-11-05 16:27:02
0 跟貼 0

Pony Alpha新模型炸場(chǎng)！全球「猜爹大賽」開(kāi)啟

新智元 2026-02-09 19:10:57
18 跟貼 18

Codeforces難題不夠刷？謝賽寧等造了AI出題機(jī)，能生成原創(chuàng)編程題

機(jī)器之心Pro 2025-10-20 14:17:05
0 跟貼 0

字節(jié)Seedance 2.0實(shí)測(cè)：語(yǔ)音錯(cuò)亂、字幕亂碼，AI視頻仍是概率游戲

雷科技 2026-02-09 21:23:22
0 跟貼 0

AI不再「炫技」，淘寶要讓技術(shù)解決用戶(hù)每一個(gè)具體問(wèn)題

機(jī)器之心Pro 2025-10-28 14:02:58
0 跟貼 0

對(duì)話(huà)鹿明機(jī)器人：在具身智能的“數(shù)據(jù)荒”里，做一個(gè)送水人｜AI Founder 請(qǐng)回答

鈦媒體APP 2026-01-11 12:48:38
0 跟貼 0

馬斯克：最便宜的AI算力在太空，每年至少發(fā)射1萬(wàn)次，人形機(jī)器人就是“印鈔機(jī)”

澎湃新聞 2026-02-09 16:10:19
130 跟貼 130

Seedance2.0 對(duì)AI應(yīng)用意味著什么？

華爾街見(jiàn)聞官方 2026-02-09 20:59:23
0 跟貼 0

馮驥直稱(chēng)“地表最強(qiáng)”、Tim 連呼6次“恐怖”，字節(jié)跳動(dòng)Seedance 2.0的AI狂歡與“信任”風(fēng)暴

每日經(jīng)濟(jì)新聞 2026-02-09 22:11:04
0 跟貼 0

CVPR 2026 Workshop征稿第六屆AdvML@CV：多模態(tài)大模型智能體安全

機(jī)器之心Pro 2026-02-09 14:21:00
0 跟貼 0

“太恐怖了！”字節(jié)最新AI視頻模型引爆全網(wǎng)，網(wǎng)友：這個(gè)模型讓我害怕

智東西 2026-02-09 21:26:16
0 跟貼 0

微信聊天遭老板監(jiān)視，主流殺毒軟件失明

每日經(jīng)濟(jì)新聞 2025-12-25 19:02:17
0 跟貼 0

華為推出軟工代碼智能體SWE-Lego，解鎖SFT訓(xùn)練極致性能

機(jī)器之心Pro 2026-01-13 14:54:45
0 跟貼 0

神秘模型「Pony Alpha」火了，被曝是GLM-5

量子位 2026-02-09 14:56:43
2 跟貼 2

CMU開(kāi)源首份Agentic Search日志數(shù)據(jù)，把Agent拆開(kāi)給你看

機(jī)器之心Pro 2026-02-09 12:05:13
0 跟貼 0

蘭州熱拌羊頭，你們覺(jué)得怎么樣呢？

摸魚(yú)的小潘攀 2026-02-05 10:53:21
1 跟貼 1

女演員表演很賣(mài)力，道具全都是泡沫，導(dǎo)演難道真不尷尬嗎？

快樂(lè)娛夫 2026-02-08 10:52:02
0 跟貼 0

“別怕，你沒(méi)責(zé)任”——32杯奶茶背后的“反算法”操作！

主持人老李 2026-02-09 11:50:38
1 跟貼 1

狗肉面里是真狗肉啊

快樂(lè)追劇吧 2026-02-09 17:40:11
1 跟貼 1

AI 時(shí)代的游戲小團(tuán)隊(duì)，真正卡住的不是“寫(xiě)不出來(lái)”

西北王長(zhǎng)生 2026-02-07 10:12:35
0 跟貼 0

讓LLM不再話(huà)癆，快手HiPO框架來(lái)了

機(jī)器之心Pro 2025-11-03 15:10:48
0 跟貼 0

這真是太不可思議了

小金趣談 2026-02-08 10:53:21
1 跟貼 1

一夜之間，周邊井蓋冒出“毒泡沫”，駐日美軍在地底做實(shí)驗(yàn)？

兵器雜志 2026-02-08 20:07:12
0 跟貼 0

兩千多的泡沫，你們覺(jué)得值嗎？網(wǎng)友：賣(mài)給上海人

書(shū)香愛(ài)生活 2026-02-08 13:30:32
0 跟貼 0

幫山里人銷(xiāo)產(chǎn)品的欣哥，好人一生平安！

玉波易友 2026-02-06 07:25:31
6 跟貼 6

酒倒的越快，泡沫產(chǎn)生的越多！

娛圈小宇宙 2026-02-08 16:27:57
3 跟貼 3

倒灶車(chē)企漸增多用戶(hù)認(rèn)知覺(jué)醒，踏實(shí)造車(chē)是正途才能價(jià)值回歸

拜托了老司機(jī) 2026-02-08 01:39:13
20 跟貼 20

過(guò)小年，老人說(shuō)“5樣不上桌，來(lái)年一場(chǎng)空”，5樣指的是啥？

布谷媽媽 2026-02-09 20:20:36
0 跟貼 0

編程AI變天了！實(shí)測(cè)神秘模型Pony Alpha：Opus級(jí)智能，架構(gòu)師思維上線(xiàn)

智東西 2026-02-09 17:05:11
1 跟貼 1

京西福地門(mén)頭溝·福味尋蹤 ——舌尖上的煙火福氣

門(mén)頭溝區(qū)論壇 2026-02-05 21:55:37
2 跟貼 2

再美的花朵盛開(kāi)過(guò)就凋落

可愛(ài)的巴比龍 2026-02-08 02:41:58
1 跟貼 1

日經(jīng)225指數(shù)漲幅擴(kuò)大至5%

證券時(shí)報(bào) 2026-02-09 12:16:02
3943 跟貼 3943

罕見(jiàn)！王楚欽奪冠后哭了王皓為他擦眼淚發(fā)聲：想把冠軍留在中國(guó)
念洲
2026-02-09 10:23:46

3-2！國(guó)安擊敗中超新土豪，球隊(duì)大腿連場(chǎng)進(jìn)球，主力邊衛(wèi)又受重傷
體壇鑒春秋
2026-02-09 22:10:48

北京首鋼還未和麥基簽約，普拉姆利拒絕加盟廣東隊(duì)
孤影來(lái)客
2026-02-09 20:15:18

002731，遭證監(jiān)會(huì)立案，明日將被實(shí)施風(fēng)險(xiǎn)警示
證券時(shí)報(bào)e公司
2026-02-09 21:15:23

徐湖平父親和岳父身份被扒！個(gè)個(gè)不簡(jiǎn)單，難怪舉報(bào)他4次都不成功
詩(shī)意世界
2025-12-31 16:43:19

“排雷英雄”杜富國(guó)，服役期滿(mǎn)后是轉(zhuǎn)業(yè)回地方，還是繼續(xù)服役好？
南書(shū)房
2026-02-02 11:15:08

國(guó)家下狠手了！體制內(nèi)大地震，少爺、公主們的“天”，要塌了
霹靂炮
2026-01-19 22:24:13

欠百萬(wàn)租金，影響村民分紅？佛山30年酒樓閉店
佛山樓市發(fā)布
2026-02-09 19:43:22

“深感擔(dān)憂(yōu)”！外媒：英國(guó)威廉王儲(chǔ)及凱特王妃就愛(ài)潑斯坦案首次公開(kāi)發(fā)聲
環(huán)球網(wǎng)資訊
2026-02-09 18:13:49

正式簽約！聯(lián)手字母哥！再見(jiàn)了，買(mǎi)斷市場(chǎng)最后一條大魚(yú)
籃球教學(xué)論壇
2026-02-09 09:14:53

步嫂子宋丹丹后塵，被英家人所拋棄的趙明明，為子退圈的她怎樣了
每一次點(diǎn)擊
2026-02-09 16:15:38

劉強(qiáng)東光送年貨沒(méi)發(fā)錢(qián)，60歲村民被問(wèn)是否失望，老人家回答太戳心
觀察鑒娛
2026-01-31 09:45:47

NBA官宣：蕭華指定申京頂替亞歷山大入選全明星進(jìn)入世界隊(duì)
醉臥浮生
2026-02-09 04:51:26

在深圳，經(jīng)濟(jì)一差，到處是詐騙
愛(ài)下廚的阿釃
2026-02-09 20:38:49

哈梅內(nèi)伊發(fā)表全國(guó)電視講話(huà)
參考消息
2026-02-09 22:24:10

中國(guó)創(chuàng)新藥龍頭大漲近7%，拿下國(guó)際巨頭88億美元合作，首付3.5億美元
21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-02-09 13:42:30

升第九！鄧恩被驅(qū)逐快船大勝森林狼小卡41+8連31場(chǎng)20+超格里芬
醉臥浮生
2026-02-09 06:44:47

宋美齡價(jià)值2億的麻花手鐲，戴到離世：第一任主人僅花費(fèi)4萬(wàn)大洋
史之銘
2026-01-13 22:55:09

福建要大發(fā)了，這3個(gè)地方被國(guó)家選中，即將騰飛！有你家鄉(xiāng)嗎
記錄生活日常阿蜴
2026-02-09 18:35:53

牛鬼神蛇現(xiàn)原形！聶衛(wèi)平去世僅一天，私生活被扒，王剛郎平被牽連
春露秋霜
2026-01-16 06:27:20

2026-02-09 23:08:49

知危

投資不立危墻之下

531文章數(shù) 1832關(guān)注度

往期回顧全部

科技要聞

實(shí)測(cè)|字節(jié)新模型帶著音效和復(fù)雜運(yùn)鏡殺瘋了

馬斯克終于想通了：先去月球“刷經(jīng)驗(yàn)”

熱血漸涼：被耗盡的小米SU7 Ultra

為實(shí)現(xiàn)雄心勃勃的計(jì)劃，特斯拉開(kāi)始招人

歐盟認(rèn)定存在"上癮"設(shè)計(jì) TikTok：結(jié)論錯(cuò)誤

頭條要聞

高市早苗表態(tài)：著手推動(dòng)修憲

男子欲結(jié)清分期還款卻還不了：想還錢(qián)怎么就這么難

媒體:高市賭贏翻身日本有人認(rèn)為中國(guó)對(duì)其態(tài)度或軟化

日本眾議院選舉落定律師團(tuán)體起訴選舉"涉嫌違憲"

中國(guó)男子在泰墜樓十余人自稱(chēng)其"朋友"拒警方進(jìn)房調(diào)查

頭條要聞

高市早苗表態(tài)：著手推動(dòng)修憲

男子欲結(jié)清分期還款卻還不了：想還錢(qián)怎么就這么難

媒體:高市賭贏翻身日本有人認(rèn)為中國(guó)對(duì)其態(tài)度或軟化

日本眾議院選舉落定律師團(tuán)體起訴選舉"涉嫌違憲"

中國(guó)男子在泰墜樓十余人自稱(chēng)其"朋友"拒警方進(jìn)房調(diào)查

體育要聞

創(chuàng)中國(guó)冬奧最佳戰(zhàn)績(jī)！19歲速滑新星含淚向天拉勾

冬奧會(huì)-谷愛(ài)凌收獲坡面障礙技巧銀牌格雷莫德衛(wèi)冕

2月9日冬奧會(huì)看點(diǎn)：谷愛(ài)凌沖擊中國(guó)隊(duì)首金，王詩(shī)玥/柳鑫宇登場(chǎng)

備戰(zhàn)冬奧三次受傷！谷愛(ài)凌淚崩：擔(dān)心再也滑不了，每次想到都會(huì)哭

美運(yùn)動(dòng)員稱(chēng)代表美國(guó)參加冬奧會(huì)“情緒復(fù)雜”惹特朗普不滿(mǎn)，網(wǎng)友：當(dāng)下美國(guó)確有令人羞愧之處

娛樂(lè)要聞

央視電影活動(dòng)名場(chǎng)面！明星站位太講究

李亞鵬最后一場(chǎng)還人情，為嫣然醫(yī)院暫停直播

2025年度人物競(jìng)爭(zhēng)激烈，辛芷蕾全紅嬋實(shí)力出圈

海清近況曝光：臉腫顴骨突出，曾愿為兒捐腎

微博之夜過(guò)后，終于意識(shí)到內(nèi)娛真的完了

財(cái)經(jīng)要聞

滬深北交易所優(yōu)化再融資釋放3個(gè)信號(hào)

虧損加劇 “浙江前首富”還有翻盤(pán)機(jī)會(huì)嗎？

seedance 2.0實(shí)測(cè) 影視圈ChatGPT 時(shí)刻來(lái)了

31省份披露去年財(cái)政收入：粵蘇浙規(guī)模居前三

箭牌家居：?jiǎn)T工權(quán)益保障不足，家族化治理缺陷暴露|ESG案例

汽車(chē)要聞

長(zhǎng)安將搭鈉電池好比汽車(chē)要裝柴油機(jī)？

一汽悅意08官圖正式發(fā)布提供純電/增程雙動(dòng)力

理想汽車(chē)OTA8.3版本更新 VLA司機(jī)大模型交互升級(jí)

綜合續(xù)航超1300km 混動(dòng)版的大眾途觀L來(lái)了

吉利中國(guó)星首款增程 375km純電續(xù)航

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

時(shí)尚

房產(chǎn)

數(shù)碼

本地

轉(zhuǎn)頭就暈的耳石癥，能開(kāi)車(chē)上班嗎？

中疾控發(fā)布寒假提示，6個(gè)健康要點(diǎn)請(qǐng)收下

貓著不動(dòng)VS冬練三九，哪個(gè)更養(yǎng)生

這些“無(wú)糖食品”正悄悄升高你的血糖

冬季鼻塞總不好？別把鼻竇炎當(dāng)感冒

冬季穿衣越簡(jiǎn)單越實(shí)用！從這些日常穿搭中收獲靈感，大方又自然

2026最流行的5種發(fā)型，太適合過(guò)年了！

伊姐周六熱推：電視劇《成何體統(tǒng)》；電視劇《唐宮奇案》......

40+女性冬季這樣穿：“長(zhǎng)外套+裙子”，保暖與洋氣雙向在線(xiàn)

房產(chǎn)要聞

海南又一千億級(jí)賽道出現(xiàn)，京東、華潤(rùn)、中石化等巨頭率先殺入！

2026年1月海南樓市銷(xiāo)售榜出爐：華潤(rùn)、中海、保利領(lǐng)跑

勁爆！海口主城這個(gè)書(shū)包大盤(pán)，最后一波抄底窗口出現(xiàn)了！

北緯18°的綠城海語(yǔ)春風(fēng)，把詩(shī)和遠(yuǎn)方過(guò)成日常！

數(shù)碼要聞

雷鳥(niǎo)新款27寸顯示器首發(fā)2999元：4K 160Hz/FHD 320Hz雙模切換

當(dāng)貝Air 1抗菌耳機(jī)走紅體育圈，獲拜合拉木、張楚桐等名將青睞

小米手表5新版本內(nèi)測(cè)：健身房訓(xùn)練支持重量自動(dòng)回填、優(yōu)化功耗提升續(xù)航

宏碁掠奪者圣盾7000配置上新：Ultra 9 285K + 5080，29999元

本地新聞

圍觀了北京第一屆黑色羽絨服大賽，我笑瘋了

云游中國(guó)｜撥開(kāi)云霧，巫山每幀都是航拍大片

云游中國(guó)｜格爾木的四季朋友圈，張張值得你點(diǎn)贊

云游遼寧｜漫步千年小城晨昏，“康”復(fù)好心情

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

幾乎都在掛羊頭賣(mài)狗肉，AI Agent的泡沫現(xiàn)在到底有多大？（上）

實(shí)測(cè)|字節(jié)新模型帶著音效和復(fù)雜運(yùn)鏡殺瘋了

高市早苗表態(tài)：著手推動(dòng)修憲

高市早苗表態(tài)：著手推動(dòng)修憲

創(chuàng)中國(guó)冬奧最佳戰(zhàn)績(jī)！19歲速滑新星含淚向天拉勾

央視電影活動(dòng)名場(chǎng)面！明星站位太講究

滬深北交易所優(yōu)化再融資 釋放3個(gè)信號(hào)

長(zhǎng)安將搭鈉電池 好比汽車(chē)要裝柴油機(jī)？

態(tài)度原創(chuàng)

轉(zhuǎn)頭就暈的耳石癥，能開(kāi)車(chē)上班嗎？

冬季穿衣越簡(jiǎn)單越實(shí)用！從這些日常穿搭中收獲靈感，大方又自然

海南又一千億級(jí)賽道出現(xiàn)，京東、華潤(rùn)、中石化等巨頭率先殺入！

雷鳥(niǎo)新款27寸顯示器首發(fā)2999元：4K 160Hz/FHD 320Hz雙模切換

圍觀了北京第一屆黑色羽絨服大賽，我笑瘋了

幾乎都在掛羊頭賣(mài)狗肉，AI Agent的泡沫現(xiàn)在到底有多大？（上）

創(chuàng)中國(guó)冬奧最佳戰(zhàn)績(jī)！19歲速滑新星含淚向天拉勾

央視電影活動(dòng)名場(chǎng)面！明星站位太講究

滬深北交易所優(yōu)化再融資釋放3個(gè)信號(hào)

長(zhǎng)安將搭鈉電池好比汽車(chē)要裝柴油機(jī)？

轉(zhuǎn)頭就暈的耳石癥，能開(kāi)車(chē)上班嗎？

冬季穿衣越簡(jiǎn)單越實(shí)用！從這些日常穿搭中收獲靈感，大方又自然

海南又一千億級(jí)賽道出現(xiàn)，京東、華潤(rùn)、中石化等巨頭率先殺入！

圍觀了北京第一屆黑色羽絨服大賽，我笑瘋了