網易首頁 > 網易號 > 正文申請入駐

從大模型到Agent：百度GenFlow2.0，定義新賽點

2025-08-19 12:08:42　來源: 數字力場

北京舉報

分享至

　　「最炫Agent風」正刮，誰能成為御風者？

　　文 | 佘宗明

　　PC互聯網時代的技術主要呈現界面是Web（網頁），移動互聯網時代的是App（客戶端），那AI時代的呢？

　　比爾·蓋茨兩年前的預言，就給出了答案：AI Agent將是AI最大的賽道，「Agent（智能體）不僅將改變人們與計算機的互動方式，還將顛覆軟件行業，引發自鍵入命令到點擊圖標以來計算機領域最大的革命。」

　　如果說彼時他的這番斷言還有些超前，那如今「AI Agent時代已來」漸成共識的現實，就跟他打了個響指。

　　3個月前，微軟CEO納德拉就在微軟2025年Build大會上表示：「我們已經進入了AI Agent時代，正在見證AI系統如何以全新方式幫助我們解決問題。」

　　有意思的是，當時還跟納德拉進行了連線的馬斯克，旗下AI公司xAI前不久還準備籌建名字內涵微軟（Microsoft）的子公司巨硬（MacroHard），定位于打造AI Agent生態。

　　在硅谷掀起「最炫Agent風」之際，大洋彼岸的中國科技企業也正以前瞻的技術布局與獨特的技術路徑，在這場決定未來若干年AI應用生態格局的賽道上積極卡位，努力將身位從追趕者變為領跑者。

　　回顧現代技術演進史，技術發展總是遵循著「技術突破-產業聚焦-場景落地」的路徑，AI也不例外。

　　2023年初，ChatGPT出圈揭開了AI大模型軍備競賽的序幕，兩年多過去了，在「Agent元年」說法的掩映下，全球科技巨頭競爭焦點正從大模型參數轉向Agent。

　　原因很簡單：隨著大模型參數規模擴大帶來的邊際效益遞減，如何讓AI從「被動響應工具」變成「主動規劃執行者」，已成行業新命題。而Agent就是AI從「感知智能」邁向「認知智能」的關鍵載體，也是連接大模型技術與真實場景的核心橋梁。

　　作為能自主理解任務、規劃步驟、調用工具的AI應用形態，Agent可以讓AI不再是孤立的技術模塊，而是能深度嵌入企業運營系統的「生產力單元」，解決傳統AI應用場景碎片化、投入產出比低等問題，推動AI技術在產業側的應用落地。

　　在硅谷，OpenAI在GPT-4之后，迅速推出GPT-4o Agent，試圖通過連接代碼解釋器、網頁瀏覽器等工具，打破大模型「只能對話不能行動」的局限；微軟則將Copilot深度集成于Windows系統與Office全家桶，提出「Agent for Everyone」戰略；谷歌則押注「多智能體協作」，發布了Gemini Agent Suite。

　　▲國內外科技巨頭們都在發力AI Agent。

　　在國內，科技企業也在加碼發力。動作最大的，當數百度：從2024年發布文心智能體平臺AgentBuilder，到今年4月推出全球首個內容操作系統「滄舟OS」、先發在行業內率先實現全場景滿足、全鏈路覆蓋的AI Agent GenFlow1.0、上線通用超級智能體App心響，百度在Agent賽道的深耕軌跡清晰可見。

　　8月18日的百度AIDAY上，百度文庫與百度網盤又聯合發布了全球首個全端通用AI AgentGenFlow2.0，以「全端通用」「并行任務」「記憶可溯」等突破性進展，為國產AI在全球Agent領域的競爭注入了強勁動力。

　　這極具默契的轉向背后，是AI產業對AI價值的認知再校準：AI的價值不在于炫技，而在于應用。AI時代，企業需要的是能自動生成財報、拆解項目計劃的AI助手，個人需要的是能同步處理郵件、整理資料的AI助力，這些都在倒逼AI從「能說會道」向「能做會干」進化。

　　盡管被寄予厚望之下，AI Agent迎來了爆發之勢，但不得不說，當前行業仍面臨著理想與現實的鴻溝：市面上多數Agent產品還停留在「單輪對話+插件」階段，并沒邁過從實驗室玩具到生產力工具的那道門檻。

　　今年4月，Gartner就發布報告稱，市場上正充斥著所謂的「智能體洗牌」現象，即廠商將普通AI助手或ChatBot重新包裝為「智能體」，但這些產品實際缺乏真正的自主智能能力。

　　揆諸現實，當下很多Agent跟用戶現實期待仍有不小差距，這具體反映在幾個方面：

　　1，任務拆解能力不足。許多Agent在處理復雜任務時，會出現邏輯斷裂。

　　你讓它「生成新能源汽車市場季度分析報告，需包含政策分析、競品數據和趨勢預測」，它可能要么遺漏「政策分析」等關鍵模塊，要么將「競品數據」局限于單一品牌，最終產出的結果經常需要人工大幅修改。

　　這是因為當前很多Agent的任務規劃算法仍依賴簡單的規則匹配，缺乏對復雜需求的深度理解與動態調整能力，無法像人那樣將復雜目標拆解為「數據采集—分析建模—內容生成—格式轉換」等有序子任務。

　　2，結果質量不可控。不少Agent生成的內容，動輒存在低級錯誤。

　　我曾用某教育類Agent幫我生成講座課件，結果PPT中出現了「媒介即訊息是尼爾·波茲曼提出」的結論。

　　根源在于，這些Agent缺乏專業知識庫，無法安全訪問私域資源（導致內容片面），只能依賴自身大模型訓練數據（導致信息滯后）。

　　3，效率與協作存在瓶頸。有些Agent處理跨領域復雜任務，非但耗時久還易卡殼，有些還無法與用戶現有工具（如文檔、云盤、專業軟件）無縫對接，儼然成了信息孤島。

　　說白了，是因為這些Agent太依賴單個模型能力和串行工作模式，難以應對多任務并行、動態調整等需求。

　　▲市面上的大多數Agent還存在諸多能力的不足。

　　理論上講，Agent應該像擁有超能力的AI管家，接到任務后會先畫思維導圖（規劃），再檢查步驟對不對（驗證），然后有條不紊地執行。它長著數字眼睛，能「認路避障」（環境感知），帶著AI大腦，能權衡利弊（自主決策），揣著工具百寶箱，能「訂票叫車」（工具調用），還能有始有終（完成任務閉環）。

　　可太多Agent不是視障就是智障，可用性、穩定性都不如人意。這就導致，企業將核心業務、重要任務交給Agent處理的意愿不足。

　　諸如此類的痛點，對應的其實是行業的機會窗口。在Agent競速進入深水區的背景下，誰能率先解決可用性、穩定性、資源整合等問題，誰就能在Agent時代建立起技術與生態的雙重壁壘，掌握定義行業標準的主動權。而GenFlow2.0的解決痛點導向，就來得很明晰。

　　跟時下那些只能跑在網頁或客戶端上，還得有邀請碼或內測資格才能用的Agent有別，百度文庫GenFlow2.0有兩個典型特征：一是全端通用；二是現貨可用。

　　目前它已同步上線百度文庫網頁端、百度文庫APP，用戶無需排隊等待，就能開箱即用。

　　我在移動端試用時，發現它還有個很人性化的地方——將傳統「瀑布流」任務展示改為「并列式」進度可視化，我下達指令后，能直觀看到每個Agent的分工（如A Agent負責數據搜索、B Agent負責PPT生成）。

　　我體驗完后的內心os是：百度該給產品經理加雞腿了。比起滾動條沒完沒了地下拉，這樣操作才更切合普通用戶日常習慣吧？

　　值得注意的是，全球「首個全端通用Agent」并非GenFlow2.0的唯一優點——它直接來了幾個行業首發，包括并行模式、記憶模式和全程可干預模式。

　　▲我使用GenFlow分析2024年至2025年Agent市場格局演變的全過程，期間因我中途暫停提出新要求，拖長了其完成任務的時間，但最終交付結果堪稱驚艷。

　　先說并行模式。我讓GenFlow2.0分析2025年Agent市場格局，生成對比表格并制作競品分析PPT，它會自動調度「市場分析Agent」「數據可視化Agent」「PPT生成Agent」「網盤檢索Agent」等多個專家級Agent并行工作，而非逐一處理。

　　據了解，GenFlow2.0依托百度文庫、網盤自研的Multi-Agent基礎架構，可開啟「100+專家Agent并行處理」式的多智能體協同作戰，讓AI執行任務從得慢慢等變成立等可取，實現了分鐘級交付（多項復雜任務3分鐘就可完成），提升了效率天花板。

　　再說記憶模式。我前幾天就讓GenFlow2.0幫我生成過Agent技術發展路徑分析，今天又要求它「分析2025年Agent市場格局情況」，它會自動調用歷史數據，無需再次闡述問題背景，避免重復勞動。

　　這背后是GenFlow2.0首創了「長-短-臨」三級記憶中樞，可在多輪任務中記住用戶對話、操作偏好、文件交互記錄、修改痕跡等，實現「越用越懂你」。

　　接著說全程可干預模式。我在GenFlow2.0生成內容時，中途提出「加入2024年Agent市場格局情況」，它會立即調整，把我說的「聽」進去。

　　這也是GenFlow2.0跟其他Agent的區別所在：一般Agent都是「寫Prompt（提示詞）→漫長等待→發現不對→重寫Prompt→新一輪等待」，它是「說一句→看著它干→隨時改→立等可取」，其實時干預功能允許用戶在任務流任何節點暫停、回退、補充指令或追加文件。

　　這些突破，顯然不只是單點技術升級。

　　AI技術進步固然不是線性化的，而是指數級的，但絕不會是平地起高樓。

　　GenFlow2.0能攬下Agent領域的很多「首個」，離不開「專項積累+生態協同+全棧布局」三個維度的支撐。

　　從專項積累看，百度對Agent的探索早已形成累進式突破。

　　百度文庫中PPT、繪本、生圖、研究報告等單一Agent在垂直場景的成功，為滄舟OS和GenFlow1.0首次實現多Agent基礎調度做了鋪墊，也讓GenFlow2.0實現「從可用到好用」的跨越有了支點。

　　可以說，GenFlow2.0的發布并非「從0到1」，而是「從100到1」——把上百個經過市場驗證的成熟Agent裝進同一個「航母戰斗群」，「專項突破—系統整合—體驗升級」的路徑也由此成型。

　　從生態協同看，GenFlow2.0構建起「百度自有生態+第三方合作生態」的雙循環。

　　在百度體系內，它跟文庫網盤的「三庫（文庫公域專業資料庫+經用戶授權的網盤私域數據庫+用戶記憶庫）一平臺（百度學術平臺）三器（閱讀器、編輯器、播放器）」充分打通，跟蘿卜快跑（智能出行）、數字人直播（內容創作）、秒噠（無代碼開發）等產品深度聯動。

　　▲FenFlow2.0離不開百度AI全棧布局的支撐，又跟百度其他AI產品形成了聯動。

　　你讓它生成「十一假期出游計劃」，系統可自動調用百度地圖生成可交互的行程H5，同步通過蘿卜快跑預約接送機服務。

　　在外部生態上，GenFlow2.0兼容MCP協議，榮耀MagicOS已原生接入，用戶可在手機負一屏一鍵調用其能力，實現「手機端生成PPT—平板端編輯—電腦端演示」的全場景流轉；WPS、釘釘、飛書也在灰度測試。

　　MCP協議的開放性，讓GenFlow2.0能像樂高積木那樣被嵌入任何應用，讓其多重能力不再局限于單一應用，而是滲透到用戶的生活與工作全場景中。

　　從全棧布局看，百度的全棧AI能力為GenFlow2.0提供了底部支撐。

　　從芯片層的昆侖芯（能提供算力支持），到框架層的飛槳（保障多Agent調度效率），再到模型層的文心大模型（有混合專家模型架構、有多模態理解能力），百度是全球少數實現AI全棧自研的企業。全棧技術沉淀，托起了「端到端優化」的閉環。

　　歷史不會重復，但總會押韻。二十多年前，Windows把DOS從命令行變成圖標；十多年前，iOS/Android把鍵盤變成觸控；而在今天，Agent又帶來了新人機交互方式與任務執行模式。

　　接下來，誰能用兼具可用性、穩定性的Agent產品更好地解決用戶需求、占領用戶心智，誰就能拿到下個十年的門票。

　　而今，GenFlow2.0就有了Android昔日的模樣：Android早些年就把硬件、應用、服務統一在Linux內核之上，形成了深厚生態壁壘，GenFlow2.0現在則是把算力、模型、數據、Agent、人統一在自然語言這個最樸素接口之上。

　　對用戶而言，當辦成很多任務只用一句語音而非復雜操作，那AI的實用價值也就能得到最大化發掘。這里的實用性，本是立足于對用戶需求的深刻洞悉，最終會落腳于對用戶體驗的深層革新。

　　▲AI Agent，最重要的是實用好用。

　　這類革新，既會形塑用戶對Agent的新期待，也會重塑中國在Agent領域的競爭力。

　　全球Agent競爭已陷入白熱化境地，硅谷巨頭們就在試圖將PC、移動互聯網時代的卡位優勢復制到Agent中。

　　在此形勢下，GenFlow2.0多重突破的價值已超出技術升級本身，為國產AI在Agent領域實現能力趕超、標準引領提供了參照系，也積攢了籌碼。

　　跟OpenAI的Agent生態側重于通用能力、微軟的側重于辦公體系不同，百度GenFlow2.0全端通用帶來的多場景無縫切換便利+公私域知識融合帶來的數據安全可控特點+并行處理、記憶可溯、全程可干預帶來的效率提升效果，證明了國產Agent可以有自己的創新引領點和差異化優勢，具備變成跟OpenAI、微軟和谷歌們抗衡的全球生產力平臺。

　　可以預見，在不久的將來，超級好用的Agent在改變那塊名叫「AI應用」的大洋地殼彈性后，AI的潮汐會以新節奏漫過每一道我們習以為常的堤岸。讓我們且看，且期待。

　　?作者 | 佘宗明

　　?運營 | 李玩

　　轉載須經許可

　　廣告合作請聯系微信號：rabgogo88

　　或手機號：18810070968

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.