![]()
文:王智遠 | ID:Z201440
26號在WAIC世界人工智能大會時,順道去參加了百度文庫、網盤的一個小型閉門體驗會,挺有意思。
他們準備上線了一個新東西,叫 GenFlow 2.0。
如果你之前用過他們的 AI,可能記得 1.0 版本:問一個問題,它就幫你跑流程、查資料、寫報告,像個勤快的下屬。
但這次不一樣。現場我聽到幾個詞:一個入口,N 種模式;AI 能記住你上次聊到哪了;任務做到一半,還能喊停、改主意……
聽著是不是有點耳熟?可當我真坐下來,親手去用時才發現,很多東西,沒那么簡單,它背后的調動能力變的更強了。
01
為什么說GenFlow2.0是個獨特又有野心的產品呢?
簡單來說,它支持用戶在同一對話框(搜索入口),切換不同人格(協作模式),應對不同任務,好像一個能自由變形的智能中樞。
舉個作為商業作者最頭疼的例子:數據驗證。
前段時間,寫一篇關于「即時零售」的稿子,查資料時特別崩潰。有新聞說美團即時零售日訂單突破 1.2 億,有的說1.5 億;還有說「神槍手」單量超過 5000 萬。
數字滿天飛,到底哪個準?
最讓我痛苦的,是AI給數據經常「打架」。你問 A 模型,它說來自某財經平臺;你問 B 模型,它又引用另一家媒體。
來源不一致,時間不清晰,口徑也不統一。
結果,不得不同時打開好幾個 AI 工具,把同一個問題扔給它們,看誰說得一致,再手動翻原始報道,比對、交叉驗證……整個過程非常耗時耗力。
這次我試了 GenFlow 2.0,沒想到深度檢索能力,直接把我從「比對地獄」里拉了出來。
處理流程非常清晰,大概分五步:一,技能規劃;二,步驟執行;三,聯網搜索;四,思考完成;五,輸出結果。
整個過程也就三到五秒。它不僅給出了美團即時零售訂單的驗證結果,還把數據拆得很細:
![]()
比如當前訂單量、與一周前的對比、餐飲類訂單占比,甚至把淘寶閃購的相關數據也一并列了出來。
最讓我驚喜的是,它最后明確標注:
以上數據,綜合自美團官方披露,及主流財經媒體在不同時間節點的報道,并補充了背景說明——比如「神槍手」是美團內部對高客單訂單的稱呼。
這已經不是簡單地“搜答案”了。是在做一場完整的、有邏輯、有來源、有時效性的「小型研究」,要做數據論證,這些內容,直接可以拿去用。
百度文庫產品負責人鐘昊說這個叫:深度模式,不但會基于用戶的需求、問題、過往的交互歷史進行深度理解和深度思考,還支持使用深度檢索完成復雜任務。
當然,面對簡單問題,GenFlow2.0會自動切換簡單模式,不耗時耗力地「過度檢索」,提問后答案自現,適合快速獲取結論,適合節奏快、需求明確的場景。
那除了深度搜索還有沒有其他能力呢?
有。我體驗了第二個能力:通用模式。有時,我們的需求,看起來很簡單,比如:隨口一句:幫我生成一張柯南在森林里奔跑的照片。
但從AI的角度看,這是一場多Agent協同作戰。它得先聽懂你說的「柯南」是誰,「森林奔跑」是啥場景,然后調圖像生成模型,判斷你想要什么畫風——是 Q 版?寫實?還是日漫?
接著還得選對風格匹配的模型,后還得控制尺寸、比例、分辨率…… 這一套下來,是一整套流水線作業。
所以,什么是通用模式?
讓AI從“單兵作戰”變成“特種小隊配合”。別看任務小,很多AI在這一步就翻車了,要么畫風不對,要么人物不像,要么干脆給你整出個柯南騎電驢的魔幻場面。
我也沒客氣,直接上狠活玩了一會。我說:
一張柯南在森林里奔跑的圖片,尺寸4:3,吉卜力風格。
它反應挺快。整個過程,三秒不到,圖出來了,我一看,有點東西;這圖你拿去做公眾號封面、發小紅書、甚至丟進剪映里生成個5秒動畫,完全夠用,甚至能打。
![]()
更爽的是,不滿意,根本不用重來,接著剛才的對話,直接說:把背景調暗一點、柯南跑得太僵了,動作再自然點”,它能立馬改動。
這種「動態微調的能力」,才是真效率爆炸。
這個入口,已經不是傳統意義上的“AI對話框”了,它更像ChatGPT那種震撼,張嘴說話,事兒就辦了。
或許,這才算「通用」的真正含義:一句「一句話需求」,變成一場無縫銜接的智能協作。
02
GenFlow 2.0第三個亮點,記憶模式。說實話,市面上,我目前只看到ChatGPT、Kimi有類似能力,其他家基本還在「對話即清空」的原始階段。
用AI最讓人崩潰什么?
每次對話都像在跟一個健忘癥晚期患者聊天。你剛聊完一個話題,轉頭去干別的,再回來接著說,它就裝傻,一臉茫然。
你得重新解釋背景、重輸提示詞,甚至還得再強調一遍,一次兩次還行,天天這么來,真的會瘋。
但這次,GenFlow 2.0記憶模式,有點驚艷到我了
它能記住你過去聊過啥、喜歡啥、討厭啥,甚至能調用授權后你百度網盤里的資料。
前幾天上海臺風天,雨說來就來,0幀起步,根本沒反應時間,我就順手跟AI聊了聊“氣候異常”這個話題,問了一些極端天氣的數據,它給我拉了一堆資料,講得還挺清楚。
聊完這事兒,我就切到別的任務去了。然后,昨天,又想接著深挖一下,就隨口問了一句:
上次咱們聊氣候的事兒,你還記得嗎?你提到一個關于極端天氣的緯度分析,挺有意思,最近有新進展嗎?
你猜怎么著?它真記得。
把上次對話內容完整調了出來,還補充了最新的研究動態和數據更新;那一刻,我愣了一下,這是真思考啊,這種能力,簡直給AI裝上了「長期記憶」。
我還順帶問了一嘴,上次聊到柯南的事情,你記得嗎?話不多說,直接上它調動的答案:
![]()
所以,這個能力能干嘛?你可以想象這個場景:
做一個設計稿,做到一半被臨時會議打斷,幾天后你想繼續,不用翻聊天記錄、不用重新描述需求,只要說一句:接著上次的設計做,把配色再調得年輕一點。
它就能立刻恢復上下文,把當時的思路都還原出來;那這已經不是“助手”了,這是「超級能打的搭檔」。
說實話,一開始我對「記憶模式」真沒抱太大希望,搞不好是「最近對話記錄」換個名字。真上手一試,確實有點東西。
不過,有些AI生成的內容顯得宏觀,針對性稍微有點欠缺;現在搶先測試的是「測試版」,希望后面全量上線時,可以優化得更好。
比如,我問它關于臺風現象的研究,它提到了雙臺風的「藤原效應」,又分析副熱帶高壓異常、海洋條件異常、季節環流影響等多方面因素。
我在想,是不是研究時控制一下變量?
03
這次GenFlow 2.0第四個亮點是:并行模式。
以前用AI做任務「排隊等」,你讓它干一件事,它吭哧吭哧跑完,出結果了,你才能接著提下一個。
就像在餐廳點菜:先上涼菜,吃完才能上熱菜,一道一道來,急不得。
并行模式不一樣。直接把AI從「單線程服務員」變成了「多線程廚房團隊」,你一句話下去,多個任務同時開干,互不耽誤。
舉個親測的例子:
我對GenFlow 2.0說:準備一個PPT,事件比較緊,過程中有三件事要干,一,把內容給你,要先羅列框架,框架支撐10頁PPT即可;二,框架給我要等確認;三,我確認完再做 PPT。
另外一件事是:查一下最近三個月國內 AI 大模型的重要發布節點,列個時間線,做成簡易報告。
按以往經驗,這得拆成三個對話、等三輪響應,至少花十幾分鐘;但這次,我話音剛落,它就開始了,還挺有意思。它的思考過程中說:這是兩個任務。
![]()
然后提到:用戶要做 PPT 還沒給我內容,那我優先啟動 AI 大模型時間線的任務。還挺抽象,知道先暫停一個,去做另一個...
不管了,先看看結果再說。我只想要一個簡單的時間脈絡圖,沒想到它直接弄出來了一個詳細的研究報告,有時間線,還有背景分析和關鍵事件解讀。
還生成了一個網頁版,可以直接分享出去,比較全,簡單截個圖:
![]()
在并行模式為生成任務大幅度提升效率的基礎上,再結合百度文庫本身PPT生成的優勢,質量高、速度快,還支持上傳自定義模版,這樣下來交付物基本不用大改,直接能上會、能發出去。
這種「多任務并發」的體驗,改變了我對AI效率的認知。
以前總覺得 AI 只能一個個任務來,現在才發現,它可以像一個真正的項目負責人那樣,規劃、協調、并進。
所以,并行模式,表面快,深層次把 AI 從「響應者」變成了「項目負責人」。你只管下指令,剩下的,交給AI團隊去跑。
04
最后,我還體驗GenFlow 2.0的干預模式。我覺得最「像人」的一部分,也是它真正從「工具」邁向「搭檔」的關鍵一步。
它不光讓你用得爽,還能隨時暫停、改主意、上傳資料、反悔,甚至邊干邊調方向。
過去,大多數 AI 一旦你輸入問題,按下回車,它就開始「自嗨式輸出」;你只能干看著,等它跑完一輪,才發現不對勁。
你想改?不行。必須等它跑完。你要提個新要求?也行,但得開個新對話。這哪是協作?建議叫:提交申請,等審批。
但GenFlow 2.0 的產品經理好像洞察到了這一點,所以他們做了干預模式:你在任務進行中,可以隨時喊停、補充信息、換方向,就像跟一個真人助理開會。
比如你說:
這塊先放一放,我們先看下數據;它不會懵,也不會翻臉,是立刻轉向,繼續干活。
我真實測試:扔給它一個Word文檔,讓它幫我整理成思維導圖,它開始理解文件結構,大綱剛搭了一半,我突然想起來還有個補充材料,就直接暫停,上傳了第二個文檔,說:兩個一起整。
它馬上回應:已接收到新資料,正在合并處理;然后,自動調整任務進度,把兩個文檔的內容融合進同一個邏輯框架里,連重復信息都做了去重。
更讓我驚喜的是,這種干預能力不止獨立存在,還穿插在所有模式里的細節。
比如:我在問一個問題的過程中,AI正在聯網搜索,我突然想給它一份財報PDF當參考,直接上傳就行。你看,這是無縫嵌入的協作節奏。
![]()
它把我當成一個「正在思考的創作者」,隨時可能有新靈感、新需求、新變數。
所以,什么是干預模式?以前AI“你問,它答”;現在GenFlow 2.0把控制權真正交還給用戶。
你走,它跟,你停,它等,你轉,它調頭;這可能是人機協作的理想狀態,AI足夠聰明,但從不搶戲。
而且,它不只是能“被干預”,生成內容出來后,還能直接在百度文庫的編輯器里自由調整。
無論 PPT、報告、還是思維導圖,都可以像改文檔一樣隨手編輯,格式不崩、結構不亂,改完還能讓 AI 接著優化。
這種「生成 + 可控編輯 + 持續迭代」的閉環,是真正的可用性保障;很多 Agent 產品只能輸出“結果”,但 GenFlow 輸出的是「可交付的工作成果」。
這也是,它和市面上多數智能體產品的關鍵差異。
回過頭看,「一個入口,N 種模式」是一種全新的工作方式,不需要切換工具、不需要反復描述背景,也不用擔心輸出沒法用。
同一個對話,能查數據、做圖、寫報告、改框架,還能中途換方向,它讓你的思考更連貫,執行更無感。
在現場,我還偷偷瞄到他們內部演示了「反思模式」……這些功能目前還沒放出來,據說會在后續迭代中逐步解鎖。
臨走前,我問百度集團副總裁王穎:這次升級什么時候能對外用?她笑了笑說,快了,快了。產品經理在趕進度,最終體驗和適用邊界,估計會在8月中旬在百度文庫上線。
嗯,有意思,從問答到共事,從工具到搭檔,蠻期待。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.