大廠如何“喚醒沉睡資源”、以Al重塑成熟業務,是很多人關心的話題。
百度文庫可能是一個代表。我跟文庫團隊一直有溝通,對文庫AI轉型的故事很有興趣,正好他們新上線的智能體GenFlow2.0口碑不錯,所以最近聊了一次。
互聯網時代,百度文庫更多作為知識庫與文檔工具存在。但在這一輪AI浪潮中,它從“資源下載站”躍遷為“智能生產力平臺”。目前,百度文庫很可能是國內AI生產力工具領域中,月活與營收規模同時站上高位的產品,也是百度AI重構最徹底、用戶感知最顯著的業務之一。
這是一個借助技術革命重新找準生態位、甚至走向舞臺中央的故事。
具體來看,百度文庫的AI轉型體現在三個維度:
第一,是產品定位的根本重構——從工具升級為平臺。過去用戶使用文庫,主要是單向獲取資料,如今AI讓它成為一個可創作、可交互、可輸出的生產力環境。比如其推出的智能PPT、AI繪本生成等垂類應用,精準切入職場與教育兩大高頻場景,把靜態知識庫變為動態的“解決方案生成器”。
第二,是對用戶需求的深度挖掘與響應。文庫沒有停留在“更快的文檔檢索”,而是圍繞“用戶為什么要用文檔”這一根本訴求,把產品重心從“獲取”推向“創作”,幫助用戶降低從靈感-素材-成品的全過程門檻。這正是AI時代優秀產品的共性——不再拼功能堆積,而是拼是否成為用戶工作流中不可或缺的環節。
第三,尤其值得關注的是,百度通過技術整合激活了多個存量業務之間的協同價值。最典型的是以最新升級的GenFlow2.0,打通了文庫與百度網盤——原本文庫是“內容場”,網盤是“存儲場”,彼此孤立;而現在,網盤開始支持內容的智能整理、消費與再生產,文庫則從終點站變為創作起點。這種跨業務的數據流動與功能耦合,不僅提升了用戶體驗,也重新定義了產品邊界,使原本孤立的業務模塊組合成更具黏性的生態。
可以說,百度文庫的轉型,不僅是一個技術升級案例,更是一次成功的用戶心智重塑。它向我們證明,哪怕是非核心業務,只要精準捕捉技術變革窗口、堅決推進產品重構,就有機會實現價值重生。
我們找到了百度文庫的產品負責人鐘昊和技術負責人楊在申,一起來聊GenFlow和百度文庫轉型的故事。
一、從智能PPT到通用智能體GenFlow, 文庫的AI重構歷程
從邊緣到中心:文庫的AI重構歷程
潘亂:今天我們聊大廠如何通過AI重構已有的成熟業務。百度文庫可能是這波AI生產力工具里月活和營收同時都最高的產品,也是百度迄今為止AI重構最徹底的產品。更有意思的是,兩三年前文庫在百度其實并不算核心業務,這是一個罕見的大廠非核心業務抓住AI浪潮走到舞臺中央的故事。
從2023年到現在,文庫在AI這個方向上都打過哪些勝仗?
![]()
鐘昊:我們第一個勝仗是做PPT編輯器,這算是第一個勝仗。當時這是一個非常艱難的決策,我們人數極少。當時文庫做AI的產品經理可能只有1/3到1/4投入進來,研發也是同等比例,所以在人數極少的情況下,我們要做一個方向,而且要做出業績來證明文庫真的有機會做AI。
編輯器這個事特重、特難。一般公司做編輯器都是千人級別打底的投入,時間以五年為單位來看。當時有內外部質疑聲音說“你這個太難了,何必要干這個?”
當時2023年初,所有人都在做prompt工程,都在測哪個模型好,都在找“魔法prompt”。誰去搞編輯器?但是一場仗能不能打贏,其實在開戰前就已經決定了一大半。
我們當時有幾個判斷都被證明是對的:
Prompt這件事會打平,不會再成為稀奇的事情
做單模態生文字很快就會被拉平,最后大家會卷超長上下文輸入輸出和多模態
一定是剛需場景可以先實現閉環,不是聊天、游戲、AI陪伴那些,一定是剛需的東西才能被驗證
市面上大家都不做,一定有很難的技術卡點,那個技術卡點我們一定要攻破
楊在申:從必要性來說,AIGC出現后,降低了內容生產壁壘。之前文庫和傳統編輯工具各司其職,用戶從文庫拿到素材后,還需要到桌面用office等工具二次加工。微軟發布copilot代表了一種趨勢,很多工具廠商可以低成本追趕內容生產短板,做出端到端的產品。
從可行性來說,文庫做了十多年文檔,我們懂文檔。我們錨定用戶高頻使用的頭部編輯功能,80%的長尾功能普通用戶并不會調用。另外我們從AIGC視角出發,把端的能力跟云的能力做融合。
鐘昊:我們讓所有人都相信這件事必須這么做能成,必須走這條路才能達到目的。雖然很難走,但我們每個人都充分論證和自我說服了,已經沒有更好走的路。
我們一天天開日會,關在小黑屋里沒日沒夜干這件事。最后我們成為第一個能夠實現用戶上傳自己的文檔生成PPT,上傳自己的模板、logo能加入到PPT里的產品。這些都因為我們有編輯器,沒有編輯器根本做不到。
這讓我們在整個智能PPT市場上拉開了很大身位,一直到今天這么多人做,但我們基于任意模板做PPT這件事還依然在行業里獨步。
20人團隊如何啃下編輯器這塊硬骨頭
潘亂:你們有多少人來干自由畫布編輯器這個事情?
楊在申:一共20人,勉強夠20人。
潘亂:不到20人,對做編輯器來說可以認為是杯水車薪了。怎么只用WPS不到1/10的人力,就把編輯器給啃下來?
楊在申:我們錨定用戶高頻使用的頭部編輯功能,80%的長尾功能并不會被普通用戶調用。另外我們從AIGC視角出發,更多把端的能力跟云的能力做融合,所以起步并不是想象中那么困難。
我們做了一段時間編輯器建設后,更好地把上下游能力做有機整合。比如初始排版動作可以在云端通過AI實現,不需要實時在網頁上重新做。借助大模型可以更準確理解自然語言甚至語音指令,大幅降低前端菜單和操作按鈕的復雜度。
從PPT到長文:突破模型邊界的技術攻堅
![]()
鐘昊:做完PPT編輯器后,我們沿著那個思路繼續。我們覺得短文是沒有壁壘的,短文加prompt沒有壁壘,所以一定要搞長文。
當時模型上下文容量特別有限,大概8000 TOKEN左右,輸入加輸出。純輸入輸出可能就4000多個,歸到漢字可能就1000多個字,完全不夠用。
我們不是做模型的,也不可能自己干大模型。在模型容量天然有限的情況下,我們怎么解這個超長上下文的題?我們調了算法同學一起詳細調研各種技術路線。
有的技術路線說能讓你理解100個文件,但要給3個小時時間。有的說能做出5000字文章,但前后邏輯不順,車轱轆話反復說。我們怎么把優勢發揮出來,把犧牲互相彌補,足足干了三四個月才有質的突破。
我們跟Kimi前后腳推出超長上下文理解。如果沒記錯,Kimi第一版是50個文件每個100兆,我們第一版是100個文件每個200兆,而且是全模態的,大概三四十種格式都可以解析。輸出能力是第一個達到10萬字一次性輸出的長文能力。
![]()
更重要的是沉淀下來一套讓我們繞過或突破大模型邊界的方法論和信念。模型并不是我們的邊界。很多通用agent離了Claude就什么都不是,但我們完全自研框架,可以離開任何一個大模型,想辦法取長補短,底層都是MoE的,可以隨時插拔。
自由畫布:GenFlow的實驗田
![]()
潘亂: 去年你們做的自由畫布,感覺是今天GenFlow的實驗田。在自由畫布這個產品里面,你們驗證了哪些關鍵理念?
鐘昊: 自由畫布是一個可以編輯所有格式、所有模態內容的產品模塊。 有了它之后,我們做很多垂類能力就變得相對輕松。比如研報生成出來后,用戶想調調數據,想補充信息,直接一鍵就可以跳到編輯器里面,生成的研報現成就是可以隨時編輯,下載下來就是標準的可以用傳統三件套打開的兼容格式。
我們也用它激活了文庫和網盤很多存量數據。 比如在網盤上上線的AI學習筆記,很多用戶過去在網盤看學習視頻,但用紙筆記筆記,或者另外拿個iPad記筆記。AI完全可以半自動甚至全自動去總結和記錄相關關鍵幀,把學習視頻脈絡做成思維導圖。
為什么之前沒有這樣的產品?就是因為編輯器融合如果不提前做的話,這種場景就很難做。 我們讓用戶能在看視頻的同時,右邊有一個編輯器,來記錄自己想法,跟AI交互。整個過程就是把自由畫布的融合編輯器底座遷移到新場景里快速復用。
當時我們在自由畫布上,第一個覺得跟chatbot這種串行交互方式并不友好,很多時候我們需要并行處理很多文件和對話。 自由畫布就是一個并行框架,可以同時并發處理非常多任務,這就變成了今天GenFlow的并行模式,GenFlow能夠并行調度N個AI專家來幫你同時干活。
GenFlow:讓100個AI專家并行干活
![]()
潘亂:GenFlow號稱可以調動100多個agent工具矩陣并行干活,還能隨時干預,這是怎么實現的?
鐘昊:GenFlow調用的每一個子能力都可以讓子任務完成得更好。比如用戶傳了PPT模板想用這個模板生成PPT,模板的還原就要通過編輯器。首先要讓模板每個元素都能在線上精準還原,然后才能讓AI學會,這個還原過程就是靠編輯器。
通過融合編輯器基座,能讓GenFlow的干預模式變得更絲滑。現在不管生成繪本、研報、PPT,過程中都會先生成大綱,用戶確認后再生成。大綱是可編輯的,用戶可以隨意添加文字或文件,大綱本身就是一個編輯器。
很多時候需要讓不同模塊自由轉換,比如上傳資料生成思維導圖,需要在同一個交互界面讓GenFlow完成跨模態任務。可能輸入是文字、資料、圖片、視頻,輸出可能是思維導圖、PPT或其他東西,需要在同一個界面,不能讓它跳來跳去,這還是靠整個AI編輯器才能實現。
二、GenFlow如何讓文庫、網盤都“活”過來
潘亂:為什么產品選型時選擇對話式交互,而不是畫布式交互?
鐘昊:畫布式交互對專業選手來說很爽,很干凈、很自由。但對很多大眾用戶來說過于自由了,不知道該從何下手。所以GenFlow回歸到更大家熟悉的LUI加GUI的對話加輕操作方式,對大多數用戶接受度更高。但背后的理念、基建、能力依然是這套,而且GenFlow的AI智能程度和協作深度比自由畫布有了大大提升。
并行與干預:重新定義AI協作體驗
潘亂:并行和干預這兩個能力對用戶體驗的改變有多大?
鐘昊:并行給用戶最直接的感覺是“這就是我要的一個團隊為我工作”。AI在數字世界,既然在數字世界,為什么不能是100個AI、1000個AI同時為我干活呢?
干預給用戶更多的是掌控感。不用再讓團隊干了一個星期,最后發現不OK。你讓你的下屬干活,過程中發現他思考有偏差,但只能干瞪眼等他干完再重來,這很痛苦。
我對人是可以打斷的,可以告訴你要考慮這個問題,要用上那個素材,這里想錯了。我對AI為什么不行?所以GenFlow有暫停button,用戶可以隨時打斷AI,告訴它應該怎樣思考,甚至補充“我上周在網盤存了資料,你把那份資料也用起來”。這更接近跟人的交互,增強了用戶掌控感。
潘亂: 從技術角度上,你們這個GenFlow產品用下來也比其他產品更快一點,在申你要解的題是什么?
楊在申: 現在底座模型的思考時間比之前更長了,因為算力消耗更多,解決的問題也更復雜。我們的優化點主要在業務層,兩方面:
第一是任務分解時的并行優化。 假如一個復雜任務需要四步處理,前兩步互相沒依賴,和三四步也沒依賴,雖然和三四步是串行,但前兩步本身可以并行。在任務拆解環節就有壓縮耗時的空間,可以并行的任務單元我們可以單拎出來做。
第二是狀態管理。 一旦執行并行,任務肯定有快有慢,怎么及時捕獲每一個任務運行狀態,然后把接下來要可以掛接的下一個任務及時調度起來。需要有比較精密的狀態管理,或者信號傳遞、信號共享系統。
垂類深耕vs通用路線:先練72絕技再練易筋經
![]()
潘亂:現在AI圈更習慣模型能力越強做什么都能做,大部分團隊追求通用性,試圖用一套框架解決所有問題。但你們選擇先在垂直領域深耕再整合,這個路徑的核心邏輯是什么?
鐘昊:我們的目的從一開始就不是造一把舉世無雙的錘子,而是這個場景里天然就有很多用戶需求等著我去解。
文庫現在新用戶42%-45%都是大學生,30%左右是老師和醫生。他們天天在這里下PPT模板、找PPT模板,但PPT模板不是終極需求,PPT才是。所以我先把智能PPT做出來。
后來發現用戶不光要PPT,還有教務需求,醫生要寫報告、思想匯報,護士要寫月度工作總結。我看到這些需求就想AI怎么去滿足他,就把那些垂類工具造出來。
更接近于先把羅漢拳、虎鶴拳這些招式一招一式扎扎實實練出來,練出來后再看能不能有易筋經讓它融會貫通。
我們有很好的習武場,有很好的用戶群,有很樂意跟我們一路陪伴磨練這些AI agent的用戶,把這些東西鍛煉出來后自然發展。每一個東西都不是現在憑空造的,都在過去需求場景解決方案中埋下了伏筆。
相比其他agent產品,GenFlow更接近垂類工具打磨到比較深后,嘗試做各種其他領域的事。用深度思考加代碼框架解一切,犧牲的是每個任務都要重新規劃、反思,重新寫代碼框架,調用高成本虛擬機。這一個是慢,第二個成本重,第三個效果還不好。
我們是真的一招一招都練出來了,練出來后再學易筋經打通經脈。我們讓GenFlow學會通過意圖理解在什么場景和用戶需求下調什么工具,讓這些工具完成任務就OK了。
GenFlow命名的寓意
潘亂:產品為什么叫GenFlow?這名字的由來什么意思?
鐘昊:這個也很有意思,這個是我們一位產品經理起的名字,起的時候首先第一印象就是比較順口,第二背后的寓意是大家之前一直在聊一個事,叫WorkFlow。
WorkFlow我們想去做這件事情,是希望能讓我們的AI,它既然能夠無所不能,那我們是希望這個WorkFlow不是一個寫死的狀態,而是首先它是可以Generate出來的,讓AI來幫它調度,怎么樣去更好地完成一個工作,有的時候AI想的甚至比我們自己還要清楚,這是GenFlow的由來之一。
另外我們還希望它是很聰明的,就是這個WorkFlow,它不光是它能自己Generate,而且它很聰明,那就是Genius,所以這剛好前三個字母都是GEN,最后我們就叫了GenFlow。今天的GenFlow也是在往這樣的一個方向去發展。
為什么大多數Agent產品難以成功?
潘亂:今年Agent的確非常熱,各種創業公司,各種AI產品都說自己是Agent,或者在做Agent各類的東西,但很多通用Agent他們的任務完成率很低,DAU超過10萬的屈指可數,都很罕見,用戶留存也非常慘淡,這是為什么?以及你們為什么有信心可以把這個天花板往上去捅一捅呢?
鐘昊:回歸原點,你要讓一個AI能力,它有生命力。不管是文庫最早做的智能PPT,還是像我們接手網盤后的學習筆記,我覺得還是回歸原點,就是扎扎實實的真的去解決一些用戶他在這個場景下他就會碰到的一些問題,然后你解決的就是比原來他的這個場景拿到的解決方案要更好,也比他出去找別的工具解決得更好。
比如說看起來都在做智能PPT,但是這個智能PPT我們的采納率是90%,市面上平均采納率50%~60%。那你生成一個東西,你生成10次有9次能用,還是說你生成10個你只有一半能用?你這個用戶他到底能不能實現口碑上的人傳人能不能實現這種來了還想再來?對于一個工具性產品來說,這就是致命的問題。你看起來好像都給了,我都端給了你一個PPT都端出去了。但是你不是做給投資人的,你是做給用戶的,那用戶能用不能用?他用了就知道了。
那像我們對各種垂類行業的PPT做了特殊的訓練,然后我們的整個PPT后置的編輯器也是能夠去還原很多他自己上傳的模板。那這些都是細節,這些都是我們在這些場景里面去打破場景天花板的一些細節。你看上去我都是在做同樣的AI能力,但是能不能傳出去?能不能讓用過的用戶留下來?能不能讓原來的這個場景長出第二條曲線?原來是個下模板的場景,現在變成一個做PPT的場景。
我們做PPT也是最早推出來說能允許用戶自己上傳模板,能允許用戶上傳自己的公司Logo貼在每個PPT里面,我生成時候給他帶上,能讓用戶上傳一個數據,然后這個數據就做成表出現在PPT里面,能在這個PPT里面去生成這種公司的組織架構框架圖,能生成這種不一樣的專業的布局。
那這些其實都叫PPT,那我生成的跟別人就不一樣,就是你每一個細節最后都能決定你到底做AI產品能不能成功。
三、文庫網盤做了件了不起的事:從微笑曲線最底端往上走
從數據倉庫到Agent工廠
潘亂:網盤你們想往什么方向改變?大部分人用網盤只是數據倉庫,普通用戶存的都是手機備份的視頻圖片,很少主動打開。
鐘昊:網盤用GenFlow想象力更大,超出我們預期。有幾個場景都是我沒想到的。
第一個很基礎的場景是資料整理。GenFlow上到網盤后在資料管理層面有很大效率提升。用戶同步到網盤都是瞎同步,沒有整理,文件名千奇百怪。因為GenFlow有多模態讀取能力,能基于內容聚類文件,不管是圖片、視頻還是word。GenFlow能幫他統一重命名,把符號去掉后按統一規則重新命名每個文件。
![]()
還有找資料的場景。我們經常碰到”明明記得信息在什么文件里,但想不起文件叫什么名字”。這時關鍵詞檢索失效,但如果提問給GenFlow,內容只要用戶授權過、做過預向量化處理,哪怕是視頻內容也能找出來。
在這基礎層之上是功能層。很多用戶拿網盤看學習資料,一邊看一邊在本子上或Pad上記筆記。我們做了AI學習筆記讓AI幫他自動記,而且不是簡單總結,用了思維導圖工具、截屏工具,能具體定位到筆記記在哪一幀。
還有全自動化的AI再生產能力。很多網盤用戶存的都是自己的素材,有過往知識沉淀、摘錄信息。這些素材有兩個層面:第一可以形成用戶專屬個人記憶,讓GenFlow更懂他;第二,哪怕不涉及用戶記憶,明確讓用戶說“你把我這些素材做成什么東西”。
網盤的個人知識庫屬性加上GenFlow后能得到極大發揮。
從微笑曲線底端往上走
潘亂:怎么把一個原本只是中間環節、價值并沒有那么高的產品,活生生從邊緣地帶推到中心?
鐘昊:其實AI幫我們打破了邊界。過去你想延伸,沒有大的技術革命時很難的。
AI既是燃料,同時也是催化劑。很多產品更多把AI理解為燃料,讓AI幫我生成。但AI可以是很好的催化劑,做環節上下游的粘合、縫合和延伸。
過去文庫只是資料庫,只能下載。你要讓文庫能夠下載完后,離線的那些操作、過去不在文庫的操作還能在文庫繼續下去,在過去很難,因為總有工具更好用。但今天AI催化了這件事,因為AI能理解你找到的資料內容和模板,理解完后能跟你人機協作進行下一環節產出,這些都可以在線上完成。
網盤也一樣,過去看了資料就結束了。但今天有了AI,它能幫我更高效地找,能理解我的意圖幫我定位素材。AI幫他把上下游充分延展、催化和打通了。
既然文庫和網盤都在往上下游走,為什么不讓它完整串起來?它們剛好負責不同環節,也在延伸不同的上下游場景,但最終都圍繞內容生成和消費主線。通過AI、通過GenFlow,背后蘊藏文庫和網盤的知識和個人資料,最后把整個大的內容加AI戰場給盤活了。
潘亂:網盤這個東西之前真的只是備份,今天感覺更像是把原本存儲功能往上做了填充,最基礎就是把同步數據倉庫能力變成了有點像智能云相冊的感覺。
鐘昊:不只是相冊。今天大家聽到的百度網盤或百度文庫,都早已不是十幾年前的那個產品了。
潘亂:但這個名字讓我聽起來想不起有什么新東西。
鐘昊:所以有用戶開玩笑說百度文庫、百度網盤可能是被名字耽誤的最好用的AI。映射到物理世界的話,百度網盤和百度文庫更像是對公有或私有倉庫,而有了AI之后,你是有了分揀、甚至現場搭建再生產小工廠的能力。你給倉庫加了智能分揀,加了生產鏈,甚至加了銷售渠道。加了這些東西之后,倉庫早就不只是倉庫了。
你存的可能還是往倉庫里存的存貨,但有了AI就像有了分揀裝置、小工廠、生產鏈、銷售渠道一樣,我完全已經不是那個東西了,我就是一個超級工廠。
小團隊如何連打勝仗
![]()
潘亂: 你們一開始團隊規模并不大,技術研發團隊兩只手數得過來,怎么在這種人員規模不大的情況下,同時還打了好幾場仗?在大廠里面成熟業務通過AI重構來上一個新臺階的,你們是非常罕見的存在。怎么能夠同時打贏這種多場硬仗?
鐘昊: 一方面是我們的戰略其實非常的清晰和堅定。 像我們的副總裁Avery經常跟我們去對齊我們的戰略主線,就像剛才提到的文庫和網盤從一個單環節處理平臺,到一個全環節的全鏈路的打通。
某種程度上是先讓大家打勝仗,打勝仗的團隊是靠一個個小勝仗積累起來的大勝仗。 先讓大家能把小的餅一口吃圓了,然后大家愿意跟著卯足勁去吃那個更大的餅。
團隊的戰斗力,還真不完全在于規模和數量,很多時候就在于你的心氣和你的人均效能。 前段時間我們還在內部盤我們研發的人均代碼數,是一個非常夸張的數字。大家拿著這個心氣去干正確的事情。
而且我們真的在AI上拿到了收益,拿到了增長,拿到了收入,拿到了用戶認可。 過去文庫上小紅書全是罵的,兩種:一種是罵,一種就是怎么作弊,怎么在文庫上繞過會員體系下載。今天到文庫上去搜,很多都是去說你思維導圖做得好,說你這個PPT做得好,說你這個文庫上居然還有繪本功能,太驚喜了。
不光是我看得到,楊在申看得到,團隊的每個同學也看得到。大家在這樣心氣上爆發出來這種戰斗力,不是一般的拼湊起來的,或者大家是一種領導派來的任務這樣狀態下能夠擁有的團隊戰斗力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.