今年以來,字節跳動在 AI 賽道的推進節奏近乎“瘋狂”。豆包月活破億、手機助手空降熱搜,這些動作釋放了一個明確信號:字節已不滿足于將大模型視為某種“單點插件”,而是要將其打造成一個高頻、全場景的超級入口。
這一次,字節將準心對準了生產力腹地——辦公場景。近期上線的AnyGen,定位直指 Notion + NotebookLM 的集合體。它最狠的地方在于:徹底重構了“輸入”到“交付”的鏈路。
辦公賽道從不缺玩家,但卻是最難被“做順”的領域。現實中,大多數 AI 辦公工具的崩潰時刻往往發生在生成之后:文檔出來了,你得苦逼地補信息、調結構;PPT 生成了,你還得面對格式走樣、模板崩壞的返工地獄。AnyGen 的野心在于,它試圖在最耗時的“反復返工”環節中,插入一層極度穩定的加工與交付能力。它的目標不是讓生成結果“看起來完工”,而是讓它“真正能交差”。
![]()
這篇測評要回答三個問題:AnyGen 到底是什么形態、它的功能鏈路解決了哪些真實痛點、以及它會遇到什么樣的競爭與邊界。
![]()
AnyGen 是什么?
官網直接把它定義為“AI 工作方式的另一種可能”,強調不是追求一鍵生成,而是與 AI 一起打磨到能發給老板或客戶的交付質量,并把能力拆成文檔、通用智能體、幻燈片與數據分析四個模塊。
整體來看,AnyGen 的核心功能聚焦在以下幾件事:
把真實世界碎片(語音/照片/鏈接)轉成結構化材料,并引導到可加工狀態。
生成高質量的文檔與幻燈片,并且讓輸出真正可編輯、可繼續加工,而非靜態稿件。
把 AI 能力嵌進創作協作流程,而非只作為快速輸出按鈕,通過交互引導、驗證與多人協作減少返工。
初步支持數據導入、可視化與洞察輸出,強化了“內容 = 結論 + 表達”的工作鏈路。
這里有一個很關鍵的定位差異:它不是從“空白頁 + prompt”開場,而是從“記錄”開場。即時記錄作為其核心亮點,描述了長按錄音、語音轉文字、并可附加照片、截圖和鏈接的交互路徑。
核心在交付鏈路而非模型能力
先說結論,AnyGen 最有價值的地方在于它把入口前移到語音與多模態記錄,強大的檢索能力,并試圖把終點釘死在可交付文件上。
實際使用之后,AnyGen 的潛在優勢主要體現在三個維度。
1)入口:語音與多模態記錄,解決靈感丟失和二次整理的摩擦
很多人第一次意識到自己真正的工作內容,不是寫作,也不是做 PPT,而是整理。白天開會時你記下了幾句要點。討論結束后,有人把白板拍了張照丟進群里。客戶又補發了一個鏈接,說細節都在里面。
你回到工位才發現,真正消耗時間的是把這些碎片拼到一起。你要先把語音轉成文字,再從文字里提煉結構,再把結構變成一份文檔和一套 PPT,最后還要對齊公司模板和排版習慣。所謂返工,往往從這里開始。
![]()
市面上多數 AI 辦公產品,都患有一種傲慢的“對話框依賴癥”。
它們默認你每次工作都是端坐在工位,對著一個蒼白的空白頁,煞有介事地輸入一段精準的 Prompt,然后靜候生成。但真實的職場哪有這種真空環境?
AnyGen 狠辣的地方在于,它直接把生產力的入口往前推了 100 米:它不逼你寫 Prompt,它只讓你“記錄”。
長按,即是生產:你可以隨時長按錄音,讓語音秒變文字。
多模態全捕捉:照片、截圖、網頁鏈接……所有的“碎片”都可以被一鍵投喂進同一個上下文記錄里。
單看錄音轉文字,手機備忘錄或會議工具都能做,但 AnyGen 真正的殺招在后半程:它不是為了記下這些碎片,而是為了終結記錄之后那段最讓人崩潰的跨工具搬運。
2)中間層:引導式追問與協作式編輯,降低會寫但寫不對的概率
AnyGen 的中間層不只是一個聊天框,它試圖把 AI 從輸出機器改造成加工流程。
入口負責把碎片抓進來,輸出負責把成品交出去,中間層決定這條鏈路是不是可控,是不是能減少返工。對大多數 AI 辦公產品而言,失敗往往發生在中間層。而 AnyGen 針對性的提供了以下幾類核心能力。
首先是結構生成與結構鎖定。材料最難的不是寫句子,而是定結構。結構一旦不對,后面寫得越多,返工越慘。一個有效的中間層應該先生成提綱,并允許你在動筆之前就把框架調到滿意。它不僅要給你一個標題列表,還要說明每一段想回答什么問題,證據放在哪里,結論如何遞進。你改的是骨架,而不是在滿篇文字里找錯。
AnyGen 強調逐步引導和同頁編輯,本質上是在把這一步固定成標準動作。先定結構,再填內容,避免生成直接把你帶進一條錯誤的敘事軌道。
結構化的引導式提問一步步梳理清楚需求,讓產出準確落到想要的方向
第二是版本化迭代與局部重寫。職場寫作的改稿很少是全盤推翻,更多是局部替換。你可能只需要把一段寫得更克制,把一段寫得更適合老板口味,把結論更提前,把邏輯更緊。
AnyGen 支持這種“局部加工”的方式,而不是每次都重新生成整篇。它要能在段落級別、句子級別進行重寫和對齊,同時保持結構不散、口徑不亂。你不必反復復制粘貼,不必在多個工具間切換,也不必擔心改了前面就把后面邏輯帶崩。
每一次修改都精準地局部更新,而不只是全篇重寫
最后是質量控制,尤其是它所強調的生成與驗證機制。對寫作而言,驗證不只是查語法,更重要的是查一致性。比如前后是否自相矛盾,結論是否與證據匹配,時間節點是否沖突,術語是否前后一致,數據口徑是否在不同段落被悄悄換掉。很多返工并非因為“寫得不好”,而是因為這些細小的不一致讓材料看起來不可靠。
AnyGen 能把一致性檢查做成流程動作,至少能把一部分低級錯誤擋在交付之前,讓你的注意力集中在更高階的判斷上。
AnyGen 檢查數據口徑
3)輸出層:Slides 可能是 AnyGen 最有辨識度的抓手
很多工具在網頁端看起來完整、漂亮,但一旦導出到 PPTX,格式錯亂、字體替換、對齊崩壞、元素漂移就會接連出現,最后還是要回到 PPT 里人肉修復。
不僅如此,企業匯報往往有固定模板和品牌規范,標題字號、頁邊距、配色、圖表樣式都要對齊。大量 AI PPT 工具的底層是 Web 卡片或 HTML 頁面,呈現很好看,一旦導出后卻會走樣,省下的生成時間很快會被返工吞掉,甚至比從頭做還更耗精力。
而在 AnyGen,用戶可以像在 PowerPoint 中一樣對頁面元素進行拖拽、調整大小與位置、對齊網格、編輯形狀與表格;支持上傳既有 PPTX 模板,并盡量遵循主版式、字體與配色體系,減少后續對模板的二次適配成本。
圖表部分也被設計為可編輯的原生對象,用戶可以直接更新數值、切換圖表類型、調整樣式,而不需要重新鋪一遍布局。
![]()
實測中,我給 AnyGen 一個很直接的任務:做一份 PPT,系統介紹它的核心功能、優勢與短板,以及所處的競爭格局。生成結果能明顯看出它的思路是“先定結構、再補證據”。框架搭得很快,而且會主動檢索并引入大量外部信息,用來填充論據與對比維度,讓內容不至于停留在產品自述。
![]()
成片的完成度也相當高。PPT是1頁1頁生成的,用戶不需要等完全生成完就可以預覽。版式簡潔、觀感干凈,敘事節奏前后一致。需要挑剔的地方是少數頁面會出現字體、圖標的尺寸不完全匹配,屬于細節層面的排版瑕疵,需要人工快速掃一遍做微調。
![]()
PPT 里的所有元素都保持可編輯狀態,不是生成后就固化成圖片或不可改的“展示稿”,后續無論是按公司模板換字體、改用語,還是補數據、調整頁序,都能順暢接手。
![]()
4)信息檢索和數據分析
這款新產品AnyGen最讓我上頭的,其實是它在“深水區數據”上的穿透力。
誰能想到,AnyGen 竟然把 X 和 Youtube 的數據墻給推倒了!在國產 AI 工具普遍難以觸及 X 這種高質量數據庫的背景下,AnyGen 不僅能自主‘扒’數據,還能順手交出一份模塊化、零亂碼的高標準報告。
對比來看,其他國產AIAgent產品,基本上都做不到。X本身就是非常高質量的數據庫,但是都快被搞成「私域」流量了。
我給 AnyGen 出了一道“地獄級”測試題:“全網搜尋 100 位 5 萬粉以上的 Web 開發 YouTuber,并附上聯系方式。”
這種活兒要是擱以前,至少得讓實習生在 YouTube 搜到眼花,再一個個翻簡介、錄表格。但 AnyGen 沒有急著亂搜,而是先展示了清晰的底層邏輯:確定數據維度 -> 制定來源策略。
![]()
緊接著,它開始表演真正的技術:批量調取候選頻道,后臺自動核對訂閱數,精準篩選頻道定位。看著后臺數據瘋狂跳動,那種“一個人就是一支專業調研團隊”的爽感,確實很驚艷。
![]()
結果呈現也相當完整。
![]()
我試著給它派了個高難度任務:復盤過去30天 X上關于 Qwen 的全球討論聲量,并生成報告。
![]()
這是 AnyGen 給出的一份新鮮出爐的報告(截至 2025-12-29):
毫秒級同步:從海量推文到圖文并茂的中文報告,中間沒有廢話,也沒有漫長的等待。
模塊化彈藥包:報告生成的那一刻,所有的可視化圖表、分析文本、明細表格就已經全部拆解成文件躺在那里了。你需要哪個,秒點下載,甚至連表格亂碼這種低級錯誤都被徹底規避。
拒絕信息堆砌:它不是把網頁文字生硬地甩給你,而是直接把 X 上的碎片情緒轉化成了精美的高質量可視化看板。
這種體驗太超前了。傳統的 DeepResearch 還在那兒慢吞吞地翻網頁、貼鏈接,AnyGen 已經帶著洗好的數據和畫好的圖表,直接把成品空投到你桌面上。
![]()
到此,AnyGen已經展現了強大的產品能力,但短板與不確定性也同樣集中。
一是“組織級使用”的信任成本:AnyGen 以語音、照片、鏈接為核心輸入,就意味著它天然會接觸會議紀要、客戶信息與內部材料,這類內容在企業側的合規要求更高。在國內市場,這往往是套件與協作平臺的天然優勢區。
二是生態與遷移成本:當用戶的文件、模板、協作都在既有體系里,一個新工作空間必須拿出足夠硬的優勢,才能抵消搬出去再搬回來的麻煩。
因此,公允的說,AnyGen 的方向很對,它押的是從碎片到交付的真實痛點。但它的勝負手不在生成速度,而在于能否持續減少返工,尤其是 PPT 這種最難被糊弄的交付物。
行業與競品:AnyGen 面對的是體系戰
目前 AnyGen 僅在海外上線,支持谷歌、蘋果和 Lark 三種賬號登錄。將它放回國內競爭語境里討論,第一步需要做的不是橫向對比功能清單,而是把視角切換到系統位置。
國內用戶并不缺會生成文檔、會生成 PPT 的按鈕,真正稀缺的是誰能把這些按鈕放在最靠近交付的地方、放在最靠近入口的地方、并且把返工成本壓到最低。AnyGen 在海外用“工作空間”講故事更順,是因為海外工具鏈更碎。
但在國內,它會立刻遭遇兩種更強勢、也更現實的競爭力量:一類是辦公套件內生的 AI,另一類是超級入口把做材料做成輕量化消費能力。
第一類競品是辦公套件內生的 AI,以 Office、WPS 這一類為代表。這類競品的底氣不在于生成速度,而在于它們本身就是“交付現場”。 模板、字體、版式規范、協作審閱……這一切都發生在同一個系統內。套件型 AI 默認解決了所有新工具都繞不開的死穴:遷移成本。當你在 WPS 里生成 PPT 時,你不需要搬運數據,也不需要擔心導出走樣。這種“原生”的確定性,是獨立工作空間最難攻克的堡壘。
第二類競品是超級入口把做材料做成輕量化消費能力,這條線里夸克最具代表性。夸克的邏輯是“降維打擊”。它將 PPT 生產從沉重的辦公套件中剝離,變成一種高頻、移動端、隨手可得的輕量消費能力。 這種入口位置帶來的分發效應極其恐怖。當用戶習慣在夸克里快速搭建初稿和框架時,AnyGen 必須證明自己能提供倍數級的交付收益,才可能說服用戶跨過門檻,遷移到新的工作空間。
如果說前兩者是系統位置之爭,那么以 Manus 為代表的通用 Agent 則是范式之爭。 它們不再是某個軟件里的功能點,而是能拆解任務、跑完流程的“數字外包”。它們的殺手锏是。用戶不必再打磨提示詞,只需交代目標。 但 Agent 的深水區也同樣深不見底:動作越多,失敗面越大。在復雜的企業環境下,Agent 任何一個環節的微小偏差,都會導致結果“看起來完整,實則不可用”。這種糾偏成本和信任壁壘,是 Agent 路線至今難以大規模商業化的痛點。
對 AnyGen 而言,它正處于一個腹背受敵的十字路口: 既要對抗套件的交付慣性,又要防御入口產品的流量截流,還要面對通用 Agent 吊高了的市場胃口。
最終能否站住,仍取決于最樸素的指標,在真實工作里,它能否縮短從碎片到交付的距離,并把返工顯著壓下去。
AI 辦公的下一段不是生成,而是交付
如果只把 AnyGen 當作又一個 AI 助手,它并不稀奇,但如果把它當作字節對“AI 辦公下一階段”的一次押注,它的信號很明確。入口前移到語音與多模態記錄,終點必須是可交付文件,中間要把返工變成協作加工。
這里還有一層更值得關注的變量,是它與飛書體系的協同空間。AnyGen 目前支持 Lark 登錄,本身就暗示它可能并不只是一個獨立工具,而是更大協作生態的一塊拼圖。對企業用戶而言,真正的價值不在多一個生產力工具,而在能否進入組織已有的工作流。飛書的文檔、表格、知識庫、群聊和審批是日常協作的骨架,如果 AnyGen 能把語音記錄和多模態輸入轉成結構化文檔與演示材料,并進一步在飛書里完成分發、協作修改、評論審閱與版本管理,它就有機會繞開遷移成本。
可以說,AI 辦公的競爭正在從誰更會生成,轉向誰更能交付。AnyGen 把戰場選在了后者,而這場仗,才剛剛開始。
參考文獻:
[1] https://www.anygen.io/
歡迎掃碼加群參與討論
我們相信認知能夠跨越階層,
致力于為年輕人提供高質量的科技和財經內容。
稿件經采用可獲邀進入Z Finance內部社群,優秀者將成為簽約作者,00后更有機會成為Z Finance的早期共創成員。
我們正在招募新一期的實習生
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.