![]()
你是否經歷過這樣的至暗時刻: 明明實驗數據已經跑通,核心邏輯也已梳理完畢,卻在面對空白的 PPT 頁面時陷入停滯; 明明腦海里有清晰的系統架構,卻要在 Visio 或 Illustrator 里跟一根歪歪扭扭的線條較勁半小時; 好不容易用 AI 生成了一張精美的流程圖,卻發現上面的文字是亂碼,或者為了改一個配色不得不重新生成幾十次……
在內容生產的過程中,“寫” 往往只占了一半,而將文字轉化為結構圖、流程圖,再整理成演示用的 PPT,這個過程繁瑣、耗時,且極度考驗設計感。為什么我們不能讓 AI 像理解文字一樣,理解我們的邏輯,并自動幫我們要展示的 “視覺物料” 準備好?
為了解決這一痛點,北京大學 DCAI 課題組基于自動化數據治理 Agent 框架DataFlow-Agent,推出了全新的多模態輔助平臺 ——Paper2Any
![]()
![]()
它不再是一個簡單的 “文生圖” 工具,而是一整套自動化的內容視覺化 Workflow。從閱讀資料、理解邏輯,到生成圖像、切割元素,最終輸出完全可編輯的 PPT 和 SVG 文件,Paper2Any 正在試圖重塑我們準備 Presentation 的方式。
- 本地部署方式:https://github.com/OpenDCAI/Paper2Any?tab=readme-ov-file#-linux-% E5% AE%89% E8% A3%85
- 網頁體驗地址:http://dcai-paper2any.nas.cpolar.cn/
- 文章多模態工作流 Paper2Any:https://github.com/OpenDCAI/Paper2Any
一、 核心突破:打破 “不可編輯” 的魔咒
目前市面上的 AI 繪圖工具雖然效果不錯,但在科研與辦公等場景下有一個致命缺陷:生成的圖片是 “死” 的。 文字無法修改,模塊無法拖拽,風格難以統一。
![]()
工作流實現邏輯
![]()
生成示例PPT繪圖
Paper2Any 的核心差異在于它實現了從邏輯到結構化元素的映射。
系統內置的智能體首先對輸入的文章或文本進行語義分析,提取核心貢獻與思路。接著,它不僅生成視覺圖像,更進一步對草稿圖進行圖文內容分割 —— 自動識別其中的文字、圖表、結構模塊、圖標,并記錄每個元素的元數據。
這意味著,你拿到的不再是一張不可直接修改的 PNG,而是一組獨立、分層、可操作的圖文塊。用戶可以在 PPT 中自由移動、編輯、替換、重新布局。(Paper2PPT 和 PPTPolish 功能暫時僅支持輸出 PDF,可通過 PDF2PPT 功能將其結果轉為可編輯 PPTX)
二、 功能全景:從草稿到演示的自動化閉環
Paper2Any 目前支持的功能主要涵蓋以下四大核心場景,旨在解決從 “輸入素材” 到 “最終匯報” 的最后一公里問題。
Paper2Figure:智能科研繪圖,草圖變精圖
![]()
用戶無需從零學習復雜的矢量繪圖軟件。Paper2Figure 支持多模態輸入(PDF、文本、甚至隨手畫的草圖截圖),系統便能自動識別你的意圖。
- 模型架構圖: 上傳論文或描述,系統自動梳理模塊連接關系,生成清晰的架構圖。支持生成 SVG 和 可編輯 PPTX,圖里的方框、線條都能動。
- 技術路線圖: 無論是中文還是英文,系統能根據方法論自動繪制流程與邏輯步驟。
- 實驗數據圖: 扔給它一堆實驗數據文本或表格,它能自動轉化為可視化的對比柱狀圖或折線圖。
Paper2PPT:文章結構化解析與 PPT 生成
![]()
這是為 “趕進度” 的研究者和職場人準備的救星。Paper2PPT 不僅僅是簡單的摘要生成,它利用算法對文檔結構進行深度語義分析,提取背景、方法論、關鍵圖表。
- 三種輸入模式: 直接上傳 PDF 論文、粘貼長文本、或者僅僅輸入一個研究 Topic(系統會自動深度搜索)。
- 自定義設置: 支持用戶自定義幻燈片頁數、風格及自由選擇中英文語言;支持逐頁生成 PPT,用戶可自由調整每頁 PPT 的大綱。
- 超長 PPT 支持:首次支持制作超過 40 頁的超長 ppt,無論是綜述的演示還是深入研究某個主題都能一次滿足!
- 中文適配與呈現: 可解決大模型生成 PPT 字體怪異及表達僵硬問題。輸出結果采用標準中文字體與規范的排版,文案邏輯自然流暢,可減少 “AI 痕跡”,滿足正式場合演示需求。
![]()
PDF2PPT:讓靜態文檔可編輯
![]()
你是否遇到過這種情況:手里只有一份 PDF 格式的講義或報告,卻需要對其進行修改和匯報?
PDF2PPT 模塊利用MinerUSAM(Segment Anything Model) 模型,像 “拆積木” 一樣對版面進行高精度解析,將原本鎖死的 PDF 頁面還原為可編輯的 PPTX。
- 黑科技加持: 系統集成了Gemini Nano模型進行圖像內補(Inpainting)。當系統將文字提取出來后,會自動修復文字覆蓋區域的背景,實現 “去字留影”,最大程度還原原始底圖的視覺效果。
PPTPolish:交互式美化專家
如果你的 PPT 內容已經寫好,但排版卻有些簡陋,PPTPolish 可以接手后續的美化工作。系統會自動分析頁面并生成美化提示詞,用戶可以逐頁修改提示詞來微調美化方向。
![]()
三、 示例高能時刻:從輸入到輸出的 “視覺魔法”
空口無憑,我們來看看 Paper2Any 的實際表現。
科研繪圖:拯救手殘黨
- 模型架構圖生成:
1. 論文 PDF → 符合論文主題的架構圖
![]()
2. 科研配圖 / 示意圖截圖 → 可編輯 PPTX
![]()
3. 論文摘要文本 → 可編輯架構圖
![]()
- 技術路線圖智能梳理:
1. 論文 PDF → 符合論文主題的技術路線圖
![]()
2. 論文摘要文本 → 符合論文主題的技術路線圖
![]()
- 實驗數據可視化:
1. 論文 PDF → 自動提取實驗數據繪制 PPT
![]()
![]()
不同類型與不同風格的生成圖示例
2. 論文實驗表格文本 → 自動整理實驗數據繪制 PPT
![]()
PPT 智能生成與美化
從文檔到演示,Paper2Any 提供了全鏈路的解決方案。
- Paper2PPT:
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
與 Gemini 3 Pro、NotebookLM 相比,Paper2Any 生成的 PPT 有以下優勢:
- 結構化圖表生成能力強
- 中文文字表達與字體呈現效果更自然
- 可讀性更好,干貨更多,排版布局更具專業感與人工感
- PDF2PPT:
![]()
- PPTPolish:
1. PPT 增色美化
![]()
2. PPT 潤色拓展
![]()
原始 PPT 只是簡單的文字羅列;潤色后,系統自動添加了科技感背景、可視化圖標、以及邏輯圖示,瞬間提升匯報檔次。
四、 如何使用與部署
Paper2Any 提供兩種使用方式:
1. 本地部署(開發者推薦)
如果你希望深入研究、二次開發或本地運行,可以基于 Github 倉庫進行本地部署。
- Github 倉庫: https://github.com/OpenDCAI/Paper2Any
- 快速開始指引: https://github.com/OpenDCAI/Paper2Any?tab=readme-ov-file#-linux-% E5% AE%89% E8% A3%85
參考 Readme 文檔啟動 Web 前端即可。
2. 網頁版快速體驗
團隊已推出可視化的 Web 前端,支持拖拽上傳與實時進度展示。新用戶可免費注冊,登錄后可查看歷史使用記錄。
- 訪問地址: http://dcai-paper2any.nas.cpolar.cn/
結語:讓配圖成為一種「自動獲得的附加值」
Paper2Any 的愿景,是希望建立一條新的科研與工作慣例:寫文章 + 一鍵配圖 + 一鍵生成 PPT + 一鍵展示
在未來,課題組計劃陸續支持Paper2Rebuttal(論文返修)、Paper2Idea(創新點生成)和Paper2Poster(文章海報生成)等更多的多模態功能。我們相信,工具的價值在于釋放人類的創造力,讓你從繁瑣的格式調整中解脫出來,將寶貴的時間投入到那些真正閃光的 Idea 之中。
歡迎大家關注使用 DCAI 的開源項目并與我們進行技術交流,如果覺得好用也請在 GitHub 倉庫點一個 star ~
Data-centric AI 開源項目:
文章多模態工作流 Paper2Any: https://github.com/OpenDCAI/Paper2Any
自動化數據治理 Agent 框架 DataFlow-Agent: https://github.com/OpenDCAI/DataFlow-Agent
LLM 數據準備系統 DataFlow (1.9k star): https://github.com/OpenDCAI/DataFlow
DataFlow 技術報告(#1 of the Hugging Face daily paper): https://arxiv.org/abs/2512.16676
LLM 數據訓練系統 DataFlex (基于 LLaMA-Factory): https://github.com/OpenDCAI/DataFlex
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.