<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<style id="4nznu"></style>

<sup id="4nznu"></sup>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

科研寫作神器，超越Mathpix的科學公式提取工具已開源

2025-08-05 17:34:47　來源: 機器之心Pro

河北舉報

0

分享至

LaTeX公式的光學字符識別（OCR）是科學文獻數字化與智能處理的基礎環節，盡管該領域取得了一定進展，現有方法在真實科學文獻處理時仍面臨諸多挑戰：

其一，主流方法及公開數據集多聚焦于結構簡單、符號單一的公式，難以覆蓋多學科、高難度的復雜公式；其二，實際文檔中廣泛存在的多行公式、長公式、分段公式及頁面級復雜排版等情況尚未得到充分關注與處理；其三，大多數方法依賴專用模型，通常需要針對特定任務進行專門設計，難以實現通用性和擴展性。

針對上述挑戰，DocTron 團隊提出了系統性解決方案。

首先，針對現有數據集覆蓋面有限、結構單一的問題，構建了涵蓋多學科、多結構的大規模高難度數據集CSFormula，包含行級、段落級和頁面級的復雜排版。

其次，團隊提出的DocTron-Formula 模型突破了對特定結構建模的依賴，采用通用大模型驅動的復雜公式識別方法，僅需簡單微調即可適配多樣化應用場景。

最后，相比于最優的定制化公式識別模型，該方法不僅在主流的開源評測中取得了優秀的性能表現，在實際應用中常見的頁面級、段落級復雜排版場景中也取得了顯著優勢，推動了公式識別的應用邊界。

DocTron 是一個在通用視覺語言模型架構上實現結構化內容解析和理解的開源項目，而無需定制化的模塊開發，覆蓋通用文檔、學科公式、圖表代碼等場景。

論文標題：DocTron-Formula: Generalized Formula Recognition in Complex and Structured Scenarios
論文鏈接：https://arxiv.org/abs/2508.00311
Github 鏈接：https://github.com/DocTron-hub/DocTron-Formula
項目開源地址：https://huggingface.co/DocTron

創新點與技術突破

（1）高難度多結構數據集構建。研究團隊自主設計高效的數據采集與處理流程，系統性地從高質量學術資源中收集、清洗并整理了大量多學科的復雜公式樣本，構建了 CSFormula 數據集。

該數據集涵蓋數學、物理、化學等領域，包含行級、段落級和頁面級的復雜排版，更真實地反映了文獻中公式的多樣性與挑戰性，為模型訓練與評測提供了堅實基礎。

（2）通用大模型驅動的復雜公式識別。研究團隊突破了對結構定制和專用架構的依賴，直接利用 Qwen2.5-VL 等通用大規模多模態預訓練模型，并通過在高難度數據集上的有監督微調實現領域適配。

實驗結果表明，大模型憑借強大的知識遷移和結構泛化能力，僅需簡單微調即可在復雜場景下取得 SOTA 性能，無需繁瑣的工程設計或人工規則，顯著提升了復雜公式識別的通用性和實用性。

實驗結果與性能表現

實驗結果顯示，DocTron-Formula 在各類公開基準測試及自建 LaTeX 公式識別數據集上均表現出色。在編輯距離和 CDM 兩個指標下，不僅超越了現有專業工具 Mathpix，在多個任務上也優于 GPT-4o 和 Gemini-2.5-flash 等主流閉源大模型。

研究意義與應用前景

本研究不僅推動了復雜公式識別技術的發展，也為相關領域開辟了新的研究思路：

首次系統構建了覆蓋多學科、多結構的大規模高難度數據集 CSFormula，為復雜公式識別的模型訓練和評測提供了堅實的數據支撐；
驗證了通用大模型（如 Qwen2.5-VL）在復雜公式識別任務中的強大適應性和泛化能力，顯著簡化了模型開發流程，減少了對專用設計和人工規則的依賴；

在應用層面，DocTron-Formula 有望服務于科學文獻解析、學術知識檢索和教育資源智能化等多元場景，為科研、教育和信息服務等領域的自動化與智能化提供有力支撐。

結論

DocTron-Formula推動了學科公式理解在行級、段落級、頁面級復雜排版場景的應用，強調無需定制化的算法模塊，通過高質量數據的構建和通用模型訓練，實現開源評測和現實應用評測的全面提升。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

謝賽寧REPA得到大幅改進，只需不到4行代碼

機器之心Pro 2025-12-15 16:10:19
0 跟貼 0
讓LLM不再話癆，快手HiPO框架來了

機器之心Pro 2025-11-03 15:10:48
0 跟貼 0

成本0.3美元，耗時26分鐘！CudaForge：顛覆性低成本CUDA優化框架

機器之心Pro 2025-11-17 18:45:03
0 跟貼 0

低調霸榜全球最難SQL榜單超兩月，國產AI這次選擇高調開源！

量子位 2025-12-14 21:12:31
6 跟貼 6
你刷到的視頻是真的么？用物理規律拆穿Sora謊言

機器之心Pro 2025-11-05 16:27:02
0 跟貼 0

省屬211首發數學四大刊!蘇大60億砸出成效,網友：還說"大而不強"

Delete丨CC 2025-12-15 23:27:50
1 跟貼 1

河北孟村：“奇趣科學秀”進校園點亮青少年科學夢

人民資訊 2025-12-15 10:12:15
0 跟貼 0
Thinking Machines產品更新：K2 Thinking、Qwen3-VL都可以微調

機器之心Pro 2025-12-15 18:29:27
0 跟貼 0

給葫蘆戴上模型，想要的樣子全都有，價值在上千到上萬不等

嗨皮速遞 2025-12-13 09:46:34
1 跟貼 1
澳大利亞全國降半旗悼念；悉尼海灘英勇奪槍男子需接受手術，此前無用槍經驗

揚子晚報 2025-12-15 10:08:44
3414 跟貼 3414
PixelRefer ：讓AI從“看大圖”走向“看懂每個對象”

機器之心Pro 2025-11-11 12:49:23
0 跟貼 0
乘客懵了：備注“不出高速費”卻被拉去走國道！車主：規則沒

解壓小劇場 2025-12-14 10:56:24
7 跟貼 7
高考604分就讀高職！她的目標：電子對抗專業兵

環球網資訊 2025-12-15 09:04:05
3564 跟貼 3564
公園回應永歷帝趴泥中雕塑引爭議

現代快報 2025-12-15 17:39:59
2633 跟貼 2633
美國警察實拍六車道沒一輛敢開過去真正的規則威懾力

笑場速遞 2025-12-15 08:14:42
3 跟貼 3
新能源車為何“修不起”?是技術壁壘還是行業壟斷?

究竟視頻 2025-12-13 21:04:05
0 跟貼 0
新式警服來了！公安部：嚴格落實“緊日子”要求逐年按需換舊

南方都市報 2025-12-15 18:14:17
2076 跟貼 2076
小伙從上海坐高鐵出發，1200公里路程只花了61元，還是一等座！為何這么便宜？他是這么操作的→

大風新聞 2025-12-15 15:10:35
663 跟貼 663
長知識了，原來英語不用硬背，奇怪的方式進入大腦！

笑出豬叫的趣聞閣 2025-12-15 16:43:02
1 跟貼 1
吸煙真有害健康嗎？英國煙草公司用狗做實驗，真相令人后怕

探謎未知世界 2025-12-14 20:12:40
4 跟貼 4
深度 | 讓地平線的子彈飛一會兒

時間線Timelines 2025-12-15 16:45:01
0 跟貼 0
訓練老鼠玩《毀滅戰士》的實驗取得新進展：鼠鼠現在學會開槍射擊了！

簡明科學指南 2025-12-15 11:16:59
2 跟貼 2
中央生態環保督察通報天津部分地區生態保護和修復治理短板明顯

澎湃新聞 2025-12-15 14:23:09
96 跟貼 96
九天無人機首飛改寫空戰新規則

臧老師 2025-12-14 21:09:11
1 跟貼 1
731原成員講述凍傷實驗細節：待在-20℃甚至-25℃的環境里

學申論的談妹 2025-12-12 12:49:09
0 跟貼 0
井松智能董事長姚志堅：以AI算法驅動物流自主協作，助力海南自貿港封關升級

每日經濟新聞 2025-12-15 17:57:59
0 跟貼 0
江蘇省政府批復，同意評定陳永泰為烈士

環球網資訊 2025-12-15 16:44:18
132 跟貼 132
外交部：對巖崎茂采取反制措施

界面新聞 2025-12-15 10:04:04
1333 跟貼 1333
美高層坦言：F-35、F-16戰備指標凄慘，中國實力驚人，影響幾何？

伊人若夢u 2025-12-15 00:47:21
4 跟貼 4
NeurIPS 2025｜指哪打哪，可控對抗樣本生成器來了！

機器之心Pro 2025-12-15 17:48:40
3 跟貼 3
一等一的科研人才，在各自領域發光發熱，堪稱科學界的頂流

愛笑集中營 2025-12-15 12:03:49
1 跟貼 1
為什么日本要修建一條垂直馬路？花費21億不說，還不讓車經過

二毛走世界_1 2025-12-14 07:02:19
0 跟貼 0
每周質量報告丨約車“張冠李戴” 司機收入縮水獨家調查網絡貨運消費亂象

央視新聞客戶端 2025-12-14 16:21:03
820 跟貼 820
為什么說恐龍模型，可能會完全錯誤呢？

星星科普 2025-12-11 17:38:30
9 跟貼 9
外網熱評：中式作戰新規則！實力到底有多強？外國網友：中國厲害

沙果嘮生活 2025-12-15 13:37:41
0 跟貼 0
西方學者：漢字是全球唯一超越時空的文字，這一優勢碾壓英語！

鯨探所長 2025-12-14 21:35:28
0 跟貼 0
初中數學求值，不要想著立法和立方差公式

天天數理學習分享 2025-12-15 18:56:30
4 跟貼 4
麥當勞漲價

大象新聞 2025-12-15 11:45:03
1632 跟貼 1632
布克：我無論如何都不該犯規狄龍投進的那記三分本該是絕殺球

北青網-北京青年報 2025-12-15 17:20:08
142 跟貼 142
大摩重磅機器人年鑒（二）：機器人"逃離工廠"，訓練重點從“大腦”轉向“身體”，邊緣算力有望爆發

華爾街見聞官方 2025-12-15 20:33:06
1 跟貼 1

馬興全與他的深圳生意

法經網

2025-12-15 17:52:35

何晴去世后續：同學曝其生前諸多苦惱，兒子出生戶口不能上自己家

何晴去世后續：同學曝其生前諸多苦惱，兒子出生戶口不能上自己家

古希臘掌管月桂的神

2025-12-15 09:52:22

爭議！總決賽不和諧一幕：王曼昱4-2奪冠僅2個小時，球迷留言不滿

爭議！總決賽不和諧一幕：王曼昱4-2奪冠僅2個小時，球迷留言不滿

大秦壁虎白話體育

2025-12-15 10:43:06

又放大招了！為鼓勵生孩，2026年實施生孩“零自付”，評論區炸鍋

又放大招了！為鼓勵生孩，2026年實施生孩“零自付”，評論區炸鍋

火山詩話

2025-12-15 18:11:48

大家如何看待“吃瓜蒙主”現象呢？我來說說，我自己的三點看法！

大家如何看待“吃瓜蒙主”現象呢？我來說說，我自己的三點看法！

翻開歷史和現實

2025-12-14 00:27:30

持續五個多小時，美國特使稱美烏會談取得“重大進展”！澤連斯基：同意接受類似“北約第五條”安全保障！俄方發聲

持續五個多小時，美國特使稱美烏會談取得“重大進展”！澤連斯基：同意接受類似“北約第五條”安全保障！俄方發聲

每日經濟新聞

2025-12-15 07:04:11

中方發出唁電，美國全國將降半旗，拜登籌劃國葬

中方發出唁電，美國全國將降半旗，拜登籌劃國葬

趣生活

2025-12-15 20:12:25

利潤20倍，成本70賣上千！央視再曝光新騙局，已經大量老百姓上當

利潤20倍，成本70賣上千！央視再曝光新騙局，已經大量老百姓上當

法老不說教

2025-12-16 01:10:07

交警確認：杭州小米交付中心發生車禍

交警確認：杭州小米交付中心發生車禍

第一財經資訊

2025-12-15 20:51:01

61歲演員何晴去世，好友公開住院照，瘦了很多，變化太大難認出

61歲演員何晴去世，好友公開住院照，瘦了很多，變化太大難認出

180視角

2025-12-14 17:06:13

小米交付中心發生車禍，最新回應

小米交付中心發生車禍，最新回應

澎湃新聞

2025-12-15 23:56:03

不到48小時，中企承建大橋被炸，泰軍方封海，特朗普的調解已失敗

不到48小時，中企承建大橋被炸，泰軍方封海，特朗普的調解已失敗

策略述

2025-12-15 21:19:50

24歲許何悼念母親，曝何晴臨終前狀態，哽咽說悼詞看哭網友！

24歲許何悼念母親，曝何晴臨終前狀態，哽咽說悼詞看哭網友！

古希臘掌管月桂的神

2025-12-15 17:40:53

瘋了！單場4紅牌！豪門15輪不勝+墊底！賽后全隊沉默抗議

瘋了！單場4紅牌！豪門15輪不勝+墊底！賽后全隊沉默抗議

足球大號

2025-12-15 14:58:49

中國紅十字會：全國累計登記人體器官捐獻者已超728萬人

中國紅十字會：全國累計登記人體器官捐獻者已超728萬人

紅星新聞

2025-12-15 23:03:50

震驚！網傳寧波餐飲老板集體“斷外賣”，本以為自尋死路結果爆火

震驚！網傳寧波餐飲老板集體“斷外賣”，本以為自尋死路結果爆火

火山詩話

2025-12-15 05:40:15

CBA瘋狂一夜！廣廈慘敗遼籃，北京破紀錄大勝新疆，青島兩連勝

CBA瘋狂一夜！廣廈慘敗遼籃，北京破紀錄大勝新疆，青島兩連勝

多特體育說

2025-12-15 21:51:47

全網沸騰！2025式新警服正式亮相！細節更是藏著太多務實與暖心

全網沸騰！2025式新警服正式亮相！細節更是藏著太多務實與暖心

老特有話說

2025-12-16 02:20:03

霉霉發近2億獎金，團隊當場哭成一片，全網打工人破防

霉霉發近2億獎金，團隊當場哭成一片，全網打工人破防

胡嚴亂語

2025-12-15 15:48:25

孫穎莎王楚欽剛退賽，壞消息又來了

孫穎莎王楚欽剛退賽，壞消息又來了

最愛乒乓球

2025-12-15 08:36:58

機器之心Pro

專業的人工智能媒體

11925文章數 142511關注度

往期回顧全部

科技要聞

大佬冷酷預言：未來15年人形機器人成廢鐵

頭條要聞

交警確認小米交付中心發生車禍小米內部人士回應

頭條要聞

交警確認小米交付中心發生車禍小米內部人士回應

體育要聞

戰勝完全體雷霆，馬刺“瘋狂動物城”只是半成品

娛樂要聞

何晴告別式現場，前夫許亞軍雙眼泛紅？

財經要聞

新農合漲到400元農民斷繳背后的扎心真相

汽車要聞

主駕配按摩還可選6座新款捷途X90PRO售13.59萬起

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

游戲

數碼

公開課

軍事航空

親子要聞

寶寶為啥一出門就不鬧了？真相不是“看新鮮”，90%家長沒琢磨透

當手機能自動清每日任務，玩家天天上線是為了什么？

數碼要聞

藍寶石喊話AMD等GPU制造商：給我們芯片和顯存，放開設計自由

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
明末究竟有多難，無法阻止的歷史進程
李彥宏：百度離破產30天

軍事要聞

澤連斯基稱烏方已妥協不加入北約俄方發聲

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：嘉祥县| 亚洲一区黄色| 国产资源视频| 自拍偷拍第一页| 性xxxx欧美老妇胖老太性多毛| 韩国日本三级在线观看 | 99国产精品欧美一区二区三区| 夊夊夊夂夂夂夂夂夂夂亚洲亚洲亚洲亚洲色色色 | 亚洲精品日韩在线丰满| 内射在线播放| 鹤岗市| 红桃视频成人传媒| 国产亚洲AV| 亚洲VA| 当阳市| 国产在线拍揄自揄拍无码视频| 在线免费不卡视频| 蜜臂AV| 777精品成人a?v久久| 久久亚洲V无码专区成人| 中文毛片无遮挡高潮免费| 亚洲av片在线免费观看| 日本久久中文字幕| 唐海县| 黄瓜视频在线观看| 人妻中文字幕在线视频无码| 综合Av| 99国产三级| 又大又粗欧美黑人aaaaa片| 亚洲最大有声小说AV网| 日日噜噜夜夜久久亚洲一区二区| 亚洲欧洲无码线中字幕| 国产女同疯狂作爱系列| 亚洲AV无码国产永久播放蜜芽| 亚洲中文视频| 欧美?日韩?人妻| 韩国无码av片在线观看网站| 樱桃视频影院在线播放| http://m.hzhuiwan.cn/| 正在播放东北夫妻内射| www片香蕉内射在线88av8|

<style id="n8va3"></style>

<sub id="n8va3"></sub>

<p id="n8va3"></p>

<sub id="n8va3"></sub>

<cite id="n8va3"></cite>