11月25日下午,金山辦公舉辦AI協(xié)同辦公大會(huì),旗下WPS 365不僅對(duì)智能文檔庫(kù)AI Docs、數(shù)字員工兩大AI核心產(chǎn)品進(jìn)行煥新升級(jí),更推出AI中臺(tái)、團(tuán)隊(duì)空間等新產(chǎn)品。與此同時(shí),金山辦公聯(lián)合華科發(fā)布的MonkeyOCR v1.5在全球權(quán)威文檔解析評(píng)測(cè)榜單OmniDocBench V1.5中拿下93.01分的成績(jī),獲得綜合性能全球第一。
![]()
MonkeyOCR v1.5再次突破多模態(tài)文檔解析性能上限
經(jīng)過(guò)多年技術(shù)積累,WPS 365的自研算法已具備國(guó)內(nèi)領(lǐng)先的文檔解析能力,能夠精準(zhǔn)識(shí)別PDF文檔中的圖片、表格等信息,大幅提升問(wèn)答精度。特別是在表格解析方面,該算法的表格結(jié)構(gòu)還原的準(zhǔn)確率高達(dá)95%,顯著領(lǐng)先于業(yè)界水平。
在上述國(guó)際權(quán)威測(cè)評(píng)榜單中,金山辦公與華中科技大學(xué)聯(lián)合發(fā)布多模態(tài)文檔解析模型 MonkeyOCR v1.5在通用文檔解析能力上全面超越 PaddleOCR-VL、MinerU2.5、DeepseekOCR 等主流方案,復(fù)雜表格解析準(zhǔn)確率首次突破90%,標(biāo)志著我國(guó)智能文檔處理技術(shù)邁入新階段。
“90%的復(fù)雜表格解析率不是終點(diǎn),而是行業(yè)標(biāo)準(zhǔn)的新起點(diǎn)。” 金山辦公AI研發(fā)總監(jiān)劉強(qiáng)表示,該模型已實(shí)現(xiàn)文本、表格、公式、圖像的全類型解析,輸出格式支持 Markdown、HTML、Json文本等多種形態(tài),可直接對(duì)接企業(yè)OA系統(tǒng)與科研工具。在實(shí)際應(yīng)用中,高校科研人員借助其批量解析論文,將20篇文獻(xiàn)的數(shù)據(jù)整理時(shí)間從2天壓縮至5分鐘。
作為協(xié)同辦公的核心支撐技術(shù),文檔解析長(zhǎng)期面臨復(fù)雜表格識(shí)別、跨頁(yè)結(jié)構(gòu)重建、嵌入式圖像干擾等行業(yè)痛點(diǎn)。傳統(tǒng)OCR系統(tǒng)在處理多層嵌套表格、跨頁(yè)單元格時(shí)精度不足,而端到端模型又存在效率瓶頸。MonkeyOCR v1.5通過(guò)創(chuàng)新的兩階段架構(gòu)以及針對(duì)嵌入圖像、跨頁(yè)表格的專用模塊,成功破解這一難題。
![]()
金山詞霸VS國(guó)內(nèi)外產(chǎn)品
此外,翻譯能力在協(xié)同辦公中是打破語(yǔ)言壁壘、保障協(xié)作效率的關(guān)鍵支撐,直接影響信息傳遞與團(tuán)隊(duì)配合質(zhì)量。金山辦公在“圖片翻譯”方面迎來(lái)新的突破。例如,當(dāng)用戶在金山詞霸中使用“拍照翻譯”功能,無(wú)論是手寫(xiě)文稿、印刷文件,還是異形排版文件,小詞都能夠快速掃描識(shí)別,并精準(zhǔn)翻譯。
據(jù)悉,“圖片翻譯”功能將在金山辦公的各類產(chǎn)品中陸續(xù)上線,其底層技術(shù)依托于金山辦公自主研發(fā)的翻譯模型。該模型在中英翻譯質(zhì)量方面超越了國(guó)內(nèi)外的頭部產(chǎn)品,處于領(lǐng)先地位。此外,金山辦公已將翻譯模型接入到WPS 365產(chǎn)品中,借助“國(guó)際化”戰(zhàn)略,金山辦公正著力將服務(wù)中國(guó)組織級(jí)用戶的產(chǎn)品及定制化能力推向全球市場(chǎng)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.