近日,由釘釘團隊研發(fā)的深度研究系統(tǒng)“Dingtalk-DeepResearch”在國際權(quán)威評測中取得突破性成績,在DeepResearch Bench測試中以48.49分位列全球第二、國內(nèi)第一,超越OpenAI、Claude等主流系統(tǒng)。
![]()
據(jù)悉,該系統(tǒng)已成功應(yīng)用于制造業(yè)、供應(yīng)鏈等復(fù)雜場景,能夠在復(fù)雜異構(gòu)表格、多階段推理與多模態(tài)生成任務(wù)中保持行業(yè)領(lǐng)先的準(zhǔn)確性和穩(wěn)健性,幫助企業(yè)高效處理多模態(tài)數(shù)據(jù),實現(xiàn)智能升級。
釘釘深度研究系統(tǒng)的這項進展,首次實現(xiàn)了國際頂級基準(zhǔn)與實際生產(chǎn)落地的雙重突破,標(biāo)志著中國企業(yè)級AI技術(shù)邁入國際第一梯隊。
讓多個 AI 系統(tǒng)像團隊協(xié)作般解決復(fù)雜問題
Dingtalk-DeepResearch 的核心是設(shè)計了一種面向真實企業(yè)場景的多智能體深度研究框架,將深度研究生成、異構(gòu)表格解析與推理、多模態(tài)報告生成有效整合在同一系統(tǒng)中。
這一設(shè)計就像是將不同專業(yè)能力的團隊成員整合到一個系統(tǒng)中:有的擅長分析表格數(shù)據(jù),有的負(fù)責(zé)生成報告,有的協(xié)調(diào)工具調(diào)用。通過三層架構(gòu)設(shè)計(任務(wù)導(dǎo)向的智能體層、核心引擎層、數(shù)據(jù)層),能夠支撐對復(fù)雜任務(wù)的并行處理與多階段推理,例如將包含多重嵌套與合并單元格的工廠生產(chǎn)表格,自動解析并轉(zhuǎn)化為結(jié)構(gòu)清晰、洞察深刻的分析報告。
在線學(xué)習(xí)與演進機制,讓 AI 持續(xù)進化、越用越聰明
為應(yīng)對企業(yè)場景的動態(tài)變化,該框架區(qū)別于傳統(tǒng)靜態(tài)架構(gòu),通過熵引導(dǎo)、記憶感知的在線學(xué)習(xí)機制使智能體能夠持續(xù)演進,就像員工可通過反復(fù)實踐提升技能,而無需人工干預(yù)。該機制保障系統(tǒng)能自動從歷史交互中歸納經(jīng)驗,逐步適應(yīng)不同企業(yè)的業(yè)務(wù)流程與用戶操作風(fēng)格。
例如,當(dāng)用戶多次修改AI輸出的報告格式后,系統(tǒng)會自主學(xué)習(xí)并記憶用戶對格式、風(fēng)格及關(guān)鍵點的偏好,在后續(xù)生成中主動對齊用戶需求。在釘釘企業(yè)級AI平臺中,這種經(jīng)個性化調(diào)優(yōu)的偏好可以作為一種能力沉淀并共享給團隊乃至整個公司,實現(xiàn)組織知識的復(fù)用與增效。
閉環(huán)評估與優(yōu)化系統(tǒng),保障企業(yè)級 AI 輸出質(zhì)量
為確保生成內(nèi)容的準(zhǔn)確性與可靠性,Dingtalk-DeepResearch內(nèi)置了DingAutoEvaluator評估系統(tǒng)。該系統(tǒng)會對生成的每一份報告進行多維度“質(zhì)量檢驗”,涵蓋數(shù)據(jù)準(zhǔn)確性、邏輯連貫性、工具使用規(guī)范等。一旦發(fā)現(xiàn)問題,系統(tǒng)會自動將相關(guān)案例反饋至訓(xùn)練流程以優(yōu)化模型,形成一套從生成、評估到優(yōu)化的持續(xù)改進閉環(huán)。
供應(yīng)鏈、制造業(yè)超復(fù)雜表格處理,復(fù)雜數(shù)據(jù)"秒懂"
目前,Dingtalk-DeepResearch已在多個真實業(yè)務(wù)場景中穩(wěn)定應(yīng)用并創(chuàng)造價值。在供應(yīng)鏈領(lǐng)域,系統(tǒng)能快速分析跨部門的復(fù)雜表格數(shù)據(jù),為采購策略提供智能化建議;在制造業(yè),它能將設(shè)備運行的原始數(shù)據(jù)自動轉(zhuǎn)化為可視化分析報告,為故障預(yù)測與維護提供決策支持。所有核心功能均通過國際基準(zhǔn)測試驗證,確保了技術(shù)的可靠性與領(lǐng)先性。
釘釘 CTO 朱鴻表示,“Dingtalk-DeepResearch通過結(jié)合自適應(yīng)優(yōu)化和多模態(tài)推理,形成一個可靈活部署的企業(yè)級AI框架,旨在處理復(fù)雜且不斷演進的真實業(yè)務(wù)任務(wù)。該技術(shù)正加速在AI搜索、AI表格、自動化工作流、Agent平臺等產(chǎn)品中落地,讓前沿AI技術(shù)更貼近實際生產(chǎn)需求,為企業(yè)提供真正創(chuàng)造價值的AI。”
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.