網易首頁 > 網易號 > 正文申請入駐

百度千帆深度研究Agent登頂權威評測榜單DeepResearch Bench

2026-02-04 17:03:59　來源: 量子位

北京舉報

分享至

2月4日消息，深度研究智能體權威評測榜單DeepResearch Bench公布最新結果，百度千帆深度研究Agent（Qianfan-DeepResearch Pro）憑借卓越的端到端研究能力和極高的報告產出質量，登上測評榜單榜首。

在衡量研究報告含金量的四大核心維度——全面性、洞察力、指令遵循度和可讀性上，千帆深度研究Agent均實現了行業領先。

當前，深度研究（DeepResearch）正成為人工智能進化的關鍵分水嶺。不同于傳統文本生成，深度研究任務要求系統能夠像人類專家一樣，自主執行多步驟、可迭代的認知任務，涵蓋了從復雜需求理解、廣泛信息獲取到深度洞察產出的全過程。

深度研究Agent目前已廣泛應用于學術綜述、金融投研、商業分析等領域，能夠將傳統需數日的手動研究工作壓縮至分鐘級完成，顯著提升研究與決策效率。

作為評價這一前沿賽道能力的“金標準”，DeepResearch Bench填補了通用AI評測在端到端深度研究任務上的空白。

現有的Benchmark多聚焦于單一能力，難以覆蓋長程推理與檢索合成的復雜性。該榜單由領域專家設計了100個博士級別的研究任務，覆蓋22個學科，并引入RACE報告質量評價框架與引文準確性評估，是目前全球范圍內衡量DeepResearch Agent生產力水平最硬核、最真實的評價體系。

?千帆深度研究Agent能夠在此次評測中脫穎而出，得益于優異的技術設計，它采用Agentic架構，通過“任務理解-規劃-執行”循環機制實現端到端研究交付，依托百度搜索與RAG技術保障信息獲取的廣度、可信度與相關性。

兩大重要設計確保了任務執行的準確性，首先采用“由粗到細”的研究路徑展開方式應對任務不確定性；其次，通過深度執行路徑規劃與實時反思機制，系統能在每個研究節點動態評估進展、調整策略，從而有效避免幻覺與路徑偏離，并確保復雜研究任務的高質量完成。

此外，在報告生成階段，千帆深度研究Agent采用獨立的兩階段報告渲染機制：首先產出pivot報告，通過優化相關推理能力，來保證邏輯一致性和內容全面性；之后使用不同的渲染工具，基于pivot報告渲染出最終的markdown、html、ppt等多形態報告，從而實現“一次研究，多形態報告”的交付。

?目前，該深度研究Agent已上線百度千帆平臺，用戶只需輸入復雜調研需求，系統即可在十幾分鐘內生成帶引用的專業級研究報告，真正實現“分鐘級”的深度洞察交付。

?此次登榜是百度千帆 Agent Infra強大支撐能力的集中體現。千帆Agent Infra提供模型、工具、Agent開發、數據及Agent運行環境等一站式開發服務。平臺已累計開發超130萬個Agents，以百度獨家能力“百度AI搜索”為代表的工具日均調用量已突破數千萬次。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

從“起大早趕大集”到“帶領行業趕大集”：百度引領AI內化時代

每日經濟新聞 2025-11-13 16:41:39
0 跟貼 0
AI會革了百度的命嗎？

鈦媒體APP 2025-10-13 18:58:59
547 跟貼 547

參加完百度世界大會，我終于理解了「內化 AI」的正確打開方式

愛范兒 2025-11-13 18:01:50
0 跟貼 0

阿里開源智能體編程模型Qwen3-Coder-Next ，推理成本大降

量子位 2026-02-04 11:01:31
14 跟貼 14
景不動人動，OST-Bench揭示多模態大模型在線時空理解短板

機器之心Pro 2025-10-14 16:42:00
0 跟貼 0

AI能否「圣地巡禮」？多模態大模型全新評估基準VIR-Bench來了

機器之心Pro 2025-10-15 16:05:02
0 跟貼 0

OpenAI Codex再進化：推理速度提升40%，大幅削減編程延遲

華爾街見聞官方 2026-02-04 14:47:01
3 跟貼 3
Win版Claude Cowork殺瘋了！140元雇個全職AI員工，全網首測真香

新智元 2026-02-04 08:48:51
7 跟貼 7

獨家專訪劉知遠、姚遠：為什么真正像人的AI，一定要跑在端側？

DeepTech深科技 2026-02-04 18:30:31
0 跟貼 0
王穎：當前AI應用存在三大痛點

量子位 2025-12-11 03:38:32
0 跟貼 0
港股“子”曰｜六親不認

每日經濟新聞 2026-02-04 16:35:06
0 跟貼 0
六代機殲36第四架試飛，完成了哪些迭代？

瓦大喜哇 2026-02-02 14:28:45
0 跟貼 0
設計師給用戶放手機的地方，以為放的地方，實際上放的地方差距大

白熊愛搞笑 2026-01-31 20:08:33
71 跟貼 71
剛剛，真正好用的Windows版「Cowork」上線了

機器之心Pro 2026-02-04 10:37:17
3 跟貼 3
高活以99.9%濃度NMNH為核心，問鼎高端保健品實力榜單

食品安全與法律網 2026-02-03 09:58:56
1 跟貼 1
《名偵探柯南》與辱華漫畫聯動緊急聲明

極目新聞 2026-02-01 10:34:47
31860 跟貼 31860
中國戰機迭代殺瘋了！殲20悄悄變臉，梟龍竟被巴鐵改成核轟炸機

戰武科普 2026-02-03 17:51:38
0 跟貼 0
我記得美隊要拿一個神奇女俠的模型

C位影視解說 2026-02-04 10:39:31
1 跟貼 1
Insta360 GO Ultra評測：定位清晰的口袋相機，拒絕陽光機？

雷科技 2025-08-21 23:25:29
4 跟貼 4
《三國志8 REMAKE：威力加強版套裝》發售，玩家評測褒貶不一

IT之家 2026-02-02 16:35:17
51 跟貼 51
構造半角模型，初中幾何必考題型

潘小童講數學 2026-02-03 12:17:07
3 跟貼 3
央企核電龍頭牛市走熊，股價跌破回購均價逼近社保基金會認購價

每日經濟新聞 2026-02-04 18:18:04
0 跟貼 0
美媒破大防：越南假想美國入侵卻不忌憚中國

澎湃新聞 2026-02-04 08:21:45
5641 跟貼 5641
2月5日至7日寒潮將影響我國中東部地區安徽江蘇浙江雨雪較強謹防低溫雨雪天氣影響春運

中央氣象臺 2026-02-04 06:47:00
120 跟貼 120
上海這家三甲醫院確認：允許插隊！針對特定人群

看看新聞Knews 2026-02-03 23:15:57
361 跟貼 361
紫牛熱點∣寶馬車杭州一商場內停了8101小時，停車費高達16900元？商場回應來了

揚子晚報 2026-02-03 23:51:06
31 跟貼 31
切記，轉化為將軍飲馬標準模型再作對稱，初中中考幾何壓軸題

潘小童講數學 2026-02-04 13:13:39
1 跟貼 1
V2發動機模型

制造科技 2026-01-31 17:43:18
0 跟貼 0
西安的肉夾饃也太權威了

沒愛又餓了 2026-02-02 12:29:20
7 跟貼 7
70㎡以下、400萬元內老破小要被“掃貨”？上海三區官方啟動收購二手房用于保租房，有工作人員稱“正在試點”，資金到位情況備受關注

每日經濟新聞 2026-02-03 22:51:05
165 跟貼 165
新疆的辣條子拌面也太權威了

沒愛又餓了 2026-02-02 12:51:43
0 跟貼 0
28歲川大博士意大利失聯疑有新線索：有人26日看到疑似他的男子穿藍夾克，點了杯卡布奇諾，姐姐：沒辦法確認，但不想放過任何線索

極目新聞 2026-02-04 03:12:45
1 跟貼 1
深圳水貝杰我睿黃金徹底暴雷，涉及15萬用戶

真探李奧 2026-02-03 09:13:05
0 跟貼 0
雙標？！微信屏蔽元寶紅包鏈接，官方回應：一視同仁

雷科技 2026-02-04 18:19:35
0 跟貼 0
比亞迪將推出王朝首款B級純電SUV

界面新聞 2026-02-04 12:59:05
36 跟貼 36
江蘇中小學春秋假今年春季學期起實施，各放3天

澎湃新聞 2026-02-03 19:55:04
1607 跟貼 1607
地點未定摩擦又起美伊核談判開啟前變數頻生

極目新聞 2026-02-04 06:54:47
272 跟貼 272
男生展示三維立體模型，看出縱深感后，就再也回不去了

理想之聲 2026-02-04 00:21:51
0 跟貼 0
同樣老齡化低，寧夏喪偶率全國最低，新疆為何“反向突出”？

老白讀書 2026-02-04 12:04:16
0 跟貼 0
馬斯克團隊被指密訪中國多家光伏企業

財聯社 2026-02-04 12:04:08
48 跟貼 48

手機 / 數碼

房產 / 家居

百度千帆深度研究Agent登頂權威評測榜單DeepResearch Bench

太煩人遭投訴！元寶紅包鏈接被微信屏蔽

特朗普急于將愛潑斯坦案翻篇 仍有250萬頁文件未公布

特朗普急于將愛潑斯坦案翻篇 仍有250萬頁文件未公布

哈登回應交易:不想讓自己拖累快船的未來

姜元來在大S墓碑前哭泣，與具俊曄擁抱

下一輪金融危機，會由沃什引爆嗎？

綜合續航1730km 5座中級電混SUV吉利銀河M7官圖發布

態度原創

龍湖對面，突然要出新宅地！海口商改住又爆狠料！

這才是中年女人該有的穿搭，上衣挺括、下裝寬松，優雅又顯瘦

圍觀了北京第一屆黑色羽絨服大賽，我笑瘋了

你大意了嗎？

灰白意境 光影奏鳴曲

特朗普急于將愛潑斯坦案翻篇仍有250萬頁文件未公布

特朗普急于將愛潑斯坦案翻篇仍有250萬頁文件未公布

灰白意境光影奏鳴曲