網易首頁 > 網易號 > 正文申請入駐

谷歌深夜重磅開源！深度研究Agent拿下SOTA，比GPT-5 pro便宜90%

2025-12-12 08:13:09　來源: 智東西

北京舉報

分享至

智東西
編譯程茜
編輯心緣

智東西12月12日消息，今日凌晨，比OpenAI早一個小時，谷歌甩出了3個Agent大招：

Deep Research Agent功能更新，并首次向開發者開放；開源新網絡研究Agent基準DeepSearchQA，旨在測試Agent在網絡研究任務中的全面性；推出新交互API（Interactions API）。

Gemini Deep Research是一款專為長期上下文采集和綜合任務優化的Agent，其背后的模型是Gemini 3 Pro，通過多步強化學習的擴展搜索，Agent能夠自主地以高精度導航復雜的信息環境。此次更新包括針對特定數據進行網頁搜索、更低成本生成研究報告等。

谷歌DeepMind產品經理路卡斯·哈斯（Lukas Haas）在社交平臺X上透露，新Gemini Deep Research Agent已經實現SOTA，在谷歌新基準測試上得分46.4%，在BrowseComp上與GPT-5 Pro相當，價格是其1/10左右。

Deep Research Agent很快將在谷歌搜索、筆記本、谷歌金融中提供，并在Gemini應用中升級。

DeepSearchQA內置了900個手工設計的“因果鏈”任務，涵蓋17個領域，可以評估Agent在復雜、需要多步查詢信息等任務上的能力。

交互API作為其與Gemini模型和Agent的統一交互界面，通過Google AI Studio中的Gemini API公開測試版向開發者開放。開發者可以通過Agent開發套件（ADK）和A2A協議使用交互API。

有網友評論，谷歌這是把“一個數字版的福爾摩斯交給了開發者”，現在你只需要一邊喝咖啡，一邊就能讓每個應用像寫論文一樣展開深度調查。

DeepSearchQA開源地址：https://www.kaggle.com/benchmarks/google/dsqa/leaderboard

一、Deep Research Agent：更新網頁搜索、低成本生成研究報告功能

谷歌博客稱，Deep Research背后的Gemini 3 Pro模型是他們迄今為止最真實的模型，該模型經過專門訓練，旨在減少幻覺并最大化復雜任務中的報告質量。

Deep Research通過迭代式流程運行，它會提出問題、閱讀結果、識別知識空白，然后再次進行搜索。其新版本大幅提升了網頁搜索功能，使其能夠深入網站查找特定數據。

新Gemini Deep Research Agent在完整HLE測試中達到46.4%，Gemini 3 Pro為43.2%，GPT-5 Pro為38.9%。在DeepSearchQA、BrowseComp的測試中以微小優勢勝出。

谷歌還優化了該Agent以更低成本生成深度研究報告的功能。

Gemini Deep Research Agent已經在需要高精度和基于早期反饋、測試的復雜領域應用，包括金融服務、生物技術和市場調研等行業，這些領域都可以利用Gemini Deep Research完成初步調研任務。

對于構建下一代自動化研究工具的開發者來說，Gemini Deep Research Agent能夠綜合信息并生成詳細報告：

統一信息綜合：Gemini Deep Research通過文件上傳和文件搜索工具分析用戶的文檔和公共網絡數據，還能處理長上下文，允許用戶直接在提示中放置大量背景信息；

報告可控性：用戶可以通過提示定義結構、頭部，或指定數據表生成和格式來控制輸出；

詳細引用：其會提供細粒度的來源，允許用戶驗證數據來源；

結構化輸出：支持JSON模式輸出，便于下游應用解析研究結果。

二、DeepSearchQA：新Agent基礎，涵蓋17大領域、900條任務

DeepSearchQA是Deep Research Agent的測試基準。

現有基準測試往往無法反映現實世界多步網絡研究的復雜性，谷歌開源新基準DeepSearchQA，是用于評估Agent在復雜、需要多步查詢信息等任務上。

DeepSearchQA有900個手工設計的“因果鏈”任務，涵蓋17個領域，每一步都依賴于事先分析。與傳統的基于事實的測試不同，DeepSearchQA衡量的是全面性，要求Agent生成詳盡的答案集。這不僅評估研究的準確性，也包括檢索的記憶能力。

DeepSearchQA還可以作為衡量“思考時長”效率的工具。谷歌在內部評估中發現，當允許Agent執行更多搜索與推理步驟時，其性能會獲得顯著提升。

三、交互API：集成專為Agent應用開發設計的接口

交互API原生集成了一套專屬接口，該接口專為Agent應用開發場景設計，可高效處理交錯式消息、思維鏈、工具調用及其狀態信息的復雜上下文管理工作。除Gemini模型套件外，交互API還提供其首個內置Agent Gemini Deep Research Agent。

下一步，谷歌將擴展其內置Agent，并提供構建和引入其他Agent的功能，這將使開發者能夠通過一個API連接Gemini模型、谷歌內置Agent和開發者的定制Agent。

交互API提供了一個單一的RESTful端點，用于與模型和Agent交互。

通過指定模型參數與模型交互：

通過指定Agent參數與Agent互動，目前支持deep-research-pro-preview-12-2025：

交互API通過現代Agent應用所需的功能擴展了生成內容的核心功能，包括：

可選的服務器端狀態：能夠將歷史管理卸載到服務器。這簡化了開發者的客戶端代碼，減少了上下文管理錯誤，并通過增加緩存命中率可能降低成本。

可解釋和可組合的數據模型：一個為復雜的Agent歷史設計的干凈圖式。開發者可以對交錯的信息、思維、工具及其結果進行調試、流式分析和推理。

背景執行：能夠將長期運行的推理環路卸載到服務器，而無需維護客戶端連接。

遠程MCP工具支持：模型可以直接調用模型上下文協議（MCP）服務器作為工具。

結語：Gemini生態再擴容，谷歌簡化Agent開發模式

目前，Deep Research Agent已經在金融、科學研究等諸多領域有所應用。此次谷歌不僅更新了這一Agent，還發布了交互API，以簡化與Gemini模型和Agent的交互流程，構建更易用的開發生態。

谷歌博客提到，其未來的更新還將聚焦于更豐富的輸出，如原生生成圖表以支持可視化分析報告，以及通過模型上下文協議（MCP）支持擴展連接性，更輕松地訪問自定義數據源，并努力將Gemini Deep Research引入企業用的Vertex AI。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

躲在流量后面的人，被監管點名了

鈦媒體APP 2025-12-11 22:38:32
0 跟貼 0
開發者為什么集體涌入小紅書？

雷科技 2025-12-09 20:58:30
0 跟貼 0

早報｜OpanAI發布GPT-5.2回應競爭/B站辟謠「所有視頻都要會員」：已報警/OPPO整合AI部門，打造全新「超級小布」

愛范兒 2025-12-12 08:33:19
0 跟貼 0

GPT-5.2“發布在即”，微軟CEO宣布：周五將揭曉“下一代”Agentic AI模型

華爾街見聞官方 2025-12-11 14:06:25
3 跟貼 3
a16z看上了一家AI教育創企，前Spotify高管創辦，融資超億元

智東西 2025-12-11 18:49:02
0 跟貼 0

GPT-5.2來了！OpenAI稱其為“最強專業知識工作大模型”

財聯社 2025-12-12 03:45:09
1 跟貼 1

下一代谷歌頭顯，XREAL x Google 定義混合現實頭顯

愛范兒 2025-12-10 05:12:08
0 跟貼 0
黃仁勛：中國的AI市場無論有沒有英偉達都會進步與華為是競爭對手不是敵人

財聯社 2025-07-21 10:22:14
7 跟貼 7

谷歌新XR眼鏡薄如普通眼鏡，2026年就能買到

極果酷玩 2025-12-10 03:55:10
0 跟貼 0
花一萬元植入DeepSeek，一場沒有終點的流量游戲

36氪 2025-09-05 13:09:55
3 跟貼 3
若不做出更多讓步，谷歌或因Google Play涉嫌違規遭歐盟罰款

界面新聞 2025-12-11 08:54:36
0 跟貼 0
中信證券：建議關注算力基建和應用落地等層面的機會

界面新聞 2025-12-10 08:50:41
0 跟貼 0
“九天”無人機成功首飛

財聯社 2025-12-11 09:38:05
20166 跟貼 20166
當Search Agent遇上不靠譜搜索結果，清華團隊祭出自動化紅隊框架

機器之心Pro 2025-10-16 16:00:02
0 跟貼 0
美國AI春晚，一盆涼水澆在Agent身上

36氪 2025-12-11 13:34:06
0 跟貼 0
比亞迪王傳福：做大產業，做出中國制造業應有的位置

每日經濟新聞 2025-07-22 17:51:59
15 跟貼 15
新房裝空調，承重梁里多根鋼筋被打斷，如何善后成難題

大風新聞 2025-12-11 11:54:06
7299 跟貼 7299
2026年，AI服務器貴、貴、貴

鈦媒體APP 2025-12-11 18:58:11
0 跟貼 0
男子自制炸彈模型，竟讓孩子帶學校去，仿佛看到他的班主任！

牛牛愛搞笑哦 2025-12-10 13:31:42
1 跟貼 1
OpenAI產品線拉出來嚇我一跳，奧特曼不愧是YC出身

量子位 2025-10-27 14:22:10
7 跟貼 7
朱嘯虎投了一家低門檻版“扣子”，創始人字節出身

智東西 2025-12-10 18:55:15
1 跟貼 1
釘釘發布DeepResearch多智能體框架，已在真實企業部署

機器之心Pro 2025-11-12 13:06:22
2 跟貼 2
暗漏兩個月用水2203噸水費超1.5萬元用戶：太冤了！|云求助

封面新聞 2025-12-11 21:53:29
1601 跟貼 1601
魔獸世界：時光服部分多開玩家遭封號，排隊問題何時解決？

游戲農工 2025-12-11 23:50:08
4 跟貼 4
余承東：我有一個夢想馬路上的所有車里都有華為的技術

每日經濟新聞 2025-07-23 17:06:16
267 跟貼 267
五角大樓：中國都發展成這樣了咱不得枕戈待旦啊

澎湃新聞 2025-12-11 20:55:50
1585 跟貼 1585
男子太有才了，制作了蒸汽小模型，以前蒸汽火車也是這種結構嗎？

逗趣小油條 2025-12-11 15:14:00
1 跟貼 1
俄羅斯網紅為博流量將10歲兒子塞進密封袋抽走空氣，僅2秒后孩子就哭喊“媽媽”

大象新聞 2025-12-11 11:46:06
1766 跟貼 1766
開源AI編程工具CoStrict，GitHub星標3K+

量子位 2025-12-09 01:52:08
0 跟貼 0
沙漏模型大揭秘！結論和與蝴蝶模型的聯系都在這了

小新的視界 2025-12-11 06:11:39
0 跟貼 0
永輝客服回應上架聽媽媽話竹鞭

現代快報 2025-12-11 16:58:06
1593 跟貼 1593
銷量突然飆漲！線上店開始斷貨，醫務人員：沒必要囤！

荔枝新聞 2025-12-11 16:21:14
1005 跟貼 1005
中央定調明年繼續實施“國補”

第一財經資訊 2025-12-11 18:39:51
65 跟貼 65
男子拿著香蕉模型去結賬，上稱時老板當場懵了

荊門晚報 2025-12-09 10:09:05
1 跟貼 1
泰凌微：公司芯片產品在智能家居等多個領域向谷歌供貨

界面新聞 2025-12-10 16:58:54
0 跟貼 0
高通萬衛星：混合AI與分布式協同是未來 | MEET2026

量子位 2025-12-11 19:54:27
0 跟貼 0
蔚來李斌：讓每一個蔚來車主都覺得購買蔚來的車是正確選擇

每日經濟新聞 2025-07-07 17:30:53
0 跟貼 0
事關房地產官方明確明年重點任務

財聯社 2025-12-11 17:42:17
78 跟貼 78
沖上熱搜！喬任梁爸爸吃8個死蟹中毒住院；上海專家：大閘蟹死了為何不能吃？網友：想穿點

新民晚報 2025-12-11 10:30:06
893 跟貼 893
上海松江一農地有人扎堆“挖銀元” 文保部門：已介入處理，將請專家挖掘鑒定

紅星新聞 2025-12-11 14:00:56
388 跟貼 388

智東西

聚焦智能變革，服務產業升級。

10893文章數 116925關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

家居

藝術

本地

教育

手機 / 數碼

房產 / 家居

谷歌深夜重磅開源！深度研究Agent拿下SOTA，比GPT-5 pro便宜90%

凌晨突發！GPT-5.2上線，首批實測感受來了

牛彈琴：美國被指要組建C5來替代G7 中俄在列沒有歐洲

牛彈琴：美國被指要組建C5來替代G7 中俄在列沒有歐洲

你最看不上的人，關鍵時刻卻最想救你...

黃慧頤曝保劍鋒出軌細節！

美國要組建C5，全世界大吃一驚

長途穿越更輕松 二代哈弗H9穿越版限時售23.29萬

態度原創

渝見好“村”光｜酉陽山羊古寨：紅葉深處的詩意田園

歐式風格 純粹優雅氣質

吳越書法太美了！顏值與才華并存，快來看看！

打工人夢想中的生活，寵物已經提前過上了

韓國高考英語超高難度引爭議 韓國教育部嚴厲問責

長途穿越更輕松二代哈弗H9穿越版限時售23.29萬

歐式風格純粹優雅氣質

韓國高考英語超高難度引爭議韓國教育部嚴厲問責