<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      谷歌深夜重磅開源!深度研究Agent拿下SOTA,比GPT-5 pro便宜90%

      0
      分享至


      智東西
      編譯 程茜
      編輯 心緣

      智東西12月12日消息,今日凌晨,比OpenAI早一個小時,谷歌甩出了3個Agent大招:

      Deep Research Agent功能更新,并首次向開發者開放;開源新網絡研究Agent基準DeepSearchQA,旨在測試Agent在網絡研究任務中的全面性;推出新交互API(Interactions API)


      Gemini Deep Research是一款專為長期上下文采集和綜合任務優化的Agent,其背后的模型是Gemini 3 Pro,通過多步強化學習的擴展搜索,Agent能夠自主地以高精度導航復雜的信息環境。此次更新包括針對特定數據進行網頁搜索、更低成本生成研究報告等。

      谷歌DeepMind產品經理路卡斯·哈斯(Lukas Haas)在社交平臺X上透露,新Gemini Deep Research Agent已經實現SOTA,在谷歌新基準測試上得分46.4%,在BrowseComp上與GPT-5 Pro相當,價格是其1/10左右


      Deep Research Agent很快將在谷歌搜索、筆記本、 谷歌金融中提供,并在Gemini應用中升級。

      DeepSearchQA內置了900個手工設計的“因果鏈”任務,涵蓋17個領域,可以評估Agent在復雜、需要多步查詢信息等任務上的能力。

      交互API作為其與Gemini模型和Agent的統一交互界面,通過Google AI Studio中的Gemini API公開測試版向開發者開放。開發者可以通過Agent開發套件(ADK)和A2A協議使用交互API。

      有網友評論,谷歌這是把“一個數字版的福爾摩斯交給了開發者”,現在你只需要一邊喝咖啡,一邊就能讓每個應用像寫論文一樣展開深度調查。


      DeepSearchQA開源地址:https://www.kaggle.com/benchmarks/google/dsqa/leaderboard

      一、Deep Research Agent:更新網頁搜索、低成本生成研究報告功能

      谷歌博客稱,Deep Research背后的Gemini 3 Pro模型是他們迄今為止最真實的模型,該模型經過專門訓練,旨在減少幻覺并最大化復雜任務中的報告質量。

      Deep Research通過迭代式流程運行,它會提出問題、閱讀結果、識別知識空白,然后再次進行搜索。其新版本大幅提升了網頁搜索功能,使其能夠深入網站查找特定數據。

      新Gemini Deep Research Agent在完整HLE測試中達到46.4%,Gemini 3 Pro為43.2%,GPT-5 Pro為38.9%。在DeepSearchQA、BrowseComp的測試中以微小優勢勝出。


      谷歌還優化了該Agent以更低成本生成深度研究報告的功能。

      Gemini Deep Research Agent已經在需要高精度和基于早期反饋、測試的復雜領域應用,包括金融服務、生物技術和市場調研等行業,這些領域都可以利用Gemini Deep Research完成初步調研任務。

      對于構建下一代自動化研究工具的開發者來說,Gemini Deep Research Agent能夠綜合信息并生成詳細報告:

      統一信息綜合:Gemini Deep Research通過文件上傳和文件搜索工具分析用戶的文檔和公共網絡數據,還能處理長上下文,允許用戶直接在提示中放置大量背景信息;

      報告可控性:用戶可以通過提示定義結構、頭部,或指定數據表生成和格式來控制輸出;

      詳細引用:其會提供細粒度的來源,允許用戶驗證數據來源;

      結構化輸出:支持JSON模式輸出,便于下游應用解析研究結果。

      二、DeepSearchQA:新Agent基礎,涵蓋17大領域、900條任務

      DeepSearchQA是Deep Research Agent的測試基準。

      現有基準測試往往無法反映現實世界多步網絡研究的復雜性,谷歌開源新基準DeepSearchQA,是用于評估Agent在復雜、需要多步查詢信息等任務上。

      DeepSearchQA有900個手工設計的“因果鏈”任務,涵蓋17個領域,每一步都依賴于事先分析。與傳統的基于事實的測試不同,DeepSearchQA衡量的是全面性,要求Agent生成詳盡的答案集。這不僅評估研究的準確性,也包括檢索的記憶能力。

      DeepSearchQA還可以作為衡量“思考時長”效率的工具。谷歌在內部評估中發現,當允許Agent執行更多搜索與推理步驟時,其性能會獲得顯著提升


      三、交互API:集成專為Agent應用開發設計的接口

      交互API原生集成了一套專屬接口,該接口專為Agent應用開發場景設計,可高效處理交錯式消息、思維鏈、工具調用及其狀態信息的復雜上下文管理工作。除Gemini模型套件外,交互API還提供其首個內置Agent Gemini Deep Research Agent

      下一步,谷歌將擴展其內置Agent,并提供構建和引入其他Agent的功能,這將使開發者能夠通過一個API連接Gemini模型、谷歌內置Agent和開發者的定制Agent

      交互API提供了一個單一的RESTful端點,用于與模型和Agent交互。

      通過指定模型參數與模型交互:


      通過指定Agent參數與Agent互動,目前支持deep-research-pro-preview-12-2025:


      交互API通過現代Agent應用所需的功能擴展了生成內容的核心功能,包括:

      可選的服務器端狀態:能夠將歷史管理卸載到服務器。這簡化了開發者的客戶端代碼,減少了上下文管理錯誤,并通過增加緩存命中率可能降低成本。

      可解釋和可組合的數據模型:一個為復雜的Agent歷史設計的干凈圖式。開發者可以對交錯的信息、思維、工具及其結果進行調試、流式分析和推理。

      背景執行:能夠將長期運行的推理環路卸載到服務器,而無需維護客戶端連接。

      遠程MCP工具支持:模型可以直接調用模型上下文協議(MCP)服務器作為工具。

      結語:Gemini生態再擴容,谷歌簡化Agent開發模式

      目前,Deep Research Agent已經在金融、科學研究等諸多領域有所應用。此次谷歌不僅更新了這一Agent,還發布了交互API,以簡化與Gemini模型和Agent的交互流程,構建更易用的開發生態。

      谷歌博客提到,其未來的更新還將聚焦于更豐富的輸出,如原生生成圖表以支持可視化分析報告,以及通過模型上下文協議(MCP)支持擴展連接性,更輕松地訪問自定義數據源,并努力將Gemini Deep Research引入企業用的Vertex AI。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      靠頭發增高硬演男主,央視《風與潮》男主成敗筆,換掉他近乎完美

      靠頭發增高硬演男主,央視《風與潮》男主成敗筆,換掉他近乎完美

      洲洲影視娛評
      2025-12-10 16:58:56
      暴漲4347%!美國嚴防死守的技術,竟被這對80后兄弟干出“奇跡”

      暴漲4347%!美國嚴防死守的技術,竟被這對80后兄弟干出“奇跡”

      小莜讀史
      2025-12-10 20:06:38
      張水華:我不會辭職,要養家養孩子,跑馬拉松是愛好,拎得清主次

      張水華:我不會辭職,要養家養孩子,跑馬拉松是愛好,拎得清主次

      鋭娛之樂
      2025-12-11 16:47:18
      76年周總理追悼會開始前,汪東興下達事關毛主席密令,追悼會推遲

      76年周總理追悼會開始前,汪東興下達事關毛主席密令,追悼會推遲

      海佑講史
      2025-12-11 13:00:06
      為何柔佛球員已被亞足聯三黃停賽,卻依然能出戰上港,原因找到了

      為何柔佛球員已被亞足聯三黃停賽,卻依然能出戰上港,原因找到了

      籃球看比賽
      2025-12-11 11:27:47
      對比《歡迎來到東莫村》,《得閑謹制》為何是爛片?照老虎畫爛貓

      對比《歡迎來到東莫村》,《得閑謹制》為何是爛片?照老虎畫爛貓

      馬慶云的影音娛
      2025-12-09 09:37:54
      發小走后,我每月拿出500孝順他父母,去年相親,被他姐姐攔路上

      發小走后,我每月拿出500孝順他父母,去年相親,被他姐姐攔路上

      人間百態大全
      2025-12-11 06:35:03
      “牡丹花下死,做鬼也風流”,這一次,74歲的張紀中徹底成了笑話

      “牡丹花下死,做鬼也風流”,這一次,74歲的張紀中徹底成了笑話

      洲洲影視娛評
      2025-12-08 19:52:00
      國產光刻膠四“小巨人”,誰執牛耳?

      國產光刻膠四“小巨人”,誰執牛耳?

      愛集微
      2025-12-11 14:49:13
      事關2億人,中央支持靈活就業、新就業形態人員參加職工保險

      事關2億人,中央支持靈活就業、新就業形態人員參加職工保險

      第一財經資訊
      2025-12-11 19:42:40
      停不住,維拉各項賽事8連勝!

      停不住,維拉各項賽事8連勝!

      體壇周報
      2025-12-12 08:23:41
      戀情曝光一個月后,31歲江旻憓“野心”暴露,難怪看不上霍啟山

      戀情曝光一個月后,31歲江旻憓“野心”暴露,難怪看不上霍啟山

      以茶帶書
      2025-12-11 17:10:57
      女子車禍癱瘓男友發聲:三觀不合,她為錢無所不用其極,接受判決

      女子車禍癱瘓男友發聲:三觀不合,她為錢無所不用其極,接受判決

      娛樂看阿敞
      2025-07-11 09:15:04
      英媒:特朗普有意讓匈牙利意大利脫離歐盟

      英媒:特朗普有意讓匈牙利意大利脫離歐盟

      參考消息
      2025-12-11 21:45:05
      2025年12月1日全國機動車年檢新規落地,車主別白跑一趟

      2025年12月1日全國機動車年檢新規落地,車主別白跑一趟

      右耳遠聞
      2025-12-09 18:45:04
      開幕式秒變甄嬛傳!泰王攜后宮團高調出席,一點不給蘇提達面子

      開幕式秒變甄嬛傳!泰王攜后宮團高調出席,一點不給蘇提達面子

      紅袖說事
      2025-12-11 23:14:40
      中央經濟工作會議釋信號:這三件事,不做!

      中央經濟工作會議釋信號:這三件事,不做!

      國是直通車
      2025-12-11 19:37:02
      法國沒有參與火燒圓明園?英國人說出放火真正目的:讓中國記住

      法國沒有參與火燒圓明園?英國人說出放火真正目的:讓中國記住

      史之銘
      2025-12-11 16:37:42
      37歲徐萌贏下全部!大師范增年近9旬得貴子,發聲明與女兒斷絕關系

      37歲徐萌贏下全部!大師范增年近9旬得貴子,發聲明與女兒斷絕關系

      趣筆談
      2025-12-11 16:08:14
      喊出“GDP倍增”,經濟第一省打響守位戰

      喊出“GDP倍增”,經濟第一省打響守位戰

      城市進化論
      2025-12-11 21:27:47
      2025-12-12 09:03:00
      智東西 incentive-icons
      智東西
      聚焦智能變革,服務產業升級。
      10893文章數 116925關注度
      往期回顧 全部

      科技要聞

      凌晨突發!GPT-5.2上線,首批實測感受來了

      頭條要聞

      牛彈琴:美國被指要組建C5來替代G7 中俄在列沒有歐洲

      頭條要聞

      牛彈琴:美國被指要組建C5來替代G7 中俄在列沒有歐洲

      體育要聞

      你最看不上的人,關鍵時刻卻最想救你...

      娛樂要聞

      黃慧頤曝保劍鋒出軌細節!

      財經要聞

      美國要組建C5,全世界大吃一驚

      汽車要聞

      長途穿越更輕松 二代哈弗H9穿越版限時售23.29萬

      態度原創

      旅游
      家居
      藝術
      本地
      教育

      旅游要聞

      渝見好“村”光|酉陽山羊古寨:紅葉深處的詩意田園

      家居要聞

      歐式風格 純粹優雅氣質

      藝術要聞

      吳越書法太美了!顏值與才華并存,快來看看!

      本地新聞

      打工人夢想中的生活,寵物已經提前過上了

      教育要聞

      韓國高考英語超高難度引爭議 韓國教育部嚴厲問責

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 激情五月日韩中文字幕| 巴中市| 伊人激情av一区二区三区| 日韩欧美中文字幕在线三区| 欧洲码亚洲码的区别入口| 国产精品人妻在线观看| 国内精品久久久久久中文字幕| 伊人网成人| 久久精品欧美一区二区三区麻豆 | 丝袜a∨在线一区二区三区不卡| 国产精品成人无码久久久| 顺昌县| 亚州人妻中文| 亚洲中文精品久久久久久不卡| 精品久久久噜噜噜久久久| 亚洲成人AV在线| 亚洲AV成人无码久久精品黑人| 欧美白丰满老太aaa片| 国产成人av乱码在线观看| 自治县| 97香蕉久久国产超碰青草专区| 无码成人AV在线看免费| 免费观看全黄做爰大片国产| 男女毛多水多亚洲| 日韩AV一区二区三区| 尤物av在线| 亚洲有无码中文网| 48沈阳熟女高潮嗷嗷叫| 亚洲熟悉妇女xxx妇女av| 国产精品久久777777| 亚洲VA| 国产无遮挡猛进猛出免费软件| 亚洲男人第一av网站| 4hu四虎永久免费地址ww416| 伊人天堂网| 亚洲AVAV天堂Av在线播放| 亚洲AV无码国产永久播放蜜芽| 好吊色欧美一区二区三区视频| 亚洲精品国产suv一区88| 中文字幕乱码人妻无码久久免费 | 真人抽搐一进一出视频|