<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      剛剛Gemini上新模型,全球只有7人比它會編程,谷歌姚順宇參與

      0
      分享至



      編輯|澤南

      從此以后,AI 不再是工具,要尊稱為「硅基博學家」了。

      北京時間周五凌晨,谷歌發布了 Gemini 3 Deep Think 的重大升級,作為專門用于復雜任務的推理模式,Deep Think 代表 AI 前沿的最強智能水平,旨在解決科學、工程領域的諸多挑戰。



      去年 9 月加入 Google DeepMind 的清華物理系傳奇姚順宇(Shunyu Yao)也是這次 Deep Think 新模型的參與者。



      去年,谷歌展示了專門開發的 Deep Think 版本能夠成功應對一些最棘手的推理挑戰,并在數學和編程世界錦標賽上取得了金牌成績。最近,Deep Think 又使專門開發的智能體能夠進行研究級別的數學探索。

      更新后的深度思考模式繼續拓展智能的邊界,在最嚴格的學術基準測試中取得了新的高度,其中包括:

      • 在「人類的最后考試」(一項旨在測試現代前沿模型極限的基準測試)中,該模型取得了新的 SOTA(48.4%,不使用任何工具)。
      • 在 ARC-AGI-2 測試中取得了前所未有的 84.6% 的成績,并經 ARC Prize 基金會驗證。
      • 在 Codeforces 上取得了驚人的 3455 Elo 分數,Codeforces 是一個包含各種競技編程挑戰的基準測試平臺。
      • 在 2025 年國際數學奧林匹克競賽中取得金牌水平。



      新版 Gemini 3 Deep Think 在 ARC-AGI-1 上的成績是 96.0%,每任務花費 7.17 美元;在 ARC-AGI-2 上已經達到了 84.6% 的分數,每任務成本為 13.62 美元。



      大約 14 個月前,OpenAI 模型 o3-preview 的「高計算」版本在 ARC-AGI-1 測試中達到了約 88% 的分數,每個任務的成本約為 2000 至 3000 美元。而 Gemini 3 Deep Think 的每任務成本僅為 7.17 美元,成本降低了約 280 至 420 倍。

      這意味著我們現在需要再次為 AI 準備更復雜的測試題了。

      除了數學和編程競賽之外,Gemini 3 Deep Think 現在在化學和物理等廣泛的科學領域也表現出色。更新后的 Deep Think 模式在 2025 年國際物理奧林匹克競賽和化學奧林匹克競賽的筆試部分取得了金牌級別的成績。它還展現了在高等理論物理方面的能力,在 CMT-Benchmark 測試中取得了 50.5% 的分數。



      還有這個在 Codeforces 上獲得的 3455 分,Gemini 3 Deep Think 已經相當于世界排名第八的頂尖競技程序員的水平。之前的最佳成績是來自一年多以前 OpenAI o3 的 2727 分,排名第 175。

      地球上只有 7 個人能在編程比賽中擊敗 Gemini 3 Deep Think。



      對于 AI 和整個科技領域而言,這是一個以往難以想象的成果。

      谷歌與科學家和研究人員緊密合作,對 Gemini 3 Deep Think 進行了升級。Deep Think 將深厚的科學知識與日常工程實踐相結合,超越了抽象理論,推動了實際應用。

      借助更新后的 Deep Think,你可以將草圖轉化為可 3D 打印的實體模型。Deep Think 會分析圖紙,對復雜形狀進行建模,并生成用于 3D 打印的實體文件。



      谷歌展示了一些早期測試用戶使用最新版 Deep Think 的成果:

      羅格斯大學的數學家 Lisa Carbone 致力于研究高能物理學界所需的數學結構,以彌合愛因斯坦引力理論和量子力學之間的鴻溝。由于該領域缺乏大量的訓練數據,她利用 Deep Think 技術審閱了一篇高度專業的數學論文。Deep Think 成功地識別出了一個細微的邏輯缺陷,而這個缺陷此前在人工同行評審中均未被發現。



      在杜克大學,Haozhe "Harry" Wang 帶領的實驗室利用 Deep Think 技術優化了復雜晶體生長的制備方法,以期發現新的半導體材料。Deep Think 成功設計了一種能夠生長厚度大于 100 微米薄膜的工藝,達到了以往方法難以企及的精確目標。



      或許隨著更多人的使用,我們不久之后能夠基于 Gemini 3 Deep Think 實現更多科研突破。

      全新 Deep Think 現已在 Gemini 應用中上線,目前 Google AI Ultra 訂閱用戶可以使用。此外,谷歌首次通過 Gemini API 向部分研究人員、工程師和企業開放 Deep Think 的使用權限。

      參考內容:

      https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/

      https://x.com/shaneguML/status/2021999801911718029

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中汽協:絕大多數重點車企已把賬期壓縮至60天內,少數企業以縮短賬期要求降價

      中汽協:絕大多數重點車企已把賬期壓縮至60天內,少數企業以縮短賬期要求降價

      紅星資本局
      2026-02-12 14:13:10
      寶馬和邁巴赫加一起都打不過?尊界S800一月賣了2600多臺

      寶馬和邁巴赫加一起都打不過?尊界S800一月賣了2600多臺

      熱點科技
      2026-02-13 14:28:18
      特朗普“新聯合國”首次開會,一國明確參加,中方6個字定調

      特朗普“新聯合國”首次開會,一國明確參加,中方6個字定調

      青煙小先生
      2026-02-12 09:38:24
      流亡一年后,阿薩德已成“透明人”,連約普京吃頓飯都做不到

      流亡一年后,阿薩德已成“透明人”,連約普京吃頓飯都做不到

      朔方瞭望
      2026-01-06 11:11:51
      趙本山沒想到,離過年僅剩4天,29歲兒子的一舉動,先給他爭光了

      趙本山沒想到,離過年僅剩4天,29歲兒子的一舉動,先給他爭光了

      觀察鑒娛
      2026-02-13 14:43:11
      哈佛跟蹤32年發現扎心真相:你能活多久,很大程度取決于你老婆!

      哈佛跟蹤32年發現扎心真相:你能活多久,很大程度取決于你老婆!

      徐德文科學頻道
      2026-02-06 21:31:27
      胖東來下架智利車厘子,工作人員:壞果太多、品質達不到要求,新上架了190元每斤的澳洲車厘子

      胖東來下架智利車厘子,工作人員:壞果太多、品質達不到要求,新上架了190元每斤的澳洲車厘子

      極目新聞
      2026-02-12 19:58:46
      上海奪冠更衣室!盧偉點贊外援+3本土球員,劉錚展露傲嬌表情!

      上海奪冠更衣室!盧偉點贊外援+3本土球員,劉錚展露傲嬌表情!

      籃球資訊達人
      2026-02-12 23:54:21
      為何中國軍力嚇不倒日本,石破茂說得一針見血,還會走老路的

      為何中國軍力嚇不倒日本,石破茂說得一針見血,還會走老路的

      瑛派兒老黃
      2025-12-02 21:11:13
      湖北女孩遠嫁法國,想把農村母親接到法國,洋女婿:我們房子太小

      湖北女孩遠嫁法國,想把農村母親接到法國,洋女婿:我們房子太小

      談史論天地
      2026-02-10 16:40:10
      到中國過年成熱潮 海南春節出入境客流將增24%

      到中國過年成熱潮 海南春節出入境客流將增24%

      北青網-北京青年報
      2026-02-12 13:24:12
      兩次毀約拒絕賠償,墨西哥卻再次找中國建高鐵,中國這次不再慣著

      兩次毀約拒絕賠償,墨西哥卻再次找中國建高鐵,中國這次不再慣著

      來科點譜
      2026-02-11 08:48:35
      美媒預測東西部最終排名!騎士拿下哈登升第2 一數據致火箭被看衰

      美媒預測東西部最終排名!騎士拿下哈登升第2 一數據致火箭被看衰

      鍋子籃球
      2026-02-12 20:47:12
      游戲結束,中方持續大規模拋售美債,貝森特:不希望與中國脫鉤

      游戲結束,中方持續大規模拋售美債,貝森特:不希望與中國脫鉤

      混沌錄
      2026-02-12 23:48:10
      又是三雙!約基奇26+15+11輕取灰熊,掘金成灰熊頭號苦主

      又是三雙!約基奇26+15+11輕取灰熊,掘金成灰熊頭號苦主

      大眼瞄世界
      2026-02-12 19:56:53
      李思思給恩師拜年,開奔馳送茅臺細節處全是講究,老師身份不一般

      李思思給恩師拜年,開奔馳送茅臺細節處全是講究,老師身份不一般

      觀察鑒娛
      2026-02-13 14:24:31
      特朗普新聯合國首會僅一人出席,中方六字回應

      特朗普新聯合國首會僅一人出席,中方六字回應

      歲暮的歸南山
      2026-02-12 22:20:50
      廣西大橋討薪6人獲刑,百萬血汗錢要不回,先動手保安卻全身而退

      廣西大橋討薪6人獲刑,百萬血汗錢要不回,先動手保安卻全身而退

      世界圈
      2026-02-13 08:51:26
      沙特“潛規則”故意避開?這屆U17國足,強到讓東道主不敢選

      沙特“潛規則”故意避開?這屆U17國足,強到讓東道主不敢選

      陳鋅特色美食
      2026-02-13 08:15:33
      Lisa蘿莉島演唱會視角曝光,她被曝曾在島上,伺候權貴和資本大佬

      Lisa蘿莉島演唱會視角曝光,她被曝曾在島上,伺候權貴和資本大佬

      花哥扒娛樂
      2026-02-10 18:44:40
      2026-02-13 15:27:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12300文章數 142564關注度
      往期回顧 全部

      科技要聞

      DeepSeek更新后被吐槽變冷變傻?

      頭條要聞

      中方罕見評價日本選舉 發出“極其嚴厲的預警”

      頭條要聞

      中方罕見評價日本選舉 發出“極其嚴厲的預警”

      體育要聞

      這張照片背后,是米蘭冬奧最催淚的故事

      娛樂要聞

      米蘭冬奧摘銀 谷愛凌再遭美國網友網暴

      財經要聞

      華萊士母公司退市 瘋狂擴張下的食安隱憂

      汽車要聞

      探秘比亞迪巴西工廠 居然是這個畫風!

      態度原創

      本地
      教育
      時尚
      親子
      軍事航空

      本地新聞

      下一站是嘉禾望崗,請各位乘客做好哭泣準備

      教育要聞

      南京理科女高二英語不破不了115,中考110多,如何提分?

      50+女人怎么穿更好看?過來人告訴你答案,越老越美贏麻了

      親子要聞

      媽媽和寶寶還沒有出產房,孕婦的媽媽在角落默默流淚,婆婆喜笑顏開的等著兒媳和孫子出產房

      軍事要聞

      多次成功應對外艦、外機挑釁 太原艦展示052D硬核實力

      無障礙瀏覽 進入關懷版