<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      GPT-5.2獲封“最強打工人”,谷歌同日以Gemini“性價比”系列應戰

      0
      分享至


      圖片由AI生成

      “我從未像現在這樣對我們的研發和產品路線圖,以及實現我們使命的整體方向感到如此樂觀。”

      12月12日,在正式上線GPT-5.2的同時,OpenAI CEO薩姆·奧爾特曼(Sam Altman)發布了一篇十周年紀念文章中這樣說。

      他極力向外界展現著自己依舊自信的一面。畢竟,雖然GPT大模型和ChatGPT聊天機器人至今仍是當前AI大潮的造浪者,但想必此刻,奧爾特曼感受到的競爭壓力堪稱空前。

      今年以來,DeepSeek、Grok、Claude等競爭者的強勢追趕,尤其是谷歌上個月推出的Gemini 3大放異彩,都將AI大模型競爭推上了更新的高度。

      最近,奧爾特曼先是在內部備忘錄中提示員工,需要接受最好的大模型不出自家之手的事實,繼而,又發出公司首個“紅色警報”,強調“立即行動,集中所有資源奪回領先地位”。


      截圖來自社交平臺X

      只有更強大的產品,才能支撐自信的底氣。

      在十周年紀念日這天,OpenAI重磅發布預熱了一周多的GPT-5.2,評測表現再次反超所有競爭對手。

      但谷歌不甘示弱,幾乎在同一時間發布了新品,讓這場大模型之爭的戰況再次升級。

      GPT-5.2獲評“最強AI打工人”,但“工資”很高

      GPT-5.2此次仍然“全線出擊”,一次性發布了Instant、Thinking和Pro三款不同層級的模型。

      近一個月前Gemini 3發布時,其評測得分幾乎“碾壓”GPT-5的表現引發市場巨大關注。

      而這次,根據OpenAI發布的基準測試結果,GPT-5.2實現了全面反超,其Thinking模型基準測試得分均高于Gemini 3 PRO和Anthropic的Claude Opus 4.5。

      其中,GPT-5.2在博士級別的專家推理評估GPQA Diamond得分高達92.4%,相比GPT-5.1 Thinking的88.1%和Gemini 3 PRO剛剛刷出的91.9%高分再進一步。在不用工具的情況下,GPT-5.2在最新美國數學邀請賽(AIME2025)中拿到了滿分。

      OpenAI尤其強調了GPT-5.2在專業工作方面的領先地位,稱其Thinking模型是“目前最能夠勝任現實中各類專業用途的模型”。

      在用于評估專業型技能的GDPval測試中,該模型得到了70.9%的高分,比GPT-5.1 Thinking高了足足32.1%,領先Gemini 3 PRO有17.4%。此外,對比尤其擅長編程等企業工作,此前在該評估中更勝一籌的Claude Opus 4.5,OpenAI的新品也高出了11.3%。


      圖片來自OpenAI

      OpenAI給出的案例演示中,GPT-5.2聚焦了制作表格、整理分析數據、制作項目流程圖等十分落地的現實工作場景。

      公司還表示,新模型在編寫代碼、制作PPT、圖像感知、理解長上下文、使用工具、處理復雜的多步驟項目方面都表現出色,而且錯誤率較前代產品大大減少。

      模型發布后,GPT-5.2在實際工作場景中的表現也確實獲得了不少贊許,一些使用者給予了其“最強AI打工人”“職場最佳拍檔”等稱號。

      不過,這個“打工人”的“高工資”可能會成為問題。

      數據顯示,在輸入輸出價格方面,GPT-5.2要比前代貴了40%,輸入價格21美元,輸出價格高達168美元。

      這再次引發了一些擔憂,此前,OpenAI堆算力發展大模型的做法已經受到質疑,無論是DeepSeek還是Gemini,似乎都證明著AI應用可以采取更具性價比的模式。

      如果再考慮市場對以OpenAI和英偉達等引領的資本支出狂潮,以及市場對泡沫焦慮的警惕,GPT-5.2是靠算力“硬懟”實現的反擊,那這顯然對奧爾特曼來說,也是個隱憂。

      可以看到的是,一些用戶在吐槽Thinking和PRO的應答時間明顯較慢,比其前代產品還要慢。而對于逐漸嵌入日常生活、工作的AI產品來說,機會成本和效率顯然已愈發重要。

      普通即時版GPT-5.2仍然在一些常識問題上犯錯,也引發了一些用戶玩梗吐槽。

      當然,OpenAI的動作還沒有結束。奧爾特曼表示,下周,會繼續給用戶帶來“小圣誕禮物”,ChatGPT的“成人模式”也預計將于明年一季度面世。

      谷歌給OpenAI扔了個炸彈,提前1小時搶發Gemini Deep Research

      OpenAI的勁敵們,早已準備好子彈,回擊這次GPT的重要更新。

      谷歌搶在GPT-5.2前一個小時左右進行了產品更新,稱其深度研究智能體Gemini Deep Research全面增強,并首次向開發者開放,再次引發了關注,試圖不讓OpenAI獨占“頭條”。

      據谷歌介紹,Gemini Deep Research基于Gemini 3 PRO構建,通過多步強化學習訓練,顯著減少“幻覺”,在復雜研究任務中表現出更高精度。

      在人類終極大考(HLE)中,Gemini Deep Research得到46.4%分,比GPT-5.2 Thinking的45.5%要高,僅低于GPT-5 Pro的50%。


      圖片來自谷歌

      但是,其更大的優勢在成本極低,谷歌產品經理透露,新版智能體在與GPT-5 Pro表現相當的同時,成本僅為后者的十分之一左右,展現出強大的性價比優勢。

      相對于OpenAI,更好的性價比、另辟蹊徑的訓練模式、公司的現金流、自研專用芯片等,都是谷歌“逆襲”敘事的核心。

      如今,在大模型比拼性能的同時,谷歌的核心優勢仍在繼續,這也持續為OpenAI帶來壓力。

      此外,為科學評估研究型智能體的能力,谷歌還同步開源了基準測試工具DeepSearchQA,包含覆蓋17個領域的900項復雜任務。

      當然,GPT-5.2未必是奧爾特曼捍衛大模型王座的殺手锏。

      此前有消息稱,OpenAI在加速開發自身全新的模型“Garlic”,致力于通過新的方式重建絕對領先的優勢。谷歌、Anthropic顯然還會繼續拿出更好的產品。而Meta和DeepSeek等競爭者也同樣有著令人期待的新品可能面世。

      大模型浪潮的另一大贏家英偉達,最近與美銀舉辦了一次投資者線上交流會。英偉達方面提到,只依據Gemini 3的表現比GPT5更優,就認為谷歌自研的TPU要好于英偉達的GPU是不合理的。

      尤其目前大部分的大模型都是用上一代H系列芯片訓練的,用Blackwell訓練的大模型要到2026年才會上線,其優勢到時才會顯現,更不用說還未投入使用的新一代超級芯片Rubin。

      市場對英偉達的說法看法不一,有觀點認為模型強大與否與芯片代際不直接掛鉤,也有觀點認為更關鍵的還是性價比問題。不過,不管怎樣,英偉達的說法已讓明年的大模型之爭看起來更值得期待了。

      2025年年末之際,AI大模型之戰和AI芯片之戰的戰局,都變得更加刺激,2026年,想必戰況還會繼續升級。這場戰事不僅是大模型能力之爭,更是關系到大模型的訓練、發展路徑,以及AI芯片的未來之戰。(作者|胡珈萌,編輯|李程程)

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      給力!烏克蘭未來兩年軍費已有著落,再不用為錢發愁

      給力!烏克蘭未來兩年軍費已有著落,再不用為錢發愁

      史政先鋒
      2025-12-12 16:14:32
      深夜,史詩級暴跌!重磅會議,明確政策取向;突發!摩爾線程,緊急公告

      深夜,史詩級暴跌!重磅會議,明確政策取向;突發!摩爾線程,緊急公告

      金融界
      2025-12-12 08:44:08
      古畫里,常出現一位手持寶劍提著頭顱的女子,她是誰?

      古畫里,常出現一位手持寶劍提著頭顱的女子,她是誰?

      收藏大視界
      2025-12-10 20:39:32
      人口大省全國墊底?河南退休人的心里話,句句都實在

      人口大省全國墊底?河南退休人的心里話,句句都實在

      小鹿姐姐情感說
      2025-12-12 15:32:14
      歐盟永久凍結俄方資產;烏以退為進欲就領土問題進行全民公投

      歐盟永久凍結俄方資產;烏以退為進欲就領土問題進行全民公投

      近距離
      2025-12-12 11:38:56
      火箭森林狼有興趣引進保羅!40歲老炮重返休城?可指導謝潑德提升

      火箭森林狼有興趣引進保羅!40歲老炮重返休城?可指導謝潑德提升

      羅說NBA
      2025-12-12 06:37:41
      賭贏賺翻了:1/10價格買下價值56萬服務器主機!960GB內存就已回本

      賭贏賺翻了:1/10價格買下價值56萬服務器主機!960GB內存就已回本

      快科技
      2025-12-12 15:06:06
      網友們把當下國企的內幕說得明明白白

      網友們把當下國企的內幕說得明明白白

      清暉有墨
      2025-11-21 19:56:40
      美媒:美國盟友都不服,但特朗普只認中國第一,因為中國說話算話

      美媒:美國盟友都不服,但特朗普只認中國第一,因為中國說話算話

      楠楠自語
      2025-12-12 14:34:42
      《瘋狂動物城2》票房破30億,這是一個信號:情感消費已成趨勢!

      《瘋狂動物城2》票房破30億,這是一個信號:情感消費已成趨勢!

      老方
      2025-12-07 20:58:41
      三款創新藥首次入選,羅氏中國在醫保目錄獲利,患者能否真正獲益?

      三款創新藥首次入選,羅氏中國在醫保目錄獲利,患者能否真正獲益?

      新民周刊
      2025-12-11 16:29:25
      中英香港談判中方為何吃暗虧?因我方出內鬼,6年后中央布局抓捕

      中英香港談判中方為何吃暗虧?因我方出內鬼,6年后中央布局抓捕

      阿胡
      2024-10-11 16:54:21
      2025 SUV銷量榜,特斯拉Model Y再奪冠,新勢力們為何反而越追越遠

      2025 SUV銷量榜,特斯拉Model Y再奪冠,新勢力們為何反而越追越遠

      91cheche
      2025-12-12 16:03:04
      解放軍進入臺海,美航母早已跑路,統一已成定局,鄭麗文開始追責

      解放軍進入臺海,美航母早已跑路,統一已成定局,鄭麗文開始追責

      朝子亥
      2025-12-12 12:00:03
      自絕后路不到12小時,范曾擔心的事發生了,遭殃的何止小50歲嬌妻

      自絕后路不到12小時,范曾擔心的事發生了,遭殃的何止小50歲嬌妻

      冷紫葉
      2025-12-12 16:42:55
      我帶400萬回村卻說血本無歸,不到一周,七個遠親都托人把錢還了

      我帶400萬回村卻說血本無歸,不到一周,七個遠親都托人把錢還了

      蕭竹輕語
      2025-12-09 17:44:38
      丈夫跳樓留下480萬債務,母子倆還了18年,去銀行查老公的卡傻了

      丈夫跳樓留下480萬債務,母子倆還了18年,去銀行查老公的卡傻了

      卡西莫多的故事
      2025-12-06 19:36:02
      日本航母緊急出動,迎戰遼寧艦?美國突然發話,給中國送上國運!

      日本航母緊急出動,迎戰遼寧艦?美國突然發話,給中國送上國運!

      老范談史
      2025-12-10 20:26:38
      太能生了!汕頭火災12死事件持續發酵,該大家庭共有20口引發熱議

      太能生了!汕頭火災12死事件持續發酵,該大家庭共有20口引發熱議

      火山詩話
      2025-12-12 11:25:01
      快船致命失誤誰該背鍋?哈登不接球情有可原,拿著1500萬輸球還笑

      快船致命失誤誰該背鍋?哈登不接球情有可原,拿著1500萬輸球還笑

      你的籃球頻道
      2025-12-12 13:09:28
      2025-12-12 17:52:49
      鈦媒體APP incentive-icons
      鈦媒體APP
      獨立財經科技媒體
      127488文章數 861462關注度
      往期回顧 全部

      科技要聞

      凌晨突發!GPT-5.2上線,首批實測感受來了

      頭條要聞

      沈逸:美國用最強硬的方式 吹響戰略撤退號角

      頭條要聞

      沈逸:美國用最強硬的方式 吹響戰略撤退號角

      體育要聞

      15輪2分,他們怎么成了英超最爛球隊?

      娛樂要聞

      上海這一夜,33歲陳麗君秒了32歲吉娜?

      財經要聞

      鎂信健康闖關港交所:被指竊取商業秘密

      汽車要聞

      插混四驅法拉利?849 Testarossa國內發布516.8萬起

      態度原創

      教育
      家居
      手機
      游戲
      軍事航空

      教育要聞

      校長先要成為讀書人

      家居要聞

      溫潤質感 打造干凈空間

      手機要聞

      三星One UI 8.5新特性曝光,“說句話”自動AI修圖

      《鵝鴨殺》手游定檔熱搜:年輕人用“社交貨幣”投出了一張信任票

      軍事要聞

      澤連斯基:烏領土問題應由烏人民決定

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 久久久久厕拍| av青青草| 人妻少妇无码视频| 91视频18| 国产综合久久久久鬼色| 亚洲精品久久午夜无码一区二区 | 成人欧美一区二区三区白人| 亚洲伊人天天色| 果冻传媒一区| 国产微拍一区二区三区四区| 婷婷色六月| 亚洲伊人天天色| 女人的精水喷出来视频| 欧美xxxxhd高清| 欧美精品99久久久| AV四虎| 成人无码av片在线观看| 久久精产国品一二三产品| 免费偷拍| 成人av无码一区二区三区| 久久香蕉超碰97国产精品| 亚洲精品自拍在线视频| 玖草视频在线观看| 无码午夜福利片| 国产va免费精品高清在线观看 | 少妇高潮喷水久久久久久久久久 | 欧美熟妇高潮流白浆| 国产精品爽黄69天堂a| 久久精品国产亚洲一区二区| 日本一卡2卡3卡4卡无卡免费| 江口县| 日本丰满老妇bbb| 男人用嘴添女人下身免费视频| 久久久久人妻一区精品| 日韩91| 兴城市| 国精一二二产品无人区免费应用 | 亚洲二页| 亚洲成人精品无码| 四虎国产精品永久地址99| 欧美日韩免费专区在线观看|