<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<sub id="izvor"></sub>

<cite id="izvor"></cite>

<style id="izvor"></style>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

GPT-5.2考贏人類！OpenAI警告：大模型能力已過剩，AGI天花板不是AI

2026-01-10 22:12:55　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：元宇

【新智元導讀】如同智能手機一樣，大模型也進入了一個「能力過剩」時代，即大模型本身的能力與人類使用方式之間存在著巨大斷層。

剛剛，GPT-5.2刷新了一項新紀錄！

OpenAI聯合創始人Greg Brockman發帖稱使用GPT-5.2在ARC-AGI-2基準測試上，表現超過了人類基線水平。

在基準測試時技能爆表，但一到實際應用就「掉鏈子」，OpenAI前首席科學家Ilya Sutskever提到的這種大模型「性能悖論」我們并不陌生。

這也是AGI評估領域一個長期存在的難題——如何區分大模型「真正的推理能力」與「刷題型能力」。

而ARC-AGI-2的出現正好打破了這一難題。

ARC-AGI-2的全稱為「Abstraction and Reasoning Corpus for Artificial General Intelligence-Version 2」，是ARC系列基準的最新升級版本。

該基準由Fran?ois Chollet（Keras之父、前Google Brain研究員）及其團隊在2025年推出，其設計初衷十分明確：

測試AI是否具備AGI所必需的抽象、歸納與遷移推理能力，而非記憶或統計模式匹配。

ARC系列與傳統NLP或多模態benchmark最大的不同在于：它沒有大規模訓練集，每道題目都是從未見過的新任務，因此不存在通過「刷數據」獲得高分的可能。

它要求AI像人類一樣具備真正的推理和舉一反三的能力。

Chollet曾多次公開表示，如果一個系統只能在見過的數據分布上表現良好，那它并不具備AGI所需的能力。

因此，ARC基準測試剛好直擊大模型的「軟肋」。

從「及格」到「優等生」

一次關鍵跨越

新紀錄的刷新者，并非單一模型，而是一個名為Poetiq（GPT-5.2X-High）的系統。

Poetiq是一家專注于元系統（Meta-System）架構的AI公司。

其核心理念并不是訓練一個更大的模型，而是通過軟件層面的系統設計，自動構建「會調用模型的系統」。

Poetiq（GPT-5.2X-High）在ARC-AGI-2數據集上實現了75%準確率，每問題成本不到8美元，超越前SOTA 15個百分點。

在Poetiq（GPT-5.2X-High）系統出現之前，GPT-5.2(X-High)已經非常接近人類平均水平。

ARC-AGI-2榜單中，人類平均準確率約為60%，GPT-5.2X-High的成績與之幾乎持平，代表了當時AI在該基準上的最強推理能力。

但Poetiq的加入，使GPT-5.2(X-High)的得分從60%直接拉升到了75%，從勉強及格（人類平均水平）邁入了優等生的行列（顯著超越人類平均水平）。

在同一榜單上，還能看到Gemini 3 Deep Think（Preview）的身影。

該模型主打「深度思考（Deep Think）」技術，在ARC-AGI-2上的成績約為46%，明顯落后于GPT-5.2系列，并且成本相對后者也略高。

Poetiq表示，整個過程沒有對GPT-5.2進行任何訓練或者特定優化。

這正是Poetiq元系統的初衷，旨在自動構建完整的系統，通過調用任何現有的前沿模型來解決特定任務。

從15%的提升數據來看，Poetiq對于基礎模型性能的提升幅度還是非常明顯的。

它的存在證明了不需要堆算力，通過優秀的軟件架構也能大幅提升AI性能。

從這個角度上，它也驗證了接下來OpenAI的一個判斷——

當前大模型，正逐漸進入「能力過剩」階段。

大模型「能力過剩」時代

就在同一天，OpenAI官方也在X平臺發布了一項關于2026年的預測。

在這條推文中，OpenAI明確提到一個關鍵詞：Capability Overhang（能力過剩）。

核心意思是：

當前模型「能夠做到的事情」，與人們「實際使用AI的方式」（產生效果）之間，存在巨大的斷層。

OpenAI認為，未來AGI的進展將不再僅取決于模型本身的突破，還將取決于：

人們是否知道如何有效使用AI
AI是否真正融入現實工作與生活
系統是否能將模型能力轉化為實際價值

因此，在2026年，OpenAI將繼續前沿研究，同時重點投入于應用層、系統層、人機協同，尤其強調醫療、商業和日常生活場景。

人機協同

AGI的另一半拼圖

OpenAI這篇官方推文涉及一個人機協同的問題。

實現AGI，是需要模型和人協同發揮作用：AGI不只靠模型升級，更要「教人用AI」。

通過正確的使用AI，充分發揮出AI的潛能，這樣才能讓AI開始從「炫技」轉向「普惠」，真正影響億萬人生活。

這一觀點也得到了社區的強烈回應。

于是，樂觀的網友稱「直接把我整個人自動化吧」！

也有網友提到，真正的挑戰在于如何將AI融入工作流程中：見過太多組織買了「AI」，卻從未改變任何一個流程。

大模型真的「能力過剩」了嗎？

那么，是不是真如OpenAI所說的，大模型的能力已經過剩了呢？

通過上面Poetiq所公布的Poetiq（GPT-5.2X-High）在ARC-AGI-2上的表現，75%的得分超過了人類平均水平（60%）15個百分點。

此前OpenAI官方在介紹GPT-5時強調其在解決復雜跨學科問題上達到了專家級基準，后被外界引申為「博士級智能」。

這說明GPT-5等大模型在某些專業任務中表現類似于人類博士的專業水平。

從模型本身來說，也許并未完全過剩，但從「未被充分釋放的能力」角度來看，已經嚴重過剩。

其中，有模型設計者方的原因，比如他們沒有緊跟用戶的使用場景，「不再與用戶并肩同行了」。

也可能由于前沿模型在推理和創新上缺乏根本性的突破。

還有模型本身迭代得太快，用戶不得不在日常生活中不斷棄用已經「成功上手」的模型。

Poetiq 的出現，以及OpenAI對「能力過剩」的判斷，共同指向了未來AI領域的一個新方向：

下一階段的AI競爭，不再只是模型參數之爭，而是系統、流程與人機協同的競爭。

參考資料：

https://x.com/poetiq_ai/status/2003546910427361402

https://x.com/OpenAI/status/2003594025098785145

秒追ASI

?點贊、轉發、在看一鍵三連?

點亮星標，鎖定新智元極速推送！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

山姆·奧特曼的炒作史

DeepTech深科技 2025-12-24 14:02:44
0 跟貼 0
90 后正在掌管中國 AI，憑實力活成了「爽文」主角

愛范兒 2026-01-19 18:14:14
0 跟貼 0

碼農只剩6個月？Anthropic CEO斷言AI接管一切代碼，爆沖諾獎級智能！

新智元 2026-01-21 13:17:15
66 跟貼 66

華人AI創企ARR破億！從挖礦轉賣AI算力，連OpenAI都下單了

智東西 2026-01-21 18:38:26
0 跟貼 0
非Transformer架構新突破，液態神經網絡推理小模型只用900M內存

機器之心Pro 2026-01-21 18:08:27
3 跟貼 3

廣告主摩拳擦掌！OpenAI據傳將于二月初上線ChatGPT廣告

財聯社 2026-01-21 18:22:08
4 跟貼 4

深度｜AGI是不是一個陰謀論？

DeepTech深科技 2025-12-08 15:01:46
0 跟貼 0
一人干翻十億：5人團隊想讓“一人獨角獸”成為現實

虎嗅APP 2026-01-22 02:23:13
0 跟貼 0

AI用3年時光，來了解你！首個AI Clone長期記憶基準

新智元 2026-01-21 18:28:29
0 跟貼 0
機器人疊衣，靈巧手抓萬物，超實用機器人組合來了

量子位 2025-07-29 03:31:41
1 跟貼 1
五八智能四足機器人平臺Q20A，適用于千行百業

量子位 2025-09-30 15:35:41
0 跟貼 0
荒野求生（機器狗全自主版），2025ATEC挑戰真實戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0
格斗冠軍機器人突然發瘋！嚇呆研究人員

量子位 2025-07-25 09:10:58
8 跟貼 8
行業最大規模具身數據集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟貼 0
行業最大規模具身數據集！出自簡智機器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟貼 0
大模型也會賭博上癮！理智出走！

量子位 2025-11-03 07:06:08
0 跟貼 0
未來醫生摘得全球第一，臨床安全有效性評估新基準

量子位 2025-11-19 11:14:03
0 跟貼 0
高通萬衛星談終端大模型優勢：個性化與數據推理

量子位 2025-12-11 03:38:41
0 跟貼 0
陶哲軒：AI看似在推理，其實是在背答案

量子位 2026-01-05 09:20:21
0 跟貼 0
機器人管家Figure 03來了，承包一切家務！

量子位 2025-10-11 10:13:00
0 跟貼 0
波士頓機器狗練成“輕功”！連續七個后空翻

量子位 2025-09-07 01:03:18
0 跟貼 0
當豆包“看懂”畢加索：一次美術館的AI解說實驗，如何成為多模態競爭的試金石？

每日經濟新聞 2026-01-21 22:03:07
0 跟貼 0
英偉達巧用8B模型秒掉GPT-5 開源了

量子位 2025-12-06 14:07:18
31 跟貼 31
取消臨停，銀川一小區千余車位被“包銷”，車主回家擁堵6小時；住建部門介入

大風新聞 2026-01-21 16:11:07
6160 跟貼 6160
GPT-5編程成績有貓膩！自刪23道測試題，關鍵基準還是自己提的

量子位 2025-08-12 13:12:51
15 跟貼 15
日本人表演武士刀，動作沒看出什么技術含量，卻引的全場都歡呼！

鴨嘴愛搞笑 2026-01-21 10:18:58
1 跟貼 1
Meta啟示錄：元宇宙死亡之后

深水研究 2026-01-21 17:51:24
4 跟貼 4
理想8.2大升級！強化版VLA司機大模型上線，ADPro車型能用城市NOA

車東西 2026-01-21 17:45:32
13 跟貼 13
真正的溶栓王就在廚房，每天吃一點，讓你一輩子遠離心梗腦梗

搞笑梅姐 2026-01-22 00:26:00
0 跟貼 0
江敦濤，被罷免

新京報政事兒 2026-01-21 09:13:31
260 跟貼 260
視源股份：希沃教學大模型是公司教育AI的核心底座

每日經濟新聞 2026-01-21 21:21:26
0 跟貼 0
垃圾進垃圾出，大模型刷多了垃圾推文，智商驟降還變自戀狂

機器之心Pro 2025-10-24 18:51:47
0 跟貼 0
深圳官方明確：中小學期末不統考！

南方都市報 2026-01-21 19:21:23
578 跟貼 578
PVE太簡單？《Arc Raiders》制作組透露會提高難度

游民星空 2026-01-20 16:44:02
1 跟貼 1
索尼宣布將剝離電視機業務，與中國TCL成立合資公司，TCL持股51%

魯中晨報 2026-01-20 21:47:04
4069 跟貼 4069
2026年將至，你做好迎接巨大變化的準備了嗎？

特約前排觀眾 2026-01-22 00:10:05
11 跟貼 11
為支付安置項目工程款，13戶村民“被貸款”；當地回應：情況較復雜，正設法解決

大風新聞 2026-01-21 20:46:04
775 跟貼 775
OpenAI首席執行官奧特曼親赴中東洽談500億美元新融資

財聯社 2026-01-22 06:42:05
0 跟貼 0
索尼大作馬拉松暗諷Arc Raiders？粉絲：強太多了！

游民星空 2026-01-21 16:53:20
0 跟貼 0
馬克龍喊話中國對歐增加投資外交部回應

澎湃新聞 2026-01-21 15:40:55
59 跟貼 59

驚人的兩倍電力鴻溝，讓所有制裁成了笑話

驚人的兩倍電力鴻溝，讓所有制裁成了笑話

李榮茂

2026-01-20 08:45:13

日本版水滸傳公開最新宣傳照，將于2月15日正式開播

日本版水滸傳公開最新宣傳照，將于2月15日正式開播

隨波蕩漾的漂流瓶

2026-01-21 22:28:29

1斤315元！黑草莓成水果新“刺客”！有店鋪銷售超3000單，業內人士：黑草莓的糖度更高，基本都在15度以上

1斤315元！黑草莓成水果新“刺客”！有店鋪銷售超3000單，業內人士：黑草莓的糖度更高，基本都在15度以上

大象新聞

2026-01-21 13:45:03

國內媒體：向余望打進關鍵一球，其父親喝酒慶祝到早上

國內媒體：向余望打進關鍵一球，其父親喝酒慶祝到早上

懂球帝

2026-01-21 16:30:14

多只牛股業績出爐！002636，預計盈利增長超6倍！

多只牛股業績出爐！002636，預計盈利增長超6倍！

證券時報e公司

2026-01-21 21:12:47

被打服！越媒：中國U23不按常理出牌，越南隊本自信卻輸得慘痛

被打服！越媒：中國U23不按常理出牌，越南隊本自信卻輸得慘痛

足球大腕

2026-01-21 10:33:39

事做太絕了！徐帆回應離婚5個月近況曝光，體面被馮小剛徹底撕碎

事做太絕了！徐帆回應離婚5個月近況曝光，體面被馮小剛徹底撕碎

李橑在北漂

2026-01-21 22:26:50

80年前費孝通的《生育制度》神預言，如今被最新出生人口數據證實

80年前費孝通的《生育制度》神預言，如今被最新出生人口數據證實

齊天候

2026-01-21 15:45:18

聚焦｜林肯的年終總結：品牌、產品、體驗三大標簽與穩步前行

聚焦｜林肯的年終總結：品牌、產品、體驗三大標簽與穩步前行

桑之未

2026-01-21 12:19:17

滴滴 AI 叫車，用了幾天我發現這才是打車該有的樣子

滴滴 AI 叫車，用了幾天我發現這才是打車該有的樣子

愛范兒

2026-01-20 12:09:40

嫣然醫院房東身份遭深扒：疑是醫美機構老板，不賣樓或想重操舊業

嫣然醫院房東身份遭深扒：疑是醫美機構老板，不賣樓或想重操舊業

古希臘掌管月桂的神

2026-01-21 15:21:20

拳王鄒市明創業失敗后，妻子自曝家庭節儉開支：水費每月100元，兒子午飯39.5元

拳王鄒市明創業失敗后，妻子自曝家庭節儉開支：水費每月100元，兒子午飯39.5元

紅星新聞

2026-01-21 17:10:09

日本U23主帥：球員們經受住了考驗，用任何陣容出戰我們都能贏球

日本U23主帥：球員們經受住了考驗，用任何陣容出戰我們都能贏球

懂球帝

2026-01-21 11:43:35

非洲杯奪冠！總統宣布：球員12萬美元+1500平米土地全國放假

非洲杯奪冠！總統宣布：球員12萬美元+1500平米土地全國放假

葉青足球世界

2026-01-21 20:17:50

女子拍攝姑姑偷玉米被姑父棒殺！姑姑哀求出諒解書，女兒絕不原諒

女子拍攝姑姑偷玉米被姑父棒殺！姑姑哀求出諒解書，女兒絕不原諒

葉公子

2026-01-21 18:50:53

“回國禍害人了？”女留子畢業美圖被群嘲，網友：看過牢A就懂了

“回國禍害人了？”女留子畢業美圖被群嘲，網友：看過牢A就懂了

妍妍教育日記

2026-01-20 19:09:20

“女生遭4170元天價開鎖”事件：開鎖商戶屢查屢犯，被罰款9550元并吊銷營業執照

“女生遭4170元天價開鎖”事件：開鎖商戶屢查屢犯，被罰款9550元并吊銷營業執照

紅星新聞

2026-01-21 18:02:27

取消臨停，銀川一小區千余車位被“包銷”，車主回家擁堵6小時；住建部門介入

取消臨停，銀川一小區千余車位被“包銷”，車主回家擁堵6小時；住建部門介入

大風新聞

2026-01-21 16:11:07

新榮記張勇對暴風雨中的賈國龍伸出援手

新榮記張勇對暴風雨中的賈國龍伸出援手

界面新聞

2026-01-21 19:40:41

猛料！嫣然醫院房東拒1.6億愛心收購，卻死磕2600萬欠租？

猛料！嫣然醫院房東拒1.6億愛心收購，卻死磕2600萬欠租？

小徐講八卦

2026-01-21 08:19:44

AI產業主平臺領航智能+時代

14380文章數 66521關注度

往期回顧全部

科技要聞

給機器人做仿真訓練這家創企年營收破億

頭條要聞

特朗普稱“美國擁有無人知曉的武器” 克宮回應

頭條要聞

特朗普稱“美國擁有無人知曉的武器” 克宮回應

體育要聞

只會防守反擊？不好意思，我們要踢決賽了

娛樂要聞

首位捐款的明星苗圃現身嫣然醫院捐款

財經要聞

丹麥打響第一槍歐洲用資本保衛格陵蘭島

汽車要聞

2026款上汽大眾朗逸正式上市售價12.09萬起

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

數碼

藝術

旅游

教育

親子要聞

沒想到小伙子也能用英語跟我對話了。他的發音比我標準，最后還知道來一句“Good job” 楊雪呀

數碼要聞

追覓科技成為央視春晚智能科技生態戰略合作伙伴

藝術要聞

黃永玉精品欣賞

旅游要聞

天宮燈會明日啟幕

教育要聞

某高中電話旁邊墻上的兩個字，刺痛多少家長的心？

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板： 97久久久人妻一区精品| 欧美中日韩免费观看网站| 一区色| 精品国产网站| 91视频污| 久久综合九色综合欧洲98| 亚洲国产日韩欧美一区二区三区 | 国产精品户外野外| 六月婷婷久香在线视频| 精品人体无码一区二区三区| 中文字幕久久六月色综合| 久久九九兔免费精品6| 亚洲av二区| 亚洲无码精品人妻| 天堂无码| 亚洲毛片不卡av在线播放一区| 天天看片视频免费观看| 国产成人精品免费视频大| 丝袜天堂| 大地资源免费视频观看| 国内国外精品影片无人区| 男人av无码天堂| 少妇人妻偷人精品视蜜桃| 乌审旗| 午夜天堂一区人妻| 九九天堂| 婷婷色香合缴缴情AV第三区| 99久久久国产精品消防器材| 中文有码亚洲制服av片| 人妻另类专区欧美制服| 久久av老司机精品网站导航| 男女一边摸一边做爽爽| 国产一级AAAAA片免费| 人人干人人噪人人摸| 三级九九| 国产又色又爽又黄的免费软件| 国产在线拍揄自揄拍无码男男| 国产av剧情md精品麻豆| 亚洲AV电影网| 国产成人无码av在线影院| 久久免费少妇高潮久久精品99|

<p id="y9vaw"><li id="y9vaw"><sup id="y9vaw"></sup></li></p>

<sub id="y9vaw"></sub>