<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<pre id="in8vg"><samp id="in8vg"><mark id="in8vg"></mark></samp></pre><tt id="in8vg"><mark id="in8vg"></mark></tt>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

AI的鋸齒前沿：金牌能力與簡單任務的反差，喜憂參半

2026-04-17 14:59:40　來源: 心本來就不大

四川舉報

0

分享至

今天，斯坦福HAI重磅發布「2026年AI指數報告」！

這份長達423頁的年度報告，全面揭示了全球AI產業的最新權力版圖。

它給出了一條核心結論：AI的本事漲得飛快；但人類衡量和管好它的能力，卻沒怎么跟上步伐。

其中，最震撼的結論是——

中美AI模型性能差距已基本消失，雙方在巔峰對決中頻繁易主，目前Anthropic領先優勢僅剩2.7%。

美國在AI上砸的錢比誰都多，但招攬頂尖人才卻越來越吃力了。

報告還指出，AI的進化不僅沒有遭遇所謂的「瓶頸」，反而正以史無前例的速度狂飆。

過去一年，全球超90%的頂尖模型，在博士級科學問題、多模態推理、競賽數學上的表現，追平甚至超越了人類。

特別是在代碼能力上，SWE-bench的成績在一年內，從60%飆升至近100%。

AI的「偏科」現象極其嚴重，呈現出一種畸形的現狀：

LLM可以拿下IMO金牌，卻讀不對模擬時鐘，正確率僅為50.1%。

AI搶飯碗這事兒已經從預測變成了現實，而且最先遭殃的就是當代年輕「打工人」。

下面直接上干貨，「2026年AI指數報告」最值得關注的12個硬核趨勢。

其他亮點速覽：

中美貼臉

差距只剩2.7%

斯坦福把2023年5月以來Arena榜單上的美國第一和中國第一，畫在了同一張坐標系里。

2023年5月，gpt-4-0314拿1320分領跑，中國這邊還是chatglm-6b，差距300多分。

2025年2月，DeepSeek-R1第一次和美國頭部模型短暫打平。

2026年3月，美國的Claude Opus 4.6拿到1503分，中國dola-seed-2.0-preview拿到1464分。

如今中美AI之間的差距，僅有39分。換算成百分比，2.7%。

更值得說的是過去一年的換位頻率。從2025年初開始，兩國頭部模型已經在Arena上你來我往換了好幾次位置。

數量上同樣接近五五開。

2025年美國發布了50個「顯著模型」，中國緊跟著也發布了30個頂尖大模型。

第一梯隊里OpenAI、谷歌、阿里、Anthropic、xAI同臺站位，全球TOP 5五五分賬。

再往下看到TOP 10，中國機構和企業占了四席，阿里、DeepSeek、清華、字節。

開源生態這一年的重心也明顯東移。

DeepSeek、Qwen、GLM、MiniMax、Kimi一路把開源權重的能力曲線往前推。

價格層面是另一條戰線。

海外開發者在X上算過一筆賬，Seed 2.0 Pro的輸出價格大約只有Claude Opus 4.6的十分之一。

性能貼臉，價格只要十分之一。這件事的連鎖反應才剛剛開始。

90%前沿模型出自產業

封神速度史無前例

去年發布的95個最具代表性的模型里，超過九成都來自產業界，不是學術機構，也不是政府實驗室。

學術界已經追不上前沿了。

發布速度也在變態加速。

光是2026年2月一個月，就有Gemini 3.1 Pro、Claude Opus 4.6、GPT-5.3 Codex、Grok 4.20、Qwen 3.5、Seed 2.0 Pro、MiniMax M2.5、GLM-5八九個旗艦模型同月入場。

封神周期從「年」變成了「月」。

基準一年封頂

AI沒有瓶頸

最猛的曲線是編程。

SWE-bench Verified這個真實修Bug的基準，一年時間從60%漲到接近100%。

不是漲了幾個點，是基本封頂。

Terminal-Bench測試Agent處理真實終端任務的能力，從去年的20%漲到77.3%。

網絡安全Agent解決問題的成功率，從15%漲到93%。

Gemini Deep Think在國際數學奧林匹克拿到金牌。

PhD級科學問答（GPQA Diamond）、競賽數學（AIME）、多模態推理（MMMU）這些原本被認為「人類不可超越」的硬骨頭，全部被前沿模型啃了下來。

最能說明問題的是Humanity's Last Exam。

這是一個專門被設計來「難倒AI、偏袒人類專家」的測試，題目由各個領域的頂尖專家提供。

去年OpenAI的o1拿到8.8%，前沿模型在一年時間里把分數往上又推了30個百分點，目前Claude Opus 4.6和Gemini 3.1 Pro已經雙雙過了50%。

鋸齒前沿

能拿IMO金牌卻看不懂表

但同一份指數甩出了另一組數字。

最強模型在「讀模擬時鐘」這個任務上的正確率，是50.1%。

機器人在實驗室仿真環境（RLBench）里的操作成功率已經達到89.4%。但搬到真實家庭場景里完成洗碗、疊衣服這類家務，成功率立刻掉到12%。

實驗室和廚房之間，差了77個百分點。

研究者把這種現象命名為「鋸齒前沿」（jagged frontier）。AI能力的分布是凹凸不平的，能拿數學奧賽金牌，卻沒法穩定地告訴你現在幾點。

AI能在數學奧賽拿金牌，但只有一半的概率能看懂模擬時鐘。AI在加速，但加速的不是同一個方向。

另外，在智能體任務中，OSWorld測試中，前沿AI實力（66.3%）正逼近人類基線。

在專門評估科研邏輯的PaperArena測試中，最強AI加持的Agent，得分僅39%，只有博士生一半的功力。

但這種凹凸已經不影響企業把AI往生產線上塞。

AI Index給出的另一個數字是，全球企業AI采用率達到88%。九成的公司已經把AI接進了某個工作流。

代價同步在漲。AI相關事故記錄從2024年的233起漲到362起。

錢在加速

5817億砸進AI

2025年全球企業AI投資達到5817億美元，同比增長130%。其中私募投資3447億美元，同比增長127.5%。

兩條曲線都幾乎翻倍。

國別上，美國一騎絕塵。2025年美國私募AI投資2859億美元。并且一年新增1953家AI創業公司，也是排名第二的10倍以上。

錢在加速涌向美國。但美國的另一項核心資源，正在反向流動。

人在流走

進美國的AI研究者跌了89%

里面有一組數字讓人愣了一下。

2017年到現在，進入美國的AI研究人員和開發者數量下降了89%。

更關鍵的是，這個下降在加速。僅僅過去一年，下降幅度就達到80%。

美國仍然是全球AI研究人員密度最高的國家，但流入的水龍頭正在擰緊。

錢和人這兩條曲線開始反向。這是過去十年沒出現過的局面。

算力三年漲30倍

命門都在一家公司手里

AI能力曲線在加速，背后那條算力曲線跑得更猛。

從2021年到現在，全球AI算力總量漲了30倍。過去三年里，每年都在翻三倍以上。

撐起這條曲線的是少數幾家公司。

英偉達一家的GPU，占據了全世界AI算力的60%以上。亞馬遜和谷歌靠自研芯片排在二三位，但加起來也遠遠追不上英偉達。

而幾乎所有這些芯片，都來自一家代工廠，臺積電。算力曲線越陡，命門就越窄。

代價也在加大。

全球AI數據中心的總功率已經達到29.6 GW，相當于紐約州在用電高峰時段的全部用電需求。xAI Grok 4一次訓練的估算碳排放是72816噸二氧化碳當量，相當于17000輛汽車開一整年的尾氣。

數據中心建在哪里，電從哪里來，芯片從哪里產，這三個問題已經變成今年所有AI公司CEO案頭最頭疼的事。

生成式AI三年滲透53%

中國職場使用率破80%

生成式AI在三年內達到了53%的全球人口滲透率。

這個速度比個人電腦快，比互聯網快。

但滲透速度和國別相關性極強。新加坡61%，阿聯酋54%，都跑在美國前面。美國在調查覆蓋國家中只排第24位，滲透率28.3%。

如果把維度從消費者換成職場，反差更大。

報告里另一組數據顯示，2025年全球58%的員工在工作中已經開始經常性使用AI。但在中國、印度、尼日利亞、阿聯酋、沙特這5個國家，這個比例超過了80%。

中國的職場AI滲透率，已經比全球平均高出20個百分點以上。

更有意思的是消費者價值。

AI Index估算，到2026年初，生成式AI工具每年給美國消費者創造1720億美元的價值。從2025年到2026年，每個用戶的中位數價值翻了三倍。

絕大多數用戶用的還是免費版。

普通人愿意為AI付的錢，遠低于AI給他們創造的價值。這中間的剪刀差是現在所有AI公司都在試圖彌合的東西。

入門崗位銳減

22-25歲開發崗狂砍20%

22到25歲的軟件開發者群體，從2024年至今，就業人數下降了大約20%。

同期，年紀更大的同行群體反而在增長。

不止開發崗。客服等其他高AI暴露行業，也在出現同樣的模式。

更讓人擔心的是企業問卷的結果。受訪高管普遍預期，未來的裁員幅度會比過去幾個月還要大。

這不是宏觀失業率的事，是入口崗位被精準切掉的事。

第一份工作沒了，整個職業階梯就斷了一格。這件事的長期影響，現在沒人能算清。

AI正在改寫科學發現的方式

如果說就業那一段是冷的，科學這段就是熱的。

具體到應用，今年第一次有AI完整跑通了端到端的天氣預報流程。從原始氣象觀測數據直接吐出溫度、風速、濕度的最終預報，中間沒有任何傳統數值模型介入。

醫院里也是一樣。2025年大量醫院開始部署能從就診對話自動生成臨床記錄的AI工具。多個醫院系統的醫生反饋，寫病歷的時間減少了多達83%，工作倦怠顯著下降。

但同一份指數給醫療AI潑了一盆冷水。一份針對500多個臨床AI研究的綜述發現，將近一半的研究依賴考試題式的數據集，只有5%用了真實臨床數據。

AI能減少醫生敲鍵盤的時間，這件事是確定的。AI在真實病人身上的臨床價值，目前還有大量問號。

自學浪潮全球開炸

正規教育已經掉隊

正規教育跟不上AI了。

美國有4/5的高中生和大學生現在用AI完成學校作業。但只有一半的中學有AI使用政策，只有6%的老師認為這些政策寫得清楚。

學生跑在前面，老師還在原地，規則還沒出現。

正規教育跟不上的同時，自學浪潮在全球開炸。里面寫，學AI工程技能增長最快的三個國家分別是阿聯酋、智利和南非。

不是美國，不是歐洲。

技能曲線的最陡峭的那一段，長在所有人都沒在看的地方。

最強模型變成最不透明的

專家和公眾撕裂

最強的模型，正在變成最不透明的模型。

Foundation Model Transparency Index今年的平均分從去年的58分跌到了40分。AI Index直接點名，谷歌、Anthropic、OpenAI都已經放棄公開最新模型的訓練數據規模和訓練時長。

去年發布的95個最具代表性的模型里，80個沒有公開訓練代碼。

公眾的情緒也變得更復雜。

全球范圍內，認為AI利大于弊的比例從52%上升到59%。但同期，對AI感到緊張的比例從50%上升到52%。

兩個方向在同時增長。

最分裂的是美國。只有33%的美國人認為AI會讓自己的工作變得更好，全球平均是40%。美國人對本國政府監管AI的信任度，是受訪國家里最低的，31%。

新加坡人對自己政府監管AI的信任度，是81%。

最近Sam Altman家被襲擊的事件之后，硅谷圈內人「驚訝地發現」Instagram評論區里的普通人對此并不同情，甚至有人覺得「應該更激烈一點」。

他們沒意識到事情已經糟到這個程度。

研報引用的Pew和Ipsos數據，專家和公眾在AI影響就業、醫療、經濟這些維度上的觀感差距，普遍超過30個百分點，最大的一項達到50個百分點。

一邊是實驗室里的曲線在飛漲，一邊是普通人心里的不安在累積。

中間沒有橋。

423頁的報告里有幾百張圖表，但其實只畫了一張圖。

橫軸是時間，縱軸是能力。

模型能力的曲線在飛，算力曲線在飛，投資曲線在飛，采用率曲線在飛。其他全都在原地踏步或者向下。

這就是2026年AI Index的全部內容。

AI在加速。其他所有東西都在脫節。

聲明：個人原創，僅供參考

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

小男孩翻出陽臺玩耍，媽媽耐心引導其回室內，抓住瞬間憤怒值拉滿

星視頻 2026-04-27 07:54:01
124 跟貼 124
一大批高校，將搬遷！

吉刻新聞 2026-04-27 16:08:43
139 跟貼 139

一醫院原院長：我就像一個吸血鬼

南方都市報 2026-04-26 23:49:54
153 跟貼 153

外賣后廚人員在鍋里洗掃把、吐口水？最新：兩家店鋪已提前打烊，店長稱吐口水是因嘴里進油本能吐了下，將嚴懲涉事人員

封面新聞 2026-04-27 00:38:15
250 跟貼 250
美國方面稱26日僅有2艘船只通過霍爾木茲海峽

界面新聞 2026-04-27 08:14:11
2290 跟貼 2290

買衛生紙得多個心眼！這樣用可能致病又致癌——

BRTV新聞 2026-04-27 23:05:44
2 跟貼 2

江蘇一70多歲老人想打工，辦假證把年齡改小8歲，還特意染了黑發，民警：他老伴離世，自己一個人想找個工作充實自己

大象新聞 2026-04-27 11:17:05
578 跟貼 578
烏克蘭民眾戰爭倦怠情緒日益加深

參考消息 2026-04-27 10:09:05
591 跟貼 591

華山南峰論劍石被拆，官方回應：北峰以外所有“華山論劍”石都會被拆

現代快報 2026-04-26 14:00:13
265 跟貼 265
被指"混不下去回國" 廣東專家顏寧回懟：崇洋媚外

南方都市報 2026-04-27 11:12:26
221 跟貼 221
上海迪士尼回應游客勸阻吸煙被打：園區沒有禁煙；被打男子發聲：對方已賠錢和解

中國新聞周刊 2026-04-27 14:25:00
1 跟貼 1
“楊冪臉被蒸汽眼罩燙傷了”熱搜爆了，本人曬右眼下方紅色燙傷痕跡，并配文：蒸汽眼罩咬我

魯中晨報 2026-04-27 21:04:03
8 跟貼 8
美海軍考慮從外國購買軍艦和零部件：日韓成潛在選擇

澎湃新聞 2026-04-27 14:28:09
34 跟貼 34
文旅部集中整治景區擺渡車，點名龍虎山、長白山、稻城亞丁等

南方都市報 2026-04-27 16:21:12
139 跟貼 139
湖州南潯古鎮有艘“核動力觀光船”？景區回應：售票牌翻譯錯誤，會進行整改

上游新聞 2026-04-27 13:01:24
125 跟貼 125
江淮汽車：目前尊界S800面向國內銷售

每日經濟新聞 2026-04-27 16:27:20
98 跟貼 98
趙心童曬童年及世錦賽比賽合影致敬丁俊暉：一起加油

現代快報 2026-04-27 09:47:33
185 跟貼 185
美國已打空半數導彈儲備？研究稱重建庫存或需長達四年

財聯社 2026-04-27 15:22:17
63 跟貼 63
收評：科創50指數高開高走漲3.76% 半導體產業鏈爆發

財聯社 2026-04-27 15:03:17
3 跟貼 3
廬山西海景區發布情況通報

澎湃新聞 2026-04-27 08:55:19
187 跟貼 187
泡泡瑪特推出Labubu冰箱，售價5999元，上千人預約

大象新聞 2026-04-26 13:01:02
0 跟貼 0
從生態中國網的三連問到江蘇律師王樂發起公益訴訟，草千里這次在劫難逃

問道求真 2026-04-28 00:06:47
0 跟貼 0
楊妞花這五年，干了五件大事

董狐筆談 2026-04-28 00:13:06
0 跟貼 0
沈陽地鐵發布情況通報！

沈陽公交網小林 2026-04-28 00:11:04
0 跟貼 0

明晚開播！CCTV-8黃金檔又一王炸新劇來襲！實力派陣容，開播要火

明晚開播！CCTV-8黃金檔又一王炸新劇來襲！實力派陣容，開播要火

阿廢冷眼觀察所

2026-04-28 00:07:06

車還在，廠沒了，40 萬哪吒車主的尷尬

車還在，廠沒了，40 萬哪吒車主的尷尬

科技狐

2026-04-26 22:54:06

真慘！燃油車再次迎大降價，最大跌幅50%，老車主“背刺”成常態

真慘！燃油車再次迎大降價，最大跌幅50%，老車主“背刺”成常態

小談食刻美食

2026-04-25 09:34:33

竇靖童宋妍霏分吃一碗粉！從擋雨到牽手遛狗，多次被拍細節藏不住

竇靖童宋妍霏分吃一碗粉！從擋雨到牽手遛狗，多次被拍細節藏不住

小徐講八卦

2026-04-27 09:23:46

80W全能卷王，輕薄本也能玩3A！惠普星Book Pro 16深度測評

80W全能卷王，輕薄本也能玩3A！惠普星Book Pro 16深度測評

電腦報

2026-04-20 16:51:12

摯達科技2026合作伙伴大會在京舉行：三款顛覆性新品定義人·車·能新生態，以全球化與智能化重塑行業航向

摯達科技2026合作伙伴大會在京舉行：三款顛覆性新品定義人·車·能新生態，以全球化與智能化重塑行業航向

AutoBusiness

2026-04-27 14:48:30

曼城夏窗迎大換血！9人清洗+1.9億引援，中場重構成頭號目標！

曼城夏窗迎大換血！9人清洗+1.9億引援，中場重構成頭號目標！

田先生籃球

2026-04-27 16:19:57

內分泌科主任：糖尿病最危險信號，不是口渴，是頻繁出現4異常

內分泌科主任：糖尿病最危險信號，不是口渴，是頻繁出現4異常

垚垚分享健康

2026-04-27 15:02:26

今夜，利好來了！A股公司，集體公告！

今夜，利好來了！A股公司，集體公告！

券商中國

2026-04-27 22:53:49

亞冠精英賽決賽頒獎典禮，町田球員疑似向裁判團隊豎中指

亞冠精英賽決賽頒獎典禮，町田球員疑似向裁判團隊豎中指

懂球帝

2026-04-27 17:59:05

皇馬官方：姆巴佩確診左腿半腱肌拉傷！

皇馬官方：姆巴佩確診左腿半腱肌拉傷！

懂球帝

2026-04-27 18:59:50

這下麻煩大了！不到24小時，許家印傳來3個壞消息，個個戳他心窩

這下麻煩大了！不到24小時，許家印傳來3個壞消息，個個戳他心窩

娛瓜醬

2026-04-27 15:23:10

萊巴金娜對陣鄭欽文比賽罕見情緒失控：再也不信電子司線系統！

萊巴金娜對陣鄭欽文比賽罕見情緒失控：再也不信電子司線系統！

網球之家

2026-04-27 23:52:07

惡劣！35歲阿根廷國門染紅后情緒失控拳擊對手引群毆或禁賽12場

惡劣！35歲阿根廷國門染紅后情緒失控拳擊對手引群毆或禁賽12場

我愛英超

2026-04-27 07:10:39

忠縣驚現特大謀殺案！副縣長辦公室內慘遭殺害，真相引人深思！

忠縣驚現特大謀殺案！副縣長辦公室內慘遭殺害，真相引人深思！

人生錄

2026-04-24 09:13:06

上海地鐵互毆：知情人曝老太惡心事，臭毛病屢不改，女孩恐丟工作

上海地鐵互毆：知情人曝老太惡心事，臭毛病屢不改，女孩恐丟工作

奇思妙想草葉君

2026-04-27 21:57:23

世界杯制造20球有多難？歷史僅5人，巴西德國霸榜，現役僅1人

世界杯制造20球有多難？歷史僅5人，巴西德國霸榜，現役僅1人

籃球圈里的那些事

2026-04-27 09:24:49

生理旺盛的女性，大多有這3個特征，超準！

生理旺盛的女性，大多有這3個特征，超準！

皓皓情感說

2026-04-25 19:09:10

大度丁俊暉：我知道你們都希望趙心童贏我我一直都支持中國選手

大度丁俊暉：我知道你們都希望趙心童贏我我一直都支持中國選手

風過鄉

2026-04-27 07:39:09

世錦賽16進8最新戰報：吳宜澤領先四冠王，趙心童晉級八強戰墨菲

世錦賽16進8最新戰報：吳宜澤領先四冠王，趙心童晉級八強戰墨菲

夜深聊球

2026-04-27 20:58:41

心本來就不大

心本來就不大

513文章數 105關注度

往期回顧全部

科技要聞

DeepSeek V4上線三天，第一批實測出來了

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者身份非常不一般

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者身份非常不一般

體育要聞

人類馬拉松"破二"新紀元，一場跑鞋軍備競賽

娛樂要聞

黃楊鈿甜為“耳環風波”出鏡道歉：謠言已澄清

財經要聞

Meta 140億收購Manus遭中國發改委否決

汽車要聞

不那么小眾也可以 smart的路會越走越寬

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

時尚

房產

本地

軍事航空

藝術要聞

他的油畫筆觸粗獷又細膩，透著一種不可言說的美！

絲巾的10種系法，愛美的女人必看

房產要聞

信號！海南商業版圖，迎來大變局！

本地新聞

云游中國｜逛世界風箏都留學生探秘中國傳統文化

軍事要聞

伊朗外長折返伊斯蘭堡內情披露

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：亚洲老女人区一区二视频| 日韩中文字幕高清有码| 乱女伦露脸对白在线播放| 91黑丝视频| 国产超高清麻豆精品传媒麻豆精品| 九九精品99久久久香蕉| 国产美女亚洲精品久久久毛片| 国产精品免费看久久久无码| 日本高清一区| 娇妻系列交换27部多p在线观看 | 亚洲精品系列| 国产精品黄色片| 91欧洲在线视精品在亚洲| 亚洲精品久久久久久下一站| 久久精品国产99国产精偷| 国内精品卡一卡二卡三| 精品久久国产| 国内少妇偷人精品视频| 人妻少妇视频| 中文字幕久久精品无码综合网| 国产mv在线天堂mv免费观看| 2021精品国产自在现线看| 亚洲国产成人字幕久久| 久久国产亚洲一区二区三区| 亚洲中文字幕在线第六区| 大同市| 九九热爱视频精品| 顶级熟女在线| 97人妻精品一区二区三区视频蜜桃0.0.0.| 欧美成人黄在线观看| 亚洲第一国产综合| 亚洲天堂欧美| 国产精品久久午夜夜伦鲁鲁| 久久精品国产久精国产| 天祝| 精品国产美女av久久久久| 亚洲色小说| 亚洲无码在线播放| 麻豆国产精品VA在线观看| 亚洲午夜香蕉久久精品| 久久综合九色综合欧洲98|

<s id="dfrax"><code id="dfrax"></code></s>

<tfoot id="dfrax"><strike id="dfrax"></strike></tfoot>

<kbd id="dfrax"></kbd>

<ruby id="dfrax"><font id="dfrax"></font></ruby>

<abbr id="dfrax"></abbr>