![]()
2026年4月13日,斯坦福大學發布《AI指數報告2026》(AI INDEX REPORT 2026),這是AI指數報告的第九版。該報告指出,隨著AI持續快速發展,圍繞其構建的體系能否跟上步伐成為關鍵問題。治理框架、評估方法、教育體系以及追蹤AI影響所需的數據基礎設施,正努力追趕技術本身的發展速度。AI的能力與我們對它的管理準備之間的差距,貫穿于本年度報告的每一章節。
作為新版特色,報告追蹤了AI在推理、安全及真實世界任務執行領域更具雄心的測試方式,并闡釋了為何這些評估日益難以依賴。報告還首次呈現了生成式AI經濟價值的新估算,提出了AI主權的分析框架,并與施密特科學公司合作撰寫了科學章節。報告首次設立AI在科學和在醫學中應用的獨立章節,反映了AI在這兩大領域日益增長的影響力。
該報告的總體核心要點如下:
1.AI的能力并沒有停滯不前,反而正在加速發展,并惠及到比以往更多的人群
2025年,業界已開發出超過90%的杰出前沿模型,其中一些模型在博士級別的科學問題、多模態推理和競賽數學方面,其性能已達到甚至超越人類基準。在關鍵的編碼基準測試(SWE-bench Verified)中,模型性能在一年內從60%提升至接近100%。組織機構的采用率達到88%,五分之四的大學生現在都在使用生成式人工智能。
2.中美AI模型性能差距已基本消除
自2025年初以來,中美兩國的AI模型多次交替領先。2025年2月,DeepSeek-R1曾短暫地與美國頂級模型并駕齊驅,而截至2026年3月,Anthropic的頂級模型僅以2.7%的微弱優勢領先。美國仍然擁有更多頂尖的AI模型和高影響力專利,而中國則在論文發表量、引用次數、專利產出和工業機器人裝機量方面領先。韓國則以其創新密度脫穎而出,人均AI專利數量位居世界第一。
3.美國擁有最多的AI數據中心,其中大部分芯片由臺積電制造
美國擁有5427個數據中心,是其他國家的10倍多,其能源消耗量也位居世界第一。幾乎所有領先的AI芯片都由臺積電(TSMC)一家公司制造,這使得全球AI硬件供應鏈依賴于這一家代工廠——盡管臺積電在美國的擴建項目已于2025年開始運營。
4.AI模型可以在國際數學奧林匹克競賽中贏得金牌,但卻無法可靠地讀取時間——這正是研究人員所說的AI發展“崎嶇前沿”的一個例證
Gemini Deep Think 在國際數學奧林匹克競賽中斬獲金牌,但其頂級模型讀取模擬時鐘的準確率僅為50.1%。人工智能代理在OSWorld測試中任務成功率從12%躍升至約66%,該測試旨在評估代理在不同操作系統上執行真實計算機任務的能力,但它們在結構化基準測試中仍然大約有三分之一的嘗試會失敗。
5.負責任的AI發展速度跟不上AI能力的提升,安全基準滯后,事故數量急劇上升
幾乎所有領先的前沿AI模型開發商都會報告其能力基準測試結果,但負責任AI基準測試的報告仍然參差不齊。有記錄的AI事故數量已從2024年的233起上升至362起。近期研究發現,提高負責任AI的某個維度(例如安全性)可能會降低另一個維度(例如準確性)的水平。
6.美國在AI投資方面處于領先地位,但其吸引全球人才的能力正在下降。
預計到2025年,美國私人AI投資將達到2859億美元,是中國124億美元投資額的23倍多——盡管考慮到政府的指導性資金,僅看私人投資數據可能低估了中國在AI領域的總支出。美國在AI創業活動方面也處于領先地位,預計2025年有1953家新成立的AI公司獲得融資,是排名第二國家的10倍以上。然而,自2017年以來,移居美國的AI研究人員和開發人員數量下降了89%,僅去年一年就下降了80%。
7.AI的應用正在以前所未有的速度普及,消費者正在從他們經常免費使用的工具中獲得巨大的價值
生成式AI在三年內普及率達到53%,速度超過了個人電腦和互聯網,盡管普及速度因國家、地區而異,且與人均GDP密切相關。一些國家的普及率高于預期,例如新加坡(61%)和阿聯酋(54%),而美國排名第24位,普及率為28.3%。預計2026年初,生成式AI工具為美國消費者帶來的年價值將達到1720億美元,2025-2026年間,每位用戶的中位價值將增長兩倍。
8.正規教育落后于AI,但人們在人生的各個階段都在學習AI技能
超過80%的美國高中生和大學生現在使用AI完成與學習相關的任務,但只有一半的中學制定了AI政策,而且只有6%的教師認為這些政策清晰明確。在課堂之外,阿聯酋、智利和南非的AI工程技能發展速度最快。2022-2024年,美國和加拿大新增AI博士的數量增長了22%,而這些新增博士大多選擇在學術界而非工業界就業。
9.AI主權正成為國家政策的一個決定性特征,但能力仍然不均衡,即使開源開發有助于重新分配參與者
各國AI戰略正在擴展,尤其是在發展中經濟體中,政府對AI超級計算的投資也在同步增長——這表明各國對國內AI生態系統的控制力日益增強。然而,模型生產仍然集中在美國和中國。開源開發正在重新分配參與權,世界其他地區的貢獻量在GitHub上已經超過歐洲,并接近美國,從而推動了更多語言多樣化的模型和基準測試的出現。
10.AI專家和公眾對這項技術的未來有著截然不同的看法,全球對管理AI的機構的信任度也參差不齊
在AI如何影響人們的工作方面,73%的專家預期其會產生積極影響,而公眾的這一比例僅為23%,兩者相差50個百分點。AI對經濟和醫療保健的影響也存在類似的認知差異。在全球范圍內,人們對政府監管AI的能力信任度各不相同。在受訪國家中,美國民眾對其政府監管AI能力的信任度最低,僅為31%。在全球范圍內,歐盟在有效監管AI方面比美國或中國更受信任。
該報告在教育方面的主要發現如下:
1.2024-2025年期間,美國四年制大學的計算機科學專業招生人數下降了11%,但與AI相關的研究生課程卻持續增長。在AI軟件相關領域的碩士畢業生人數從2023-2024年增長了17%,這表明即便計算機科學專業的招生人數有所下降,對AI專業人才的需求仍保持旺盛。
2.美國在各類學位層次的信息、通信與技術(ICT)專業人才的培養方面仍處于全球領先地位,但其他國家的增長速度更快。近年來,土耳其、巴西和墨西哥在培養此類專業人才方面的發展速度尤為迅速。
3.如今,美國五分之四的高中生和大學生在學習中會使用AI,但學校的相關政策卻未能跟上這一趨勢的步伐。只有半數的中學和高中制定了有關AI的政策,而僅有6%的教師認為這些政策清晰明確。學生們最常將生成式AI用于研究、論文編輯和頭腦風暴等任務。
4.目前,超過90%的國家已將計算機科學課程納入小學或中學課程體系,但AI教育的普及速度卻較為緩慢。中國和阿聯酋均在2025-2026學年開始強制推行AI教育,這標志著在國家層面正式開展AI教學工作邁出了重要一步。
5.2022-2024年期間,美國和加拿大新獲得AI博士學位的人數增長了22%,但流向產業的比例保持不變。所有的增長都集中在學術界,這扭轉了過去十年新獲得的AI博士學位主要流向產業界的趨勢。
6.人們在正規教育之外也在學習AI相關技能,并將這些技能寫進自己的簡歷中。在大多數國家,AI素養的增長速度超過了以工程為導向的AI技能的增長速度。而阿聯酋、智利和南非則是例外情況,在這些國家,自2022年以來,工程技能的增長更為顯著。
資料來源:
Stanford Institute for Human-Centered AI (HAI). Artificial Intelligence Index Report 2026. https://hai.stanford.edu/assets/files/ai_index_report_2026.pdf
[本文為教育部國別和區域研究基地中國教育科學研究院國際教育研究中心成果]
![]()
本文由中國教育科學研究院“教育國際前沿”課題組整理,課題組負責人張永軍,編輯劉強。點擊左下角閱讀原文可下載該文獻。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.