<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      吳恩達:圖靈測試不夠用了,我會設計一個AGI專用版

      0
      分享至

      鷺羽 發自 凹非寺
      量子位 | 公眾號 QbitAI

      新年新氣象!AI大神吳恩達2026年目標公開:

      要做一個新的圖靈測試,他稱之為圖靈-AGI測試

      光看名字就知道,這個測試專為AGI而生。



      去年是AGI水漲船高的一年,吳恩達在其年度總結中也曾表示:

      • 2025年或許會被銘記為人工智能工業時代的開端
      • 創新推動模型性能到達新的高度,AI驅動的應用變得不可或缺,頂尖企業人才爭奪激烈,基礎設施建設推動社會生產總值增長。

      學術界和工業界頻繁提及AGI概念,硅谷的公司也會為搶先AGI定下季度目標。

      但關于AGI的定義至今還沒有統一標準,現有基準測試還常常誤導大眾,使其高估當前的AI水平。

      吳恩達注意到該趨勢,于是新的圖靈測試將試圖彌補這一空白。



      正如網友所言:

      • 要衡量智能首先要定義智能。



      圖靈-AGI測試設想

      傳統的圖靈測試在AGI時代顯然不夠用。

      它由艾倫·圖靈在上世紀五十年代提出,提出用人機對話來測試機器的智能水平。

      在測試過程中,人類評估者需要確定他們是在與人還是與機器交談。如果機器能夠成功騙過評估者,那么就算通過了測試。

      但現在的AI顯然不再滿足于簡單的對話交互,而是要構建起經濟有用的系統,所以亟需一個能夠衡量AI工作能力的測試。

      而這就是圖靈-AGI測試的核心,要讓AI像人類一樣智能,并完成大部分的知識型工作。

      測試對象將會是AI系統或專業人士,他們將會被提供一臺可以訪問互聯網并配備瀏覽器和Zoom等軟件的計算機。



      裁判將通過計算機為測試對象設計一個多日的體驗任務,比如作為客服,會先被培訓一段時間,然后要求執行接聽電話的任務,并需要提供持續的反饋。

      只要AI能夠像人類一樣熟練完成工作任務,就會被認為通過測試。

      該測試將聚焦AGI的經濟性和實際產出,更接近普世意義下對AGI的初始定義——可用于工作和生產場景的智能。

      它也會比基準測試更考驗AI的通用能力

      現在幾乎所有的AI基準測試,如GPQA、AIME、SWE-bench等,都會預先確定一個測試集。這意味著AI團隊都會直接針對已發布的測試集來調整他們的模型。

      這就導致很多AI模型榜單排名靠前,但真實物理世界中又能力不夠。

      去年鬧得沸沸揚揚的Llama 4刷榜丑聞就是其中一個典型,明明數據看起來都很不錯,但用戶真正上手后卻傻眼了。



      此外,固定測試集只能衡量AI在某一狹窄領域的能力。相比之下,圖靈測試可以由評委自由提出任意問題,沒有提前限定范圍,更能判斷系統在通用任務上的表現。

      在改進的圖靈-AGI測試中,延續了這一設定,裁判可以任意設計體驗任務,而受測試的AI或人類測試者均不會事先知道任務內容,這將比基準測試更能判斷AGI水平。

      同時為了校準社會對AI的期望,吳恩達表示,或許他將舉辦一場圖靈-AGI測試,讓所有AI參與其中。

      即便最后的結果會是所有AI系統均未能達到標準,但也能平息長期以來對AGI的過度炒作。

      這種降溫將會為AI領域創造更穩健的環境,讓行業重新聚焦于非AGI級別的實際進步,比如開發有實用價值的應用,而不是沉迷于實現AGI的營銷噱頭。

      從長期來說,圖靈-AGI測試也會為AI團隊設定一個具體的努力目標,而非模糊地實現人類級智能。

      倘若真有某一家公司能夠通過測試,其成果也必定具備真實價值,圖靈-AGI測試將會為真正的AGI突破提供可信的判定依據。

      所以接下來,只需拭目以待。


      [1]https://x.com/AndrewYNg/status/2008578741312836009?s=20
      [2]https://www.deeplearning.ai/the-batch/issue-334/

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      連續兩輪降雪將抵達安徽

      連續兩輪降雪將抵達安徽

      魯中晨報
      2026-01-24 12:25:05
      28:15!美投票結果公布,特朗普下令復仇,希拉里要倒霉了

      28:15!美投票結果公布,特朗普下令復仇,希拉里要倒霉了

      星星會墜落
      2026-01-24 15:33:02
      央視為“嫣然”發聲了,短短15個字,道盡了李亞鵬的辛酸

      央視為“嫣然”發聲了,短短15個字,道盡了李亞鵬的辛酸

      娛樂故事
      2026-01-22 22:23:56
      央視曝光!真別再吃了!頭皮發麻!市監局通報40批食品抽檢不合格

      央視曝光!真別再吃了!頭皮發麻!市監局通報40批食品抽檢不合格

      來科點譜
      2026-01-24 08:52:28
      曝宗慶后母親葬禮:長孫宗繼昌現身,宗馥莉缺席,兩人關系被扒!

      曝宗慶后母親葬禮:長孫宗繼昌現身,宗馥莉缺席,兩人關系被扒!

      古希臘掌管松餅的神
      2026-01-23 22:11:19
      光速翻臉?6萬噸菜籽油剛賣給中國,電車就遭針對,卡尼直搖頭

      光速翻臉?6萬噸菜籽油剛賣給中國,電車就遭針對,卡尼直搖頭

      娛樂八卦木木子
      2026-01-23 12:39:27
      想當出租車司機的演員,當了導演

      想當出租車司機的演員,當了導演

      中國新聞周刊
      2026-01-23 13:54:26
      比亞迪國內銷量驟減30萬,問題究竟出在哪

      比亞迪國內銷量驟減30萬,問題究竟出在哪

      新能源前瞻
      2026-01-21 19:49:40
      “都吃成碳水臉了!”三男孩寶媽,做了一桌子素菜卻嫌孩子吃的多

      “都吃成碳水臉了!”三男孩寶媽,做了一桌子素菜卻嫌孩子吃的多

      林林先生
      2026-01-23 18:29:23
      670億美金的“碎鈔機”?越南高鐵的死線將至,中企不能去接盤

      670億美金的“碎鈔機”?越南高鐵的死線將至,中企不能去接盤

      允華說
      2026-01-23 10:33:06
      上海的窮人住在哪里?

      上海的窮人住在哪里?

      林子說事
      2026-01-24 11:50:28
      貝克漢姆家族徹底決裂,大兒子被逼反目成仇,婚外情當事人發聲

      貝克漢姆家族徹底決裂,大兒子被逼反目成仇,婚外情當事人發聲

      藝兔體壇
      2026-01-21 23:20:16
      官媒親宣,25歲王欣瑜再破天花板,讓鄭欽文和整個網球界沉默了

      官媒親宣,25歲王欣瑜再破天花板,讓鄭欽文和整個網球界沉默了

      丁丁鯉史紀
      2026-01-23 11:24:55
      國補后3999元起!史上最便宜iPhone悄悄上架 連發布會都直接省了

      國補后3999元起!史上最便宜iPhone悄悄上架 連發布會都直接省了

      小柱解說游戲
      2026-01-24 02:11:35
      伊朗對兩名ISIS成員處以絞刑

      伊朗對兩名ISIS成員處以絞刑

      環球網資訊
      2026-01-24 15:33:06
      你身邊有把一手好牌打的稀爛的人嗎?網友:都是上輩子欠人家的

      你身邊有把一手好牌打的稀爛的人嗎?網友:都是上輩子欠人家的

      帶你感受人間冷暖
      2026-01-21 00:15:05
      “華南第一女訓鯨師”被白鯨拖下水,選擇親手拆穿海洋館的殘酷

      “華南第一女訓鯨師”被白鯨拖下水,選擇親手拆穿海洋館的殘酷

      羽逸地之光
      2026-01-23 07:56:03
      泰安市岱岳區人大常委會副主任李成勇被查

      泰安市岱岳區人大常委會副主任李成勇被查

      魯中晨報
      2026-01-23 17:11:02
      集裝箱船式輔助巡洋艦開始海試,艦載武裝已恢復早期60單元垂發版

      集裝箱船式輔助巡洋艦開始海試,艦載武裝已恢復早期60單元垂發版

      嘯鷹評
      2026-01-23 23:11:40
      紀實:女子強迫情夫老公三人同床,逼丈夫看兩人茍合,結局釀慘案

      紀實:女子強迫情夫老公三人同床,逼丈夫看兩人茍合,結局釀慘案

      談史論天地
      2026-01-23 10:04:14
      2026-01-24 16:15:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12056文章數 176363關注度
      往期回顧 全部

      科技要聞

      特斯拉Cybercrab即將落地 每公里不到1塊錢

      頭條要聞

      女生被男友發現"出軌"后被逼吃穢物 煙頭燙胸大腿內側

      頭條要聞

      女生被男友發現"出軌"后被逼吃穢物 煙頭燙胸大腿內側

      體育要聞

      當家球星打替補,他們在故意擺爛?

      娛樂要聞

      李微漪更新:狼王格林去世,3字淚目

      財經要聞

      “百年老字號”張小泉遭60億債務壓頂

      汽車要聞

      有增程和純電版可選 日產NX8或于3-4月間上市

      態度原創

      教育
      房產
      手機
      藝術
      軍事航空

      教育要聞

      黃岡中考,數字有點大

      房產要聞

      正式官宣!三亞又一所名校要來了!

      手機要聞

      中國聯通確認:今年每月至少一款eSIM手機上市

      藝術要聞

      色彩之巔!法國蓬皮杜中心館藏藝術大師特展”在北京民生現代美術館開幕

      軍事要聞

      俄美烏首次三方會談在阿聯酋舉行

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 9久久精品视香蕉蕉| 偷拍精品一区二区三区| 国产成人一区二区三区在线| 亚洲国产精品无码久久久秋霞1| 日本久久69| 亚洲中文字幕A| 香港特级三A毛片免费观看| 黑巨人与欧美精品一区| 欧美日韩不卡视频合集| 五月天激情影院| 拍拍拍| 午夜福利偷拍国语对白| 国产太嫩了在线观看| 国产后入又长又硬| 国产乱妇乱子视频在播放| 国产94在线 | 亚洲| 91探花视频在线观看| 久久99精品国产麻豆蜜芽| jizzav| 视频一区二区三区刚刚碰| 又大又紧又粉嫩18p少妇| 91色老久久精品偷偷性色| 成人AV无码一区二区三区| 伊人无码一区二区三区 | 一区二区三区无码视频免费福利| 亚洲人?拳交?残酷?业余| 超碰在线91| 亚洲一级网此| 人妻无码网站| 久久99久国产精品66| 99久久久无码国产精品免费砚床 | 亚洲产在线精品亚洲第一站一| 麻豆国产va免费精品高清在线| 欧美又粗又大AAA片| 又黄又爽又色的视频| 最新色站| 欧美?级毛片一进一出夜本色| 天堂无码| 成人精品无码成人亚洲| 亚洲精品麻豆一二三区| 国产成人综合高清在线观看|