<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      沃頓教授警告:老板用AI正偷偷賺錢,而你還在審它做的17份PPT?

      0
      分享至


      新智元報道

      編輯:peter東 KingHZ

      【新智元導讀】AI已經不只會「答題」,開始下場「掙錢」了。但它也可能順手給你產出17份PPT,把你淹沒在電子垃圾里。下一代AI也許真能贏過專家,可更刺激的問題是:它會替你上班,還是讓你轉職為「AI監工」?

      悄然之間,人工智能跨越了一個關鍵門檻:它們現在已能完成具有實際經濟價值的工作。

      但當你把一份企業備忘錄交給Claude,讓它做個 PPT,結果它一口氣生成了17個版本。

      面對這種「用力過猛」的 AI,你可能會懷疑:它真的具有實用性和經濟價值嗎?

      對此,賓夕法尼亞大學沃頓商學院教授Ethan Mollick給出了他的回答。


      智能體能完成特定任務

      但無法取代工作

      考慮到開發新AI所投入的天量資源,無論是字面意義還是象征意義上,我們卻在精確衡量AI「智能」程度這件事上意外地捉襟見肘。

      目前,最普遍的做法是將AI視作人類,通過標準化測試來統計其答對題目的數量。

      這類被稱為「基準測試」的評估體系多達數十種,已成為衡量AI能力演進的核心標尺。


      但AI真的實用性?有經濟價值嗎?

      要回答這個問題,不能光靠感覺,得看數據。

      OpenAI發布了一個名叫GDPVAL的新基準測試。它不像以往的數學或常識測試,而是專門考察大模型在現實工作場景中能否創造經濟價值。

      這一次,考得很「實戰」。

      OpenAI組了個高端局:

      • 出題人:來自金融、法律、零售等行業的資深專家(平均14年經驗)。

      • 題目難度:人類專家平均需要4-7小時才能完成的真實業務任務。

      • 評測方式:AI和人類專家同臺競技,由第三方專家進行盲測打分。

      然后,OpenAI讓各家的大模型和其他專家親自完成這些任務。第三組專家對結果進行評分,評分的專家不知道哪些答案來自AI,哪些來自人類,每個問題的評分時間大約需要一小時。

      測試結果非常耐人尋味:人類專家贏了,但是贏得很難(勉強獲勝)。


      圖1:GDPVAL中,不同模型在對應任務上和人類具有相同或更好水平的比例。

      同時,測試發現AI進步極快:較新的模型得分遠超舊模型。

      輸在哪?有趣的是,大模型輸給人類,并不是因為「幻覺」或「胡說八道」,主要是因為格式排版不好沒能精確遵循指令——而這些恰恰是最容易修復的短板。


      圖2:不同領域中,大模型的表現好壞差異較大

      如果當前趨勢持續,下一代人工智能模型在這項測試中應超越人類專家。但這意味著AI已做好準備,來取代人類工作了嗎?

      回答是否定

      這里的關鍵在于:GDPVAL測試的是「任務」(Task),而我們做的是「工作」(Job)。

      • 任務是具體的:寫一段代碼、翻譯一篇文章。

      • 工作是復雜的:它包含了一連串的任務,更包含了人際溝通、決策博弈和對突發狀況的處理。

      只要AI還做不到像人類一樣處理復雜互動,它就無法取代你的崗位。

      但在這些高價值的任務中,AI什么時候能達到人類專家級水平?理論上,AI落地已無阻礙?

      Ethan Mollick教授認為,AI智能體突然變得具有落地可能,確實讓人大吃一驚。部分原因在于大家對智能體的錯誤認知 。


      智能體,工作「續航能力」指數級增長

      以前,大家認為,AI想獨立完成長任務非常難,比如寫一個完整的軟件。因為AI只要中間錯一步,后面就全完了(誤差累積)。

      但劍橋大學等機構聯手顛覆了這個認知:AI的能力并沒有遇到瓶頸,反而在爆發。


      預印本鏈接:https://arxiv.org/abs/2509.09677

      劍橋大學Akshit Sinha等研究人員挖掘出四大原因:

      1)收益非遞減:變準一點點,能做的事會暴增

      2)自我修正:它會停下來檢查,不會被一個錯誤拖死

      3)更長上下文:一次對話就能裝下更長流程

      4)更強模型能力:規劃更穩,長任務更不崩

      所有這一切意味著,AI 智能體能夠應對那些需要更多步驟才能完成的任務,并且這一過程無需人工干預。


      圖3:大模型性能的提升不會引起收益遞減的四個原因

      因此,指標METR,從GPT-3到GPT-5,在五年間持續保持了指數級增長,顯示出智能體能力增加的速度沒有放緩。


      圖4:大模型能夠穩定完成的任務所需的耗時變化

      該指標衡量AI能以至少50%幾率獨立完成的任務到底多長。

      這意味著我們在不遠的未來,就能夠看到AI完成需要專業人士一天甚至一周時間才能完成的復雜任務。

      人類決定AI的未來

      然而,真正具有自主性智能體并不存在。

      目前,我們需要決定如何使用它們,這將決定未來工作的許多方面。當下大多人關注的重點是用AI取代人類勞動所帶來的風險,而且不難看出這將在未來幾年成為一個主要問題,特別是對于那些只關注削減成本、而不是利用這些新能力來擴展或轉型工作的,同時缺乏想象力的組織。

      但在工作中使用AI,會帶來的另一個非常有可能發生的風險是:我們會無意識地讓智能體去完成一堆比我們當下所做的更多,但完全不必要的任務,例如根據一個文檔做17個PPT。

      我們如果不認真思考我們為什么要做工作,以及工作應該是什么樣子,那么會被AI生成的「電子垃圾」大潮淹沒。

      那么,替代方案是什么?

      OpenAI建議專家可以通過將任務委托給 AI ,將AI生成的結果當成初稿,由人類審查,從而與 AI 合作解決問題。如果AI生成的初稿不夠好,用戶可在提示詞中提供糾正或優化提示詞再試一次。如果那仍然不起作用,他們應該親自完成工作。

      如果專家遵循這種工作流程,論文估計他們可以加快40%的工作速度,降低60%的成本。更重要的是,他們可以保持對 AI 的控制權。


      圖5:不同大模型帶來的速度和成本提升

      具有經濟實用性的智能體已經出現。例如通過讓AI智能體去復現學術論文,可以應對學術界的「可復現性危機」。

      盡管智能體能夠完成的任務仍然有限,但它有經濟價值,并且價值正在遞增。

      出現哪一個未來,區別不在于AI技術的演變,而在于我們選擇如何使用AI。通過在我們的判斷中決定什么值得做,而不僅僅是能做什么,我們可以確保這些工具使我們變得更有能力,而不僅僅是更有效率。

      參考資料:

      https://www.oneusefulthing.org/p/real-ai-agents-and-real-work

      秒追ASI

      ?點贊、轉發、在看一鍵三連?

      點亮星標,鎖定新智元極速推送!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      明年1月1日起,向好友發淫穢信息違法!

      明年1月1日起,向好友發淫穢信息違法!

      瀟湘晨報
      2025-12-22 18:27:10
      霍啟剛沒想到,44歲郭晶晶再傳喜訊,讓霍震霆和香港闊太圈沉默了

      霍啟剛沒想到,44歲郭晶晶再傳喜訊,讓霍震霆和香港闊太圈沉默了

      白面書誏
      2025-12-23 14:10:47
      快手變快播?深夜上萬直播間同時"搞黃色"裸聊,年度最大網絡事故

      快手變快播?深夜上萬直播間同時"搞黃色"裸聊,年度最大網絡事故

      派大星紀錄片
      2025-12-23 16:49:00
      明年1月1日起,向好友發淫穢信息,無論是公開微信群還是私人私聊均違法

      明年1月1日起,向好友發淫穢信息,無論是公開微信群還是私人私聊均違法

      觀威海
      2025-12-23 09:18:13
      全球貴金屬市場集體狂歡,國內金飾克價漲破1400元!消費者:買的黃金產品還沒發貨,就開始漲價,網友熱議......

      全球貴金屬市場集體狂歡,國內金飾克價漲破1400元!消費者:買的黃金產品還沒發貨,就開始漲價,網友熱議......

      每日經濟新聞
      2025-12-23 14:55:08
      劉嘉玲曝林青霞家中的麻將房掛“東方不敗”照片:坐在她家里面打麻將要嚇死了

      劉嘉玲曝林青霞家中的麻將房掛“東方不敗”照片:坐在她家里面打麻將要嚇死了

      紅星新聞
      2025-12-22 18:29:10
      中方將允許韓國流行音樂等文化產品重新進入中國大陸?外交部回應

      中方將允許韓國流行音樂等文化產品重新進入中國大陸?外交部回應

      澎湃新聞
      2025-12-23 15:36:34
      江蘇帥哥劉鮑錦去世,年僅17歲,還有2天過生日,女友曬合影淚目

      江蘇帥哥劉鮑錦去世,年僅17歲,還有2天過生日,女友曬合影淚目

      180視角
      2025-12-22 12:47:32
      南京博物院背后的徐院長、徐公子、徐小姐,都是人才啊!

      南京博物院背后的徐院長、徐公子、徐小姐,都是人才啊!

      人格志
      2025-12-23 00:04:02
      民政局澄清“上海46歲獨居女子離世,遺產歸公無法買墓地爭議”:買墓地可從中支付

      民政局澄清“上海46歲獨居女子離世,遺產歸公無法買墓地爭議”:買墓地可從中支付

      農視網
      2025-12-23 09:31:55
      上海安遠路一工地門口上午發生事故 2人不幸身亡

      上海安遠路一工地門口上午發生事故 2人不幸身亡

      環球網資訊
      2025-12-23 16:18:10
      估值1.05萬億!DeepSeek再次封神,英偉達市值一夜蒸發6000億美元

      估值1.05萬億!DeepSeek再次封神,英偉達市值一夜蒸發6000億美元

      毒sir財經
      2025-12-23 15:12:04
      回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

      回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

      就一點
      2025-11-22 10:36:39
      太瘋狂,集體飆漲!有人看傻眼,“下午剛買的,還沒發貨就賺了…”

      太瘋狂,集體飆漲!有人看傻眼,“下午剛買的,還沒發貨就賺了…”

      山西晚報
      2025-12-23 11:22:55
      江蘇省委省政府成立調查組

      江蘇省委省政府成立調查組

      第一財經資訊
      2025-12-23 13:23:58
      收藏家龐萊臣后人談南京博物館:“不能理解,不能接受”

      收藏家龐萊臣后人談南京博物館:“不能理解,不能接受”

      互聯網大觀
      2025-12-23 12:03:00
      【E汽車】紅旗天工國標眾測,重新理解“汽車安全”!

      【E汽車】紅旗天工國標眾測,重新理解“汽車安全”!

      e汽車
      2025-12-22 20:40:01
      南博父子局:揭秘文物圈最隱秘“家族盜寶隊”

      南博父子局:揭秘文物圈最隱秘“家族盜寶隊”

      智識漂流
      2025-12-23 09:57:17
      山姆爆火的400克女款羽絨服,打了多少商家的臉?

      山姆爆火的400克女款羽絨服,打了多少商家的臉?

      娛樂資本論
      2025-12-22 11:53:59
      死刑!就是給這種人準備的!

      死刑!就是給這種人準備的!

      鈞言堂
      2025-12-23 14:38:14
      2025-12-23 19:11:00
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      14166文章數 66395關注度
      往期回顧 全部

      科技要聞

      慘烈90分鐘!快手驚魂:遭遇最強黑產攻擊

      頭條要聞

      美國"全面封鎖"受制裁油輪 一艘油輪狂發75次求救信號

      頭條要聞

      美國"全面封鎖"受制裁油輪 一艘油輪狂發75次求救信號

      體育要聞

      楊瀚森連續5場DNP!開拓者遭活塞雙殺

      娛樂要聞

      朱孝天回應阿信感謝,自曝沒再收到邀約

      財經要聞

      祥源系百億產品爆雷 浙金中心18人被拘

      汽車要聞

      四款新車集中發布 星途正式走進3.0時代

      態度原創

      房產
      時尚
      本地
      數碼
      軍事航空

      房產要聞

      獨家猛料!16.1億,浙江老板搶下雅居樂清水灣261畝重磅宅地!

      推廣|| 用完立馬復購!百元get大牌膚感

      本地新聞

      云游安徽|宣城何以動人心,百年塔影一城徽韻

      數碼要聞

      英特爾酷睿Ultra賦能華碩靈耀14 2025商務精英本

      軍事要聞

      中方回應烏克蘭或將制裁中國公民

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲无码日日| 久久综合色之久久综合色| 999精品视频免费| jizz国产| 日韩激情成人| 欧美性猛交xxxx免费看| 宜兰市| 99久久婷婷国产综合精品青草漫画| 欧美自拍嘿咻内射在线观看| 永城市| 久久99嫩草熟妇人妻蜜臀| 久久久天堂国产精品女人| 久久不见久久见免费影院www日本| 涞水县| 3P无码| 中文字幕日韩一区二区不卡| 久久精品中文字幕有码| 永久免费AV| 精品九九在线| 丁香五月激情图片| 成人网站在线进入爽爽爽| 果冻传媒色av国产在线播放| 亚洲熟女av中文字幕| 97人妻免费公开视频| 国产亚洲欧洲AⅤ综合一区| 一个人在线观看免费视频www| 国产欧美日韩精品a在线观看| 伊人久久大香线蕉精品,亚洲国产一成人久久精品,久久99精品久久久久久三级,亚 | 久久毛| 精品av| 亚洲成av人片天堂网无码| 亚洲无码成人电影| 丰满多毛的大隂户视频| 激情欧美日韩一区二区| 南江县| 国产精品A片| 免费看婬乱a欧美大片| 亚洲精品国产AV| 久久久久无码精品亚洲日韩| 一本久道久久综合无码中文 | 97在线视频免费人妻|