<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      真正的人工智能代理與實際的工作

      0
      分享至

      以人為本的工作模式與無限PPT之間的競爭

      作者:Ethan Mollick 2025年9月30日

      人工智能已悄然跨越一道門檻:如今它們能完成真正具有經濟價值的實際工作。

      此前,OpenAI發布了一項新的人工智能能力測試。與以往圍繞數學或常識構建的基準測試不同,此次測試中,OpenAI召集了平均擁有14年行業經驗的專家——他們的領域涵蓋金融、法律、零售等。這些專家設計了一系列貼近實際的任務,這些任務人類專家平均需要4到7個小時才能完成。隨后,OpenAI讓AI和人類專家分別完成這些任務。另有一組專家對結果進行評分,且他們并不知道哪些答案來自人工智能、哪些來自人類,每個問題的評分過程約耗時 1 小時。

      人類專家最終勝出,但優勢微弱,且不同行業的勝負差異也很大。不過,人工智能的進步速度極快,較新的人工智能模型得分遠高于舊模型。有趣的是,人工智能輸給人類的主要原因并非幻覺或錯誤,而是結果格式不規范、未嚴格遵循指令——而這些領域正是人工智能進步迅速的方向。若當前趨勢持續,下一代人工智能模型在該測試中平均得分有望超過人類專家。這是否意味著人工智能已準備好取代人類工作?

      答案是否定的(至少短期內不會),因為該測試衡量的是“任務”,而非“工作”。我們的工作由多項任務構成。以我作為教授的工作為例,它并非單一事項,而是涵蓋教學、研究、寫作、填寫年度報告、輔導學生、閱讀、行政事務等多個方面。人工智能完成其中一項或多項任務,并不會取代我整個工作,而是改變我的工作內容。只要人工智能的能力仍存在短板,無法替代人類互動中的所有復雜工作,它就難以整體取代人類的工作……

      一項極具價值的任務

      ……但即便如此,人工智能目前能完成的部分任務已具備極高價值。不妨以我工作中的關鍵環節為例:開展精準的研究工作。正如許多人所知,學術界存在 “可復現性危機”——部分重要研究成果,其他研究者無法復現。學術界在解決這一問題上已取得一定進展,如今許多研究者會公開數據,方便其他學者復現自己的研究。但問題在于,復現研究需耗費大量時間:研究者需深入閱讀并理解論文、分析數據、細致檢查錯誤 1,這一復雜過程此前只有人類能夠完成。

      而現在,情況已發生改變。

      我將一篇涉及多項實驗的復雜經濟學論文文本,以及完整的研究復現數據集,輸入新版 Claude Sonnet 4.5(我擁有該模型的提前使用權)。除了上傳文件并給出指令外,我未進行任何額外操作。指令內容為:“根據上傳的數據集復現該論文中的研究結果,需獨立完成;若無法完整復現,可盡力完成力所能及的部分”。由于論文涉及復雜統計分析,我還補充了要求:“能否盡可能完整復現所有統計過程?”

      在無需進一步指令的情況下,Claude完成了一系列操作:閱讀論文、打開數據集文件并整理、將統計代碼從一種語言(STATA)轉換為另一種語言(Python)、系統梳理所有研究結果,最終報告成功復現研究結論。我抽樣核查了結果,并讓另一款人工智能模型 GPT-5 Pro再次復現該研究,結果均無誤。我還在其他多篇論文上進行了嘗試,均取得了類似的良好效果,僅部分論文因文件大小限制或復現數據本身存在問題,未能成功復現。若手動完成這些工作,需耗費數小時。

      但這一過程的革命性意義,并非僅在于節省時間。更重要的是,曾震動多個學術領域的 “可復現性危機”,本可通過研究復現部分解決,但此前這需要人類投入大量細致且高昂的精力,難以大規模推進。如今,人工智能似乎可對大量已發表論文進行核查、復現研究結果,這將對整個科學研究領域產生深遠影響。盡管目前仍存在障礙——如準確性與公平性基準的建立,但大規模復現研究已成為現實可能。研究復現或許只是人工智能能完成的一項“任務”,而非“工作”,但它極有可能徹底改變人類的整個研究領域。是什么讓這一切成為可能?答案是:人工智能代理的能力已迅速大幅提升。

      核心在于智能體

      自初代ChatGPT問世以來,生成式人工智能已幫助人們完成了大量任務,但始終存在一個局限:需人類用戶主導。人工智能會犯錯,若沒有人類在每一步進行指導,就無法完成有價值的工作。人們曾認為,“自主人工智能智能體”的愿景遙不可及——這類智能體在接收任務后,能自主規劃、使用工具(如編程、網絡搜索)完成任務。畢竟,人工智能存在犯錯可能,而智能體完成任務需經歷一連串步驟,只要其中一步出錯,整體任務就會失敗。

      但實際情況并非如此,另一篇新論文解釋了背后的原因。事實證明,我們對人工智能智能體的多數假設都是錯誤的。即便人工智能的準確性僅小幅提升(而新模型的出錯概率已大幅降低),也會使其可完成的任務數量大幅增加。此外,最新、最先進的“具備思考能力”的模型,實際上能自我修正,不會因單次錯誤而停滯。這些因素共同作用,使得人工智能代理可完成的步驟遠超以往,且無需人類大量干預就能使用工具——基本上,只要是計算機能完成的操作,它都能借助工具實現。

      值得關注的是,在過去幾年涵蓋從GPT-3到GPT-5等全系列人工智能模型的能力衡量標準中,METR測試是少數之一。該測試要求人工智能的準確率至少達到 50%。過去五年間,從GPT-3到GPT-5,模型在該測試中的得分呈穩定指數級增長,這體現出智能體工作能力的持續提升。



      如何利用人工智能創造經濟價值

      然而,從人類對“能動性”的定義來看,人工智能代理并不具備真正的能動性。目前,我們仍需決定如何使用它們,而這一選擇將在很大程度上決定未來的工作形態。所有人關注的風險,是人工智能取代人類勞動力——不難預見,未來幾年這將成為核心問題,尤其對于那些缺乏創新、只關注成本削減,而非利用這些新能力拓展或變革工作模式的機構而言。但在工作場景中使用人工智能,還存在第二個極有可能出現的風險:不假思索地用代理完成更多現有任務。

      為預判這一潛在問題,我曾將一份公司備忘錄輸入Claude,要求它將其轉化為PPT,隨后又要求從不同角度再制作一份,接著再制作一份……

      最終,我得到了17份不同的PPT。顯然,這已經過多了。

      如果我們不深入思考“為何要開展這項工作”“理想的工作模式應是什么樣”,所有人都將被海量人工智能生成的內容淹沒。

      那么,替代方案是什么?OpenAI的論文提出:專家可與人工智能協作解決問題——先將任務委派給人工智能完成初步版本,再審核其成果。若成果不理想,可嘗試多次修正或提供更清晰的指令;若仍無改善,則由人類親自完成任務。論文估算,若專家遵循這一工作流程,完成工作的速度將提升40%,成本降低 60%,更重要的是,人類能始終掌控人工智能的工作方向。

      人工智能代理現已問世。它們能完成實際工作,盡管能力仍有限,但已具備價值且在不斷提升。然而,這款能在幾分鐘內復現學術論文的技術,也能生成17份無人需要的PPT。這兩種未來的差異,并非源于人工智能本身,而在于我們選擇如何使用它。通過理性判斷 “哪些工作值得做”,而非僅關注“哪些工作能做到”,我們才能確保這些工具提升的是我們的能力,而非僅僅是效率。

      1 在不同研究領域,“復現(replicating)” 與 “重現(reproducing)” 的定義存在差異:前者可能涉及收集新數據,后者則可能使用現有數據。本文未深入探討這些區別,但在此次實驗中,人工智能不僅使用了現有數據,還對這些數據應用了新的統計方法。

      本文編譯自substack,原文作者Ethan Mollick

      https://www.oneusefulthing.org/p/real-ai-agents-and-real-work

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      2023年,聯邦法院裁定——李昌鈺偽造證據罪名成立。

      2023年,聯邦法院裁定——李昌鈺偽造證據罪名成立。

      百態人間
      2026-02-07 15:38:20
      蛋白質:老年人的“生命線”,這6種優質蛋白食物,該吃就吃!

      蛋白質:老年人的“生命線”,這6種優質蛋白食物,該吃就吃!

      健康科普365
      2026-02-03 07:45:06
      怒批沒教養!基恩炮轟曼城:這是英超最大恥辱

      怒批沒教養!基恩炮轟曼城:這是英超最大恥辱

      瀾歸序
      2026-02-09 07:34:09
      在東京街頭,我被日本人吃飯的方式震驚:這簡直太顛覆認知!

      在東京街頭,我被日本人吃飯的方式震驚:這簡直太顛覆認知!

      復轉這些年
      2026-01-31 23:50:59
      出口突破832萬輛,究竟是誰在狂買中國車?

      出口突破832萬輛,究竟是誰在狂買中國車?

      牲產隊
      2026-02-05 19:16:07
      許家印害慘3位女人:1個虧百億、1個被全球追債,白珊珊最冤

      許家印害慘3位女人:1個虧百億、1個被全球追債,白珊珊最冤

      社會日日鮮
      2026-02-07 13:01:20
      突發!廣廈隊后場主力球員意外重傷,被隊友背出場 令人擔憂

      突發!廣廈隊后場主力球員意外重傷,被隊友背出場 令人擔憂

      體育哲人
      2026-02-09 20:20:10
      詹姆斯:我最欣賞的是球商!我一眼就能看出球員的球商高低!

      詹姆斯:我最欣賞的是球商!我一眼就能看出球員的球商高低!

      歷史第一人梅西
      2026-02-09 17:12:09
      苗原:廣西平果隊員討要欠薪,俱樂部領導反問為什么

      苗原:廣西平果隊員討要欠薪,俱樂部領導反問為什么

      懂球帝
      2026-02-09 12:05:02
      駐日武官王慶簡:為日本潛伏20年出賣軍事機密,卻因一動作暴露身份

      駐日武官王慶簡:為日本潛伏20年出賣軍事機密,卻因一動作暴露身份

      睡前講故事
      2026-02-03 20:55:43
      單身多年生活瀟灑,哥哥王剛家中永遠為她留著位置,親情勝過一切

      單身多年生活瀟灑,哥哥王剛家中永遠為她留著位置,親情勝過一切

      白面書誏
      2026-02-09 12:44:23
      日本鬼子說的“八嘎呀路”,翻譯成中文到底是什么意思?

      日本鬼子說的“八嘎呀路”,翻譯成中文到底是什么意思?

      西樓知趣雜談
      2025-12-20 22:00:18
      翟欣欣鄰居曝猛料:她被帶走時哭瘋了,父母跟著落淚,稱跟她無關

      翟欣欣鄰居曝猛料:她被帶走時哭瘋了,父母跟著落淚,稱跟她無關

      談史論天地
      2026-01-26 18:40:03
      李顯龍說對了!特朗普兵分兩路,收割中國資產,要與中國硬剛?

      李顯龍說對了!特朗普兵分兩路,收割中國資產,要與中國硬剛?

      健身狂人
      2026-02-09 14:27:01
      人形機器人+固態電池,年報預增的10家公司

      人形機器人+固態電池,年報預增的10家公司

      奇思妙想生活家
      2026-02-07 19:57:46
      委內瑞拉剛對中國承諾,轉身就把俄企踢出局,誰還信“主權”二字

      委內瑞拉剛對中國承諾,轉身就把俄企踢出局,誰還信“主權”二字

      眼界看視野
      2026-02-09 19:20:20
      廣州綠皮火車走紅,是因為窮還是為了情懷?

      廣州綠皮火車走紅,是因為窮還是為了情懷?

      八桂知事
      2026-02-08 13:10:27
      美方要求俄烏6月停戰?

      美方要求俄烏6月停戰?

      環球時報國際
      2026-02-09 15:21:32
      40萬美軍就位,美司令給中國立規矩,中方上千艘船出動,直奔東海

      40萬美軍就位,美司令給中國立規矩,中方上千艘船出動,直奔東海

      古事尋蹤記
      2026-01-21 07:06:15
      嫡長子的壓迫感到底有多大!

      嫡長子的壓迫感到底有多大!

      另子維愛讀史
      2026-02-06 20:22:00
      2026-02-09 20:40:49
      Trend求索
      Trend求索
      大趨勢深刻求索
      63文章數 15關注度
      往期回顧 全部

      科技要聞

      實測|字節新模型帶著音效和復雜運鏡殺瘋了

      頭條要聞

      愛潑斯坦案亞裔受害者:首次見他就與2人發生關系

      頭條要聞

      愛潑斯坦案亞裔受害者:首次見他就與2人發生關系

      體育要聞

      創中國冬奧最佳戰績!19歲速滑新星含淚向天拉勾

      娛樂要聞

      央視電影活動名場面!明星站位太講究

      財經要聞

      滬深北交易所優化再融資 釋放3個信號

      汽車要聞

      長安將搭鈉電池 好比汽車要裝柴油機?

      態度原創

      藝術
      教育
      手機
      家居
      房產

      藝術要聞

      柔和的抽象靜物畫,英國當代畫家Sonia Barton

      教育要聞

      人口越來越少,中高考還需要嗎?

      手機要聞

      三星在印度推Galaxy F70e 5G手機,配置與售價揭曉

      家居要聞

      山院煥新 雅聚悅親朋

      房產要聞

      海南又一千億級賽道出現,京東、華潤、中石化等巨頭率先殺入!

      無障礙瀏覽 進入關懷版