<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      OpenAI的"Manus時刻"來了:ChatGPT Agent正式發布

      0
      分享至



      2025 年 7 月 18 日北京時間凌晨 1 點,OpenAI 進行了一場直播,介紹了他們最新、最強大的模型。

      他們將 DeepResearch 和 Operator 功能合并到一起,打造了一個同時能夠做深度研究和 Browser-Use 的 AI Agent ——ChatGPT Agent。

      或者,你可以更簡單地理解為,OpenAI 發布了一個屬于他自己的 “ Manus ”。

      由 OpenAI 打造的 AI Agent,按過往經驗來看是面向通用型需求的,無論是從成本角度還是技術角度,預計都會對同一賽道中的對手形成降維打擊。

      在直播中,Sam Altman 和四位 Agent 項目的研究員( 此前分別是 Operator 和 DeepResearch 的項目成員 )通過參加婚禮策劃等演示展示了 ChatGPT Agent 的功能,以及在基準測試中的表現。

      使用該 Agent 的模式很簡單,只需在 ChatGPT 用戶端點擊工具菜單并選擇 “ Agent ” 就可以。



      ChatGPT Agent 可以獨立使用虛擬計算機來執行復雜的任務,能夠無縫地從思考切換到行動,以及使用各種工具,比如在終端上寫代碼,執行網頁瀏覽,制作 Excel 和 PPT 等等。

      首先來一個日常生活的演示:為參加朋友婚禮做準備。

      研究員不僅寫明了詳細的需求,還給ChatGPT提供了婚禮網站,以及預訂酒店的網站。

      提示詞:

      我們的朋友今年晚些時候要結婚了!這就是婚禮網站:XXX

      你能幫我找到以下物品嗎:

      • 一套符合所有場合著裝要求的服裝(男士)- 推薦五個方案。服裝要包含一些不錯的、中等奢華的物品,要與場地和天氣相符。
      • 幫我找一些可以提前幾天預訂的酒店 - 使用 booking.com 預訂,并確保查看空房情況和當前價格。
      • 還有,別忘了給他們挑選一份禮物,最好在 500 美元以下

      寫一份漂亮的報告

      收到提示詞后,ChatGPT Agent 立馬開始執行。

      因為需要使用電腦,所以一開始,它需要設置環境,這一步通常需要一兩分鐘,快的話甚至不到 5 秒鐘( 實際演示中為 7 秒 )。準備好環境并理解了提示之后,ChatGPT Agent 會向用戶確認自己的理解是否準確,用戶點擊 “ continue ”,ChatGPT Agent 就會開始工作。



      在 ChatGPT Agent 執行任務的時候,用戶可以同步看到它操作計算機屏幕的過程,以及每一步操作相關的思維鏈。



      在這個任務中,ChatGPT Agent 最終提供了一份相當全面的報告。

      它會根據鏈接確定日期和婚禮場地,并以此來確定西裝的推薦,以及在哪里可以買到,還有房源信息等,它還會提供關于禮物的建議。特別是,ChatGPT Agent 還提供瀏覽結果的屏幕截圖。



      在 ChatGPT Agent 執行完任務之后,用戶還可以通過視頻的方式回顧它的執行過程。



      ChatGPT Agent 可以使用兩種不同的方式來瀏覽互聯網。一個是文本瀏覽器,類似于 DeepResearch,可以非常高效快速地閱讀和搜索大量網頁。另一個是可視化瀏覽器,類似于 Operator,使得它能夠與網頁 UI 進行實際交互。使用該瀏覽器,ChatGPT Agent 可以執行拖動網頁、使用光標點擊、打開 UI 組件、填寫表單、輸入文本等操作。

      OpenAI 團隊表示,這兩個工具互補性很強。

      OpenAI 在一月份發布了 Operator,可以執行預訂和發送電子郵件等在線任務。兩周后,OpenAI 又發布了 DeepResearch,可以進行深入的互聯網研究,并輸出高質量的研究報告。

      后來,OpenAI 意識到這兩種方法實際上是深度互補的。一方面,Operator 在閱讀超長文章時會遇到一些困難,因為需要滾動,所以很耗時,但這正是 DeepResearch 的強項。另一方面,DeepResearch 在與網頁、交互元素、視覺效果( 高度可視化的網頁 )交互方面又不如 Operator。

      OpenAI 在用戶反饋中也了解到,大家最期待的 DeepResearch 功能之一就是能夠登錄網站并訪問經過身份驗證的來源,而 Operator 可以做到這一點。此外,很多用戶在使用 Operator 時的提示,實際上和 DeepResearch 類型的提示很相似。

      ChatGPT Agent 的一個關鍵能力是允許隨時打斷執行,并補充新的任務指示。這對于執行復雜且耗時很長的任務來說特別重要,很多時候一開始輸入的提示是不完整的。比如在準備參加婚禮的這個任務中,你可以中途提示模型:你能再幫我找一雙9.5碼的男士黑色鞋嗎?

      ChatGPT Agent 也可能會在執行過程中主動要求用戶澄清和確認一些細節。

      OpenAI 介紹道,與 Agent 合作過程中要注意的一個關鍵是,模型有時會犯錯誤,“ 這就是為什么訓練模型在重要步驟的最后一步請求用戶的確認很重要。”

      例如,在它發送電子郵件之前,它會要求用戶查看草稿,內容是否合理,是否有拼寫錯誤等。如果有,你可以要求它修改,或者直接接管瀏覽器,進入 Agent 的環境自行修改。

      所以,ChatGPT Agent 鼓勵的不是完全自主的執行,而是與用戶的深度協作。

      ChatGPT 還擁有自己的終端來運行代碼,并能用于生成和分析 PPT、Excel 等文件。

      通過終端,它還可以調用 API,包括公共 API 和用于訪問用戶私有數據源的 API( 例如 Google Drive、Google Calendar、Github Sharepoint 等)。你甚至還可以讓 ChatGPT 調用圖像生成 API 來生成圖像,這樣就可以為 PPT 等內容打造精美的視覺效果。類似 Deep Research Connector,只有當用戶明確連接這些 API 時,它才能使用。



      在演示中,OpenAI 的研究員通過讓 ChatGPT Agent 調用 API 操作,生成了 ChatGPT Agent 的基準測試報告。

      提示詞:

      從我們的 Google Drive 中提取你的評估編號,并制作一些幻燈片。形式保持簡單,沒有引言,沒有結論,只用圖表呈現結果。

      模型連接到了 Google Drive API,然后在 API 內進行搜索。第一個結果是相關的,于是模型開始詳細地讀取第一個結果,然后編寫代碼,并使用圖像生成模型來為 PPT 生成圖片。



      最終模型生成了一個 PPT 文檔,可以下載并在本地打開。

      我們來具體看看 ChatGPT Agent 的基準測試結果。

      在 “ 人類最后考試 ”( Humanity's Last Exam,HLE,一個面向人類知識前沿的多模態基準測試 )基準測試中,擁有完全工具使用能力的 ChatGPT Agent 超越了DeepSesearch(擁有 browser use 和 python 代碼能力)、o3( 擁有 browser use 和 python 代碼能力 ),其性能相比后兩者幾乎翻了一番,達到 42% 的通過率,而沒有工具使用能力的 ChatGPT Agent 和 o3 則是墊底。

      FrontierMath 基準測試用于衡量高級數學推理能力,ChatGPT Agent 在這個基準測試中達到了 27% 的通過率,超越了擁有 Python 編碼能力的 o4-mini 和 o3 。



      在 WebArena 基準測試中,ChatGPT Agent 的表現已經很接近人類,并高于 o3 和 4o 。

      在 OpenAI 年初推出的 BrowserComp 基準測試( 衡量 Agent 搜索和查找信息的能力 )中,ChatGPT Agent 顯著優于 o3 和 DeepResearch 模型。



      Spreadsheet Bench 基準測試衡量一定程度上的創建和編輯電子表格的能力,使用 LibreOffice 和其它工具的 ChatGPT Agent 已經可以完成 30% 的任務,當賦予模型訪問終端中原始 Excel 文件的權限時,性能進一步提升至 45% 。

      Internal Banking Benchmark 基準測試評估模型執行 1 到 3 年經驗投資銀行分析師任務的能力,例如為一家財富 500 強公司構建一個三表財務模型。在這項基準測試中,ChatGPT Agent 的表現顯著優于 DeepResearch 和 o3 。



      OpenAI 表示,ChatGPT Agent 是 OpenAI 目前最強大的模型之一,不僅在基準測試中表現出色,而且還能夠推理、瀏覽和處理現實世界的任務,“ 其水平是我們三個月前無法想象的。而它的強大很大程度上來自于瀏覽互聯網的能力。”

      OpenAI 官方還強調,從安全方面來看,讓 AI Agent 執行網頁瀏覽仍然是有風險的,“ 互聯網仍然是一個可怕的地方,各種各樣的網絡攻擊、詐騙和網絡釣魚試圖竊取人們的信息,而 Agent 模型也無法幸免于所有這些攻擊。”

      “ 我們特別擔心一種叫做 ‘ prompt injection ’ 的新攻擊。假設你讓智能體幫你買書,并輸入你的信用卡信息,智能體可能會偶然進入一個惡意網站,要求它輸入信用卡信息,而這時它可能會照做。”

      “ 我們做了很多工作來防止這種情況發生,比如訓練模型忽略可疑網站上的可疑指令,還設置了多層監視器,可以監視 Agent 的運行。我們甚至可以實時更新這些信息,以防范新的攻擊。”

      OpenAI 表示,不可能阻止所有風險,所以用戶自己意識到風險的存在仍然是必要的,比如盡量不要分享高度敏感的信息,或合理地使用接管模式。



      OpenAI 還提供了一個有趣的演示,讓 ChatGPT Agent 制定一個最佳行程,以游覽所有 30 個 MLB 球場,最后以詳細的電子表格形式呈現最終計劃。

      有趣的是,ChatGPT Agent 真的使用了代碼構建地圖,并成功實現了。





      最后,OpenAI 表示,ChatGPT Agent 將為 Pro、Plus 和 Team 用戶上線。Pro 用戶每月將獲得 400 次查詢,Plus 和 Team 用戶每月將獲得 40 次查詢。Pro 版的部署預計將于本月底完成,Plus 版也將很快完成,Team 版將爭取在本月底前上線企業版和教育版。

      “ 我們希望你們會喜歡它。雖然現在還處于初期階段,但我們會迅速改進它,并且我們非常期待看到它后續的發展。”OpenAI 團隊表示。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      《老舅》崔國明四個孩子,結局全都圓滿!老舅舅媽的善良感動人間

      《老舅》崔國明四個孩子,結局全都圓滿!老舅舅媽的善良感動人間

      露珠聊影視
      2025-12-20 19:42:02
      細思極恐!一份90年代報紙的報道,又暴露出南博的“習慣性借出”

      細思極恐!一份90年代報紙的報道,又暴露出南博的“習慣性借出”

      火山詩話
      2025-12-20 06:43:20
      利物浦遭重創!伊薩克進球后傷退 傷病分析博主:預計傷停9個月

      利物浦遭重創!伊薩克進球后傷退 傷病分析博主:預計傷停9個月

      球事百科吖
      2025-12-21 06:09:11
      尼克松訪華時留意到 “打倒美帝國主義” 的標語,毛主席用風趣的話語化解尷尬,尼克松聽后爽朗大笑

      尼克松訪華時留意到 “打倒美帝國主義” 的標語,毛主席用風趣的話語化解尷尬,尼克松聽后爽朗大笑

      清風鑒史
      2025-12-20 18:40:22
      隨著曼城3-0,阿森納1-0,利物浦2-1,切爾西2-2,英超最新積分榜

      隨著曼城3-0,阿森納1-0,利物浦2-1,切爾西2-2,英超最新積分榜

      萬花筒體育球球
      2025-12-21 07:11:02
      火力全開擊潰世界第二!石宇奇2-0昆拉武特,劍指賽季單打第六冠

      火力全開擊潰世界第二!石宇奇2-0昆拉武特,劍指賽季單打第六冠

      釘釘陌上花開
      2025-12-20 20:43:24
      渴死的駱駝,為啥不能碰?

      渴死的駱駝,為啥不能碰?

      犀利辣椒
      2025-12-20 06:21:57
      紐約女球迷現場觀戰尼克斯!賽場內曬出好身材+高顏值照太迷人

      紐約女球迷現場觀戰尼克斯!賽場內曬出好身材+高顏值照太迷人

      Emily說個球
      2025-12-20 14:53:20
      1-0,哲凱賴什一劍封喉,阿森納豪取3連勝,反超曼城重返英超榜首

      1-0,哲凱賴什一劍封喉,阿森納豪取3連勝,反超曼城重返英超榜首

      側身凌空斬
      2025-12-21 06:00:06
      杭州男子停車救人,沒想到救的竟是自己老婆!腦溢血9個月沒有后遺癥,網友:真的是愛的魔力……

      杭州男子停車救人,沒想到救的竟是自己老婆!腦溢血9個月沒有后遺癥,網友:真的是愛的魔力……

      環球網資訊
      2025-12-20 17:20:34
      演員王東近況曝光!一家5口擠小房子21歲大兒子有病生活不能自理

      演員王東近況曝光!一家5口擠小房子21歲大兒子有病生活不能自理

      曹幺妹的小廚房
      2025-12-20 14:38:20
      終于官宣!老年證將全面作廢,以后坐公交逛公園就用它

      終于官宣!老年證將全面作廢,以后坐公交逛公園就用它

      陳博世財經
      2025-12-20 14:27:24
      向太曝馬伊琍已再婚:當年文章過不了心理那關

      向太曝馬伊琍已再婚:當年文章過不了心理那關

      娛樂看阿敞
      2025-12-12 15:50:00
      美媒曾公開全球最差的7艘航母:遼寧艦上榜,福建艦和山東艦呢?

      美媒曾公開全球最差的7艘航母:遼寧艦上榜,福建艦和山東艦呢?

      策略述
      2025-12-20 13:26:47
      副處長張曉偉、局長葉正勇等人醉駕,被當場查獲,受到刑事處罰

      副處長張曉偉、局長葉正勇等人醉駕,被當場查獲,受到刑事處罰

      新京報政事兒
      2025-12-20 10:31:20
      常冰玉名利雙收!單賽季排名超囧哥,緊追丁俊暉,奪冠解鎖紅包賽

      常冰玉名利雙收!單賽季排名超囧哥,緊追丁俊暉,奪冠解鎖紅包賽

      劉姚堯的文字城堡
      2025-12-21 07:12:17
      日本與中亞五國首次舉辦峰會

      日本與中亞五國首次舉辦峰會

      環球網資訊
      2025-12-20 07:02:14
      全球首富名單出爐:美首富造火箭,俄首富搞能源,中國首富在干啥

      全球首富名單出爐:美首富造火箭,俄首富搞能源,中國首富在干啥

      云上烏托邦
      2025-12-20 17:15:03
      “有需要可帶走過夜”,多地私人影院強推異性陪侍套餐

      “有需要可帶走過夜”,多地私人影院強推異性陪侍套餐

      深圳晚報
      2025-12-20 23:44:19
      龐家捐出去的寶藏書畫,是怎么得來的?

      龐家捐出去的寶藏書畫,是怎么得來的?

      紅星新聞
      2025-12-19 22:33:14
      2025-12-21 08:04:49
      知危 incentive-icons
      知危
      投資不立危墻之下
      512文章數 1828關注度
      往期回顧 全部

      科技要聞

      許四清:具身智能的"ChatGPT時刻"還未到來

      頭條要聞

      媒體:南博獲捐的137件書畫中 《江南春》算不上頂級

      頭條要聞

      媒體:南博獲捐的137件書畫中 《江南春》算不上頂級

      體育要聞

      我開了20年大巴,現在是一名西甲主帥

      娛樂要聞

      2026央視跨年晚會陣容曝光,豪華陣仗

      財經要聞

      求解“地方財政困難”

      汽車要聞

      嵐圖推進L3量產測試 已完成11萬公里實際道路驗證

      態度原創

      房產
      旅游
      教育
      手機
      本地

      房產要聞

      廣州有態度,一座國際化社區給出的城市答案

      旅游要聞

      總臺記者探訪丨柬泰沖突持續 暹粒旅游業受沖擊

      教育要聞

      婆羅摩及多模型很好用,很多人還不知道!

      手機要聞

      小米17 Ultra代號夜神 盧偉冰:絕對是最強Ultra

      本地新聞

      云游安徽|訪黃山云海古村,讀一城山水風骨

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 人妻在卧室被老板疯狂进入| 在线观看日韩av| 巴彦淖尔市| 国产做无码视频在线观看浪潮| 国产无吗一区二区三区在线欢| 国产精品久久久久久无毒不卡| 免费A片国产毛无码A片| 九一看片| 精品福利一区二区三区免费视频 | 九九精品免费看| 91丨国产丨白浆秘?3D动漫| 铁牛TV尤物| 国产XXXX| jk白丝喷浆| 国产精品亚洲二区在线播放| 国产无套乱子伦精彩是白视频| 精品国产一区av天美传媒| 日韩欧美精品一区二区| 欧美日产国产精品日产| 国产后入又长又硬| 人妻av一区二区三区av免费| 双城市| 久艹AV| 人人超碰在线| 97精品伊人久久久大香线蕉| 国产va免费精品高清在线观看| 精品国内自产拍在线观看视频| 免费无码黄网站在线观看| 国产精品国产高清国产av| 97在线视频观看| 久久精品中文字幕一区 | 国产成人精品aa毛片| 在线无码va中文字幕无码| 久久av色欲av久久蜜桃网| 国产精品久久久久久久久齐齐| 男人猛躁进女人免费播放| 亚洲成人影片| 一个人看的www免费视频在线观看 亚洲第一无码av无码专区 | ThePorn人妻白浆| 黄网站色视频免费观看| 熟女91|