<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      OpenAI、Anthropic發新模型,一個替你寫代碼,一個替公司管流程

      0
      分享至

      凌晨,Anthropic和OpenAI同時上線了新模型Claude Opus 4.6和GPT-5.3-Codex,給兩家企業本就在為超級碗廣告互嗆的激烈氣氛又添了一把柴火。當全美觀眾還在為它倆斥資數百萬美元投放的互懟廣告津津樂道時,它們已經殺到了同日發新模型這樣的正面交鋒戰場上。

      Anthropic發布Claude Opus 4.6:搭載處于Beta階段的1M上下文窗口

      Anthropic發布了Claude Opus 4.6,其并非僅僅是參數量的增加,而是在多個關鍵維度上實現了實質性的更聰明和更可用。一個值得關注的亮點是它那處于Beta階段的1M上下文窗口。過去的模型在處理極長文本時,經常出現上下文腐化的問題,即模型性能隨著文本長度增加而顯著下降,導致它忘記或者混淆較早之前的信息。

      而Claude Opus 4.6在著名的大海撈針基準測試MRCR v2上,成績達到了76%,遠超前代Sonnet 4.5的18.5%,這證明它能夠真正有效地利用超長下文,在海量文檔中精準定位并提取被深埋的關鍵信息,從而勝任大型代碼庫分析、多篇論文綜述、跨會話長程任務規劃等場景。


      (來源:https://www.anthropic.com/news/claude-opus-4-6)

      在推理能力和編碼能力上,Claude Opus 4.6在多項權威基準測試中確立了行業領先地位,特別是在需要自主規劃和多步執行的智能體編碼任務上。比如,在Terminal-Bench 2.0中它的測試成績排名第一。

      實際表現就是,當你交給它一個復雜的開發任務時間,它會進行更加審慎的規劃,對代碼進行更加徹底的自我審查和自我調試,并能在大型項目中保持更好的方向感和一致性。也就是說不再是簡單地生成一段代碼,實際上是在扮演一個更有經驗的開發者角色。

      為了讓這種深度能力更加容易被調控,Anthropic引入了努力程度(Effort)控制參數,開發者現在可以在低、中、高、最大這四個級別中進行選擇。

      在高模式或者最大模式下,模型會投入更多計算資源進行深度思考,非常適合解決一些棘手問題;而對于簡單的查詢,切換到中模式或者低模式則可以獲得更快的響應并能降低成本。與之配套的自適應思考功能,則允許模型根據上下文自行判斷何時需要啟動深度推理,進一步提高了靈活性。

      為了解決長會話或智能體任務中必然遇到的上文長度限制問題,API還能提供上下文壓縮Beta功能。當對話接近預設的token閾值時,模型會自動將較早的上下文進行智能摘要并替換,從而為新的交互騰出空間,讓超長程任務成為了可能,而不僅僅是理論上地支持長上下文。


      (來源:https://www.anthropic.com/news/claude-opus-4-6)

      在應用層,Claude正在深度融入生產力工具鏈。Claude Code引入了智能體團體的研究預覽功能,允許創建多個協同工作的AI智能體來并行處理任務,例如同時對代碼庫的不同模塊進行審查。

      而對于更廣泛的辦公場景,Claude in Excel和全新推出的Claude in PowerPoint研究預覽版,將模型的推理能力和生成能力直接嵌入到電子表格和幻燈片制作中。它能執行公式操作,也能通過理解你的數據意圖進行多步規劃;在PPT中,它可以理解企業品牌模板和字體,生成風格一致的內容。

      安全與能力對齊一直是Anthropic的重點之一。據了解,Opus 4.6在保持與頂尖模型相當的安全防護水平的同時,其過度拒絕的概率降低到了近期Claude模型中的最低點。這意味著它在有效攔截有害請求的同時,對于普通問題和良性問題的回應更加開放和有用。針對該模型的網絡安全能力,Anthropic也專門開發了新的檢測探針,并將其用于輔助發現和修復開源軟件漏洞等防御性用途。

      總的來說,Claude Opus 4.6一定程度上代表著大模型正從對話式問答工具向可承擔復雜工作的智能體伙伴演進。它對于超長上下文的實用化支持、精細化的推理控制、以及深度集成的工作流,能夠進一步地提高用戶效率。

      OpenAI推出GPT-5.3-Codex:可能是目前最強大的智能體編碼模型

      OpenAI此次推出的是GPT-5.3-Codex,被稱為是迄今為止最強大的智能體編碼模型,能夠獨立接管涉及研究、工具使用和復雜執行的長期任務。也就是說,一個可以持續工作數天之久、可以從零開始構建出復雜游戲應用的AI誕生了,在它工作的過程中你可以隨時和其對話并調整工作方向,無需擔心失去長上下文記憶。


      (來源:https://openai.com/index/introducing-gpt-5-3-codex/)

      在多項關鍵基準測試中,GPT-5.3-Codex都創下了新的行業紀錄,以77.3%的準確率大幅超越了前代模型在衡量終端編程技能的Terminal-Bench 2.0基準測試上的表現,并在更嚴格的、涵蓋多語言的SWE-Bench Pro軟件工程測評中達到了領先水平。

      GPT-5.3-Codex的能力邊界已經從純粹的編碼拓展到整個知識工作領域。在衡量真實世界職業任務的GDPval評估中,其表現能力與OpenAI的通用旗艦模型GPT-5.2相當。在制作金融分析PPT、設計零售培訓文檔以及編寫商業計劃書中,GPT-5.3-Codex能夠輸出專業的可使用內容。


      (來源:https://openai.com/index/introducing-gpt-5-3-codex/)

      OpenAI透露,GPT-5.3-Codex的開發過程本身就是一個自我實現的范例,OpenAI利用該模型的早期版本來調試其自身的訓練過程、管理部署并診斷測試結果,加速了整個模型的研發周期。總結來說,GPT-5.3-Codex的推出讓AI進一步地從一個等待指令的編程工具轉變為一個能主動思考、跨領域執行并與人類實時協作的電腦伙伴。

      急于變現?OpenAI推出AI企業級產品Frontier

      如果說這次同一天發布新品,OpenAI的贏點之一或許在多發了一樣新品,那就是企業級產品Frontier。它不是一個大模型,是一個專門為企業打造的、可用于規模化構建、能夠部署和管理AI智能體的平臺。它的核心目標是將模型能力,真正轉化為企業內可協同、可管控、能直接創造價值的AI同事。


      (來源:https://openai.com/index/introducing-openai-frontie)

      過去幾年,盡管許多企業嘗試引入AI,但往往陷入了試點困境,一個個獨立的AI應用像孤島一樣,缺乏對于企業整體業務背景的理解,難以融入核心流程。Frontier旨在解決這一問題,它為企業AI智能體提供了四大關鍵支撐:共享的業務背景理解、可靠的執行環境、持續的學習優化機制,以及明確的身份權限和安全邊界。

      簡單來說,Frontier試圖像培訓一位剛入職的新員工一樣,來配置一個AI智能體。它會打通企業內部固有的數據倉庫、CRM系統和內部應用,讓AI理解信息如何流動、決策在何處產生。

      在此基礎之上,AI智能體可以在一個受控的執行環境中,使用工具、運行代碼、處理文件,從而能夠實際地完成各種知識工作任務,并在過程中積累記憶,以便能夠越做越好而不是越做越差。同時,每個AI智能體都擁有獨立的身份和明確的權限護欄,確保其在敏感環境和受監管的環境里也能被安全地使用。

      目前,OpenAI已經和惠普、甲骨文以及Uber等企業合作。OpenAI還舉了和一家大型制造商合作的案例,通過部署基于Frontier的智能體,后者將生產優化分析工作從六周縮短到了一天。

      其實也可以看出,OpenAI的變現愿望是非常強的,此次伴隨新模型一并推出Frontier,也反映出其戰略重心正從提供單一的模型API轉向深入的企業復雜工作量,深入到提供端到端解決方案的地步。對于希望將AI轉化為實際競爭優勢的企業而言,Frontier或許是一個值得關注的備選方案。

      而這一凌晨對決何嘗不是一個新的超級碗時刻?Anthropic的創始人本來就是OpenAI的前員工,讓這一對決更是增加了火藥味。

      整體來看,Claude Opus 4.6的核心優勢在于精細控制和可靠性,GPT-5.3-Codex則展現了OpenAI的系統整合能力。前者勝在深度和可靠,后者強在廣度和進化速度。未來到底孰強孰弱,主要還看誰家產品能夠轉化為真正不可替代的產業發展成果。

      參考資料:

      https://www.anthropic.com/news/claude-opus-4-6

      https://openai.com/index/introducing-gpt-5-3-codex/

      https://openai.com/index/introducing-openai-frontier/

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      盧靖姍:我對韓庚的評分太高,生完孩子后,他永遠回家先親我

      盧靖姍:我對韓庚的評分太高,生完孩子后,他永遠回家先親我

      秀語千尋
      2026-02-05 23:52:24
      湖人本季關鍵時刻15勝2負!球隊接下來魔鬼賽程 要打雷霆馬刺快船

      湖人本季關鍵時刻15勝2負!球隊接下來魔鬼賽程 要打雷霆馬刺快船

      Emily說個球
      2026-02-06 14:32:56
      伊朗:不談了!

      伊朗:不談了!

      星辰故事屋
      2026-02-06 11:20:09
      世紀逼宮終成空城計,字母哥鬧劇落幕,雄鹿用沉默戲耍全聯盟

      世紀逼宮終成空城計,字母哥鬧劇落幕,雄鹿用沉默戲耍全聯盟

      扣籃達人
      2026-02-06 04:35:19
      香菇再次被關注!醫生發現:癌癥患者吃香菇,不過多久或有3變化

      香菇再次被關注!醫生發現:癌癥患者吃香菇,不過多久或有3變化

      讀懂世界歷史
      2026-02-04 22:19:54
      做完手術人就廢了,這5種手術不需要做,別讓無知害了自己

      做完手術人就廢了,這5種手術不需要做,別讓無知害了自己

      華庭講美食
      2026-01-19 14:27:13
      再看《亮劍》原著:才懂丁偉出獄后,為何不愿去尋找李云龍和孔捷

      再看《亮劍》原著:才懂丁偉出獄后,為何不愿去尋找李云龍和孔捷

      興趣知識
      2026-01-30 01:36:57
      趙今麥”也太大膽了吧!一襲露背裙體態吸睛,出名后更放得開

      趙今麥”也太大膽了吧!一襲露背裙體態吸睛,出名后更放得開

      鋒哥與八卦哥
      2026-01-27 11:32:35
      400公里續航突然歸零!春運首日高速上演“人在囧途”。

      400公里續航突然歸零!春運首日高速上演“人在囧途”。

      生活魔術專家
      2026-02-06 09:58:29
      追覓CEO俞浩又火上熱搜,稱三年后團隊20萬人,實現1萬億小目標

      追覓CEO俞浩又火上熱搜,稱三年后團隊20萬人,實現1萬億小目標

      紅星新聞
      2026-02-05 18:37:26
      馬未都:香港寧愿要20萬菲傭,也不接受內地保姆,原因很簡單

      馬未都:香港寧愿要20萬菲傭,也不接受內地保姆,原因很簡單

      犀利辣椒
      2025-12-27 06:42:38
      哇塞,這精美的五官和大氣的臉型,完全可以媲美古代四大美女

      哇塞,這精美的五官和大氣的臉型,完全可以媲美古代四大美女

      白宸侃片
      2026-02-06 16:01:07
      年夜飯必備 10 道硬菜,做法簡單寓意好,全家吃了都夸好

      年夜飯必備 10 道硬菜,做法簡單寓意好,全家吃了都夸好

      開心美食白科
      2026-02-05 13:28:05
      謝娜主持微博之夜!擠眉弄眼,搖頭晃腦,鏤空裙影響尼格買提主持

      謝娜主持微博之夜!擠眉弄眼,搖頭晃腦,鏤空裙影響尼格買提主持

      手工制作阿殲
      2026-02-06 16:37:52
      1862年陳玉成遭凌遲三日方死,勝保強占其妻并炫耀;慈禧:賜白綾

      1862年陳玉成遭凌遲三日方死,勝保強占其妻并炫耀;慈禧:賜白綾

      鑒史錄
      2026-02-02 22:13:07
      我斷了外甥每月6500房貸,和老公出門旅行2個月后接到了外甥電話

      我斷了外甥每月6500房貸,和老公出門旅行2個月后接到了外甥電話

      小秋情感說
      2026-01-08 14:36:33
      得知朱德特型演員劉懷正住院后,院長趕來:朱總住院要什么證明

      得知朱德特型演員劉懷正住院后,院長趕來:朱總住院要什么證明

      大運河時空
      2026-02-05 15:20:03
      S媽還不死心!為奪孫子撫養權準備打官司,斥責汪小菲不厚道,小玥兒穿黑衣緬懷母親

      S媽還不死心!為奪孫子撫養權準備打官司,斥責汪小菲不厚道,小玥兒穿黑衣緬懷母親

      不八卦掌門人
      2026-02-06 15:38:07
      德系大眾發動機EA211、EA111和EA888真的可以閉眼買嗎?

      德系大眾發動機EA211、EA111和EA888真的可以閉眼買嗎?

      生活魔術專家
      2026-02-06 06:39:59
      期末考試分數不公布:錯的不是政策,是認知的偏差丨中聽

      期末考試分數不公布:錯的不是政策,是認知的偏差丨中聽

      大象新聞
      2026-02-04 18:09:27
      2026-02-06 17:12:49
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16228文章數 514588關注度
      往期回顧 全部

      科技要聞

      獨角獸版圖巨變:SpaceX奔萬億 中美差在哪

      頭條要聞

      預制菜國標公開征求意見:預制菜保質期不應超1年

      頭條要聞

      預制菜國標公開征求意見:預制菜保質期不應超1年

      體育要聞

      西甲射手榜第2,身價不到姆巴佩1/40

      娛樂要聞

      微博之夜紅毯好精彩,堪比婚禮現場

      財經要聞

      愛爾眼科卷入騙保疑云 公司回應

      汽車要聞

      這顏值真的可以!方程豹首款轎車叫"鎂7"還是"方程"?

      態度原創

      房產
      親子
      游戲
      本地
      公開課

      房產要聞

      新春三亞置業,看過這個熱盤再說!

      親子要聞

      畢業生回園日:時光里的溫暖重逢

      違約罵街一時爽,法律鐵拳教你爽!SLG主播千勝萬人敵被判賠850萬

      本地新聞

      圍觀了北京第一屆黑色羽絨服大賽,我笑瘋了

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版