<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      你的Office被兩個AI接管了:GPT寫稿Claude審稿,微軟默認開啟

      0
      分享至


      新智元報道

      編輯:元宇

      【新智元導讀】微軟最大的對手不是谷歌,是自己曾經的獨家依賴。Copilot最新升級默認GPT寫稿、Claude審稿,Anthropic的Agent骨架更被直接焊進Office。從綁定OpenAI到收編所有頂級模型,微軟押注的是:無論誰贏,流量都經過我。

      單模型時代,結束了。

      剛剛,微軟把Copilot的引擎換了,在Researcher中引入多模型智能。


      從此,Copilot的Researcher智能體,默認同時調用GPT和Claude。

      這不是讓你手動切模型的那種「多模型」,而是GPT寫完初稿,Claude自動扮演專家評審員逐條審查,審完再交付給你。

      一個負責「沖鋒」,一個負責「挑刺」。

      微軟表示,這是Microsoft 365 Copilot深度研究代理Researcher邁出的重要一步

      Researcher專為在工作流程中處理復雜研究而設計,這次通過兩項全新的多模型能力:「批判」(Critique)和「智囊團」(Council),進一步提升了準確性、深度和可信度。

      實測效果驚人。

      在DRACO基準測試中,這套「雙模型互搏」架構綜合得分比此前一直被視為深度研究天花板的Perplexity Deep Research(搭載Claude Opus 4.6)高出13.8%。

      但這還不是全部。

      同一天上線的Copilot Cowork,微軟表示是把支撐Claude Cowork的技術平臺引入了Microsoft 365 Copilot,并與Work IQ、企業權限和治理體系深度整合,讓AI能自主規劃、跨工具推進多步任務。

      這已經不是「接了個API」那么簡單,而是在把外部前沿智能體能力,納入微軟自己的工作系統。

      微軟的牌面已攤開:不把賭注壓在單一模型上,而是把Anthropic、OpenAI等前沿模型納入Copilot的多模型編排框架。

      也就是說,Copilot正在從傳統AI助手,升級成一個面向企業工作的多模型執行與編排系統。

      Critique

      讓AI自己審自己的作業

      過去的AI研究工作流有一個結構性盲區:規劃、檢索、綜合、撰寫全部壓在一個模型上。

      讓模型既當運動員又當裁判,這樣幻覺幾乎是必然的。

      微軟這次給出的解法是:把「生成」和「評估」拆成兩個獨立角色。

      具體到大模型,是讓GPT負責上半場:任務規劃、迭代檢索、起草初稿;Claude負責下半場:以專家評審員的身份,基于結構化評價量表(Rubric)逐條審查。

      這個量表主要聚焦三個維度:

      來源可靠性評估,審查引用是否權威、可驗證;

      報告完整性,檢查是否覆蓋了用戶請求的所有意圖;

      嚴格的證據溯源,要求每一個關鍵結論都錨定到帶有精確引用的可靠來源。

      更關鍵的是,審閱者的定位不是「第二作者」,而是「同行評審」。它不替你重寫,而是逼你寫得更好。

      微軟365和Copilot企業副總裁Nicole Herskowitz說:「我們不是簡單地在Copilot里塞了多個模型,我們是讓客戶真正享受到模型協同工作的好處。」

      未來這套機制還會升級為雙向互審:GPT也能審Claude的稿。

      Critique已經是Researcher的默認模式,無需手動開啟

      其實,這算不上什么技術花活,而是把學術界運行了幾百年的同行評審制度,第一次工程化地嵌進了AI系統

      用架構設計來壓制幻覺,而不是一味指望單個模型變得更聰明。

      DRACO跑分拆解

      13.8%的含金量

      數據不說謊。

      DRACO(深度研究準確性、完整性和客觀性)是由Perplexity和學術界研究人員于2026年2月推出的基準測試,覆蓋10個領域、100項復雜研究任務,全部源自真實使用場景。

      每個問題經過5次獨立運行取均值,評估維度包括事實準確性、分析廣度和深度、表達質量、引用質量四項。

      評委模型是GPT-5.2。

      微軟特別強調,采用了與基準論文完全一致的評估協議和配置,確保「同口徑」公平對比。

      搭載Critique的Researcher綜合得分實現了+7.0分(SEM±1.90)的顯著提升,比此前表現最好的Perplexity Deep Research高出13.88%。


      DRACO基準測試綜合得分對比圖:各深度研究系統(含Researcher with Critique、Perplexity Deep Research等)橫向得分對比。其中除Researcher with Critique外,其余對比結果引自Zhong et al., arXiv:2602.11685。

      拆開四個維度看:

      分析廣度和深度提升最明顯,+3.33。其次是表達質量+3.04,事實準確性+2.58。引用質量同樣有提升。

      所有維度均達到統計學顯著(配對t檢驗,p<0.0001)。

      真正值得注意的是那個+3.33。分析深度的飆升說明Critique最大的價值不是糾錯,而是可以逼出更全面的分析視角。

      在領域層面,10個領域中有8個觀察到顯著提升,覆蓋醫學、技術、法律等核心場景。

      僅有的兩個例外是「學術」和「大海撈針」,這兩個領域測試結果波動較大。


      DRACO基準四項評測維度提升表:Researcher with Critique(多模型)相較單模型 Researcher,在分析廣度與深度、呈現質量、事實準確性和引用質量上的提升,以及各項對最終總分的貢獻。

      13.8%聽起來是一個數字。

      在深度研究這個賽道上,此前各家打得難分難解,Perplexity搭載Claude Opus 4.6好不容易爬到的天花板,現在被Critique一個架構創新直接擊穿了。

      當你需要的不是一個答案

      而是一場辯論

      Critique解決的是「怎么讓一份報告更準」的問題。

      但有些場景,你要的根本不是一份精修稿,而是兩個專家吵一架。

      而這,就是Council的定位。

      在模型選擇器中選「Model Council」,GPT和Claude會各自獨立生成一份完整報告,并排展示。

      然后,一個專門的評委模型會對兩份報告進行評估,生成一份綜述(Cover Letter),深入分析雙方在哪些觀點上達成一致、在何處存在分歧,以及各自帶來的獨特見解。


      Council模式產品界面截圖:GPT和Claude各自生成的完整報告并排展示,附評委模型生成的Cover Letter綜述。

      表面上看,這只是「多選一」變成了「全都看」,實質上是把決策場景中的信息盲區暴露出來。

      一個模型可能忽略的事實、權重不同的分析框架、另一條推理路徑……Council把這些全部擺到桌面上。

      做季度戰略報告的時候,你希望看到一份精修稿,還是兩個專家各執己見、讓你自己判斷?

      Critique是「編輯審稿」模式,效率優先。

      Council是「專家會診」模式,決策優先。

      兩個模式精準覆蓋了企業用AI做研究的兩種核心場景:日常產出要快要準,重大決策要全要思考全面。

      Copilot Cowork

      微軟把Anthropic的撒手锏搬進了Office

      如果說Critique和Council改變的是研究質量,Copilot Cowork改變的是工作方式本身。

      Copilot Cowork直接基于Anthropic的Claude Cowork技術平臺構建。

      這里不是「接入」或者「兼容」,而是「基于其技術平臺構建」。

      它的工作方式很簡單:你描述想要的結果,Copilot Cowork自動制定計劃,跨工具和文件進行邏輯推理,在推進過程中實時展示進度,你可以隨時介入和引導。


      Copilot Cowork操作界面:描述目標 → 自動規劃 → 跨工具執行 → 實時進度展示。

      內置Claude加上微軟原生技能:日歷管理、每日簡報等,覆蓋從一次性雜事到每月預算審查的各類任務。

      Capital Group等機構已經在使用,反饋集中在規劃、排程、產出成果以及準備管理層審查等高價值場景。

      目前通過Frontier計劃向早期客戶開放。

      這意味著,微軟和Anthropic的關系,已經從「模型供應商」進化到了「技術平臺共建」,Cowork把Claude的Agent骨架直接嵌進了M365的肌肉里。

      微軟本月早些時候已以測試模式發布Copilot Cowork,目標是「抓住市場對自主AI智能體日益增長的需求」。

      所以,這不是一次產品更新,這是一次架構級別的站隊。

      微軟的真正野心

      從AI助手到模型指揮中心

      把以上所有動作連起來看,微軟的戰略意圖已經很清晰:它不再押注自己或者某一個模型能贏,而是轉向押注無論誰贏,流量都經過我

      從對OpenAI的深度依賴,到把Anthropic的技術深度整合進產品線,微軟正在從「模型選手」轉型為「編排層」。

      Critique讓GPT和Claude協作,Council讓它們競爭,Cowork讓Anthropic的Agent能力直接為Office用戶服務。

      這是平臺邏輯,不是模型邏輯。

      正面戰場上,微軟同時在硬剛谷歌Gemini的多模態路線和Anthropic Claude Cowork的自主Agent路線。

      但當Anthropic、OpenAI、谷歌三巨頭的模型格局已經成型,微軟的策略不是下場當選手,而是用生態開放把所有選手的能力收編進自己的平臺。

      對開發者來說,信號已經非常明確:未來的競爭力不在于綁死一個模型,而在于編排多模型的能力

      但市場對于微軟這次Copilot升級,似乎并不買賬。

      微軟股價當日僅微漲約1%,本季度仍面臨近25%的跌幅:這是2008年金融危機以來最差的單季表現。

      華爾街更在意的,可能是落地數據:多模型來回調用的成本誰買單?企業員工真能把它融入日常工作流?

      可以確定的是,這次升級改寫了微軟與OpenAI的合作關系,OpenAI在微軟生態里的位置,已經從「唯一的王牌」變成了「牌桌上的一張」。

      而對Anthropic、OpenAI、谷歌三家來說,值得警惕的是:當平臺方開始把你的能力當作可替換的模塊來編排,模型能力本身或許就不再是護城河了。

      企業級AI正在從「聊天機器人」時代翻篇,進入「工作系統」時代。

      這個轉折點上,決定勝負的不再是誰家的benchmark最高,而是誰能把多個模型編排成一條可靠的、可審計的、可落地的工作流。

      參考資料:

      https://www.reuters.com/business/microsoft-unveils-ai-upgrades-rolls-out-copilot-cowork-early-access-customers-2026-03-30/

      https://techcommunity.microsoft.com/blog/microsoft365copilotblog/introducing-multi-model-intelligence-in-researcher/4506011

      https://www.microsoft.com/en-us/microsoft-365/blog/2026/03/30/copilot-cowork-now-available-in-frontier/

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      22-7!這就是波爾津吉斯和庫明加的區別,勇士的兩筆交易評級出爐

      22-7!這就是波爾津吉斯和庫明加的區別,勇士的兩筆交易評級出爐

      奕辰說球
      2026-03-31 14:21:20
      圖赫爾:我對球員退出集訓這件事很失望,但我并不生球員的氣

      圖赫爾:我對球員退出集訓這件事很失望,但我并不生球員的氣

      懂球帝
      2026-03-30 22:23:09
      緊急通知!單依純演唱會武漢、鄭州站,48小時限時自愿免責退票開啟

      緊急通知!單依純演唱會武漢、鄭州站,48小時限時自愿免責退票開啟

      TVB的四小花
      2026-03-31 16:19:38
      真敢說!張雪:以前挺喜歡雷軍,但小米挖孔機蓋沒處理好

      真敢說!張雪:以前挺喜歡雷軍,但小米挖孔機蓋沒處理好

      雷科技
      2026-03-31 16:30:44
      中國再次讓世界震驚!資源部副部長:發現2800公里超大型鋰礦帶!

      中國再次讓世界震驚!資源部副部長:發現2800公里超大型鋰礦帶!

      愛看劇的阿峰
      2026-03-31 16:17:26
      范冰冰曼谷慈善夜紫藤花裙亮相,東方雅致與奢華感完美融合

      范冰冰曼谷慈善夜紫藤花裙亮相,東方雅致與奢華感完美融合

      述家娛記
      2026-03-30 11:13:45
      “晚打不如早打,小打不如大打,打一個,不如拉日本一起打”。

      “晚打不如早打,小打不如大打,打一個,不如拉日本一起打”。

      安安說
      2026-03-14 18:50:59
      助尼克斯鎖定季后賽!希羅30分4板3助,熱巴23+16+6,大帝26分7板

      助尼克斯鎖定季后賽!希羅30分4板3助,熱巴23+16+6,大帝26分7板

      無術不學
      2026-03-31 10:14:27
      內存價格斷崖式下跌!網友撿大漏:48元買到64GB DDR5套裝

      內存價格斷崖式下跌!網友撿大漏:48元買到64GB DDR5套裝

      快科技
      2026-03-30 11:26:10
      蔡正元入獄第三天,大陸正式發布公告,信號明確,鄭麗文或成功臣

      蔡正元入獄第三天,大陸正式發布公告,信號明確,鄭麗文或成功臣

      冒泡泡的魚兒
      2026-03-30 17:56:38
      從“最快女護士”到全職跑者:連拿兩冠后,張水華的馬拉松商業天花板在哪兒?

      從“最快女護士”到全職跑者:連拿兩冠后,張水華的馬拉松商業天花板在哪兒?

      極目新聞
      2026-03-31 20:19:24
      我嫁給不能生育的迪拜富商,不到3個月我竟孕吐不止,醫生:恭喜

      我嫁給不能生育的迪拜富商,不到3個月我竟孕吐不止,醫生:恭喜

      千秋文化
      2026-03-25 21:42:08
      高市早苗煙癮猛增:每天煙不離手,特朗普讓她壓力山大

      高市早苗煙癮猛增:每天煙不離手,特朗普讓她壓力山大

      世界王室那些事
      2026-03-31 16:50:50
      接到訪陸邀請后剛過1小時,鄭麗文召開記者會,會上出現特殊一幕

      接到訪陸邀請后剛過1小時,鄭麗文召開記者會,會上出現特殊一幕

      李健政觀察
      2026-03-31 18:07:43
      一定要大量讀書:經常讀書的人,一眼就能看出來

      一定要大量讀書:經常讀書的人,一眼就能看出來

      欣辰讀書
      2026-03-29 22:35:04
      張雪機車兩連冠!必須提醒:你們動巨頭500億的蛋糕,一定要小心

      張雪機車兩連冠!必須提醒:你們動巨頭500億的蛋糕,一定要小心

      達文西看世界
      2026-03-31 18:53:29
      賈躍亭曬喜訊:兒子圓夢斯坦福大學研究生 為他驕傲

      賈躍亭曬喜訊:兒子圓夢斯坦福大學研究生 為他驕傲

      快科技
      2026-03-30 09:40:20
      1顆就定罪!2020年上海男子花6800買1顆“鶴頂紅”,1年后被查獲

      1顆就定罪!2020年上海男子花6800買1顆“鶴頂紅”,1年后被查獲

      潮鹿逐夢
      2026-03-31 08:27:59
      為啥不為了老人和孩子活下去?網友:有些農村確實超級恐怖

      為啥不為了老人和孩子活下去?網友:有些農村確實超級恐怖

      解讀熱點事件
      2026-03-30 00:44:26
      盧秀燕:支持鄭麗文主席訪問大陸,給予高度的祝福

      盧秀燕:支持鄭麗文主席訪問大陸,給予高度的祝福

      海峽導報社
      2026-03-31 11:57:03
      2026-03-31 21:40:49
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      14861文章數 66728關注度
      往期回顧 全部

      科技要聞

      華為2025年銷售收入8809億,凈利潤680億元

      頭條要聞

      男子玩具店買槍被羈押279天獲國賠16萬:打官司花40萬

      頭條要聞

      男子玩具店買槍被羈押279天獲國賠16萬:打官司花40萬

      體育要聞

      縣城修車工,用20年成為世界冠軍

      娛樂要聞

      《月鱗綺紀》空降 鞠婧祎卻被舉報偷稅

      財經要聞

      油價暴漲 我們的生活成本會飆升多少?

      汽車要聞

      騰勢Z9GT到底GT在哪?

      態度原創

      教育
      時尚
      房產
      本地
      軍事航空

      教育要聞

      高考地理中的極光現象

      衣服真的沒必要買貴的!準備好這幾款服裝,百搭舒適又不挑人

      房產要聞

      重磅!海南城市更新擬出新政!

      本地新聞

      用Color Walk的方式解鎖城市春日

      軍事要聞

      特朗普:即使霍爾木茲海峽仍關閉 也愿意結束戰爭

      無障礙瀏覽 進入關懷版