<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      姚順雨的最新成果,才是騰訊發(fā)完 10 億紅包后決戰(zhàn) AI 的關(guān)鍵

      0
      分享至

      還沒有進(jìn)入春節(jié),各大廠商已經(jīng)迫不及待了:前有元寶大派紅包,馬上千問就豪請奶茶——花不了多少錢,30 個(gè)小目標(biāo)罷了。


      預(yù)算在前面燒,基建在后面搭,畢竟等推廣預(yù)算燒完,能做到多少用戶留存,就要看產(chǎn)品本身了。這樣一看,騰訊在下半年把前 OpenAI 研究員、清華姚班的天才少年姚順雨挖到手,可謂計(jì)之長遠(yuǎn)。

      執(zhí)掌騰訊 AI 之后,近日姚順雨終于發(fā)出了第一項(xiàng)署名研究,這是騰訊混元團(tuán)隊(duì)聯(lián)合復(fù)旦大學(xué)發(fā)布的研究,把目光聚集到了上下文。這似乎是一個(gè)略顯冷門的技術(shù)點(diǎn),但研究的發(fā)現(xiàn)是能讓所有日常都在玩 AI 的用戶背脊一涼的:如果我們把大模型從「背書模式」切換到「現(xiàn)學(xué)現(xiàn)賣模式」,即使是目前地球上最強(qiáng)的 AI,得分率也只有慘淡的 23.7%。

      這項(xiàng)研究遠(yuǎn)不止是一個(gè)技術(shù)圈的八卦,它直接揭示了為什么作為普通用戶的你,經(jīng)常覺得 AI 「聽不懂人話」、「死腦筋」或者「胡說八道」。如果說有什么是 AI 的阿喀琉斯之踵,那上下文(Context)當(dāng)如是。

      上下文:AI 的靈魂

      要理解這項(xiàng)研究的價(jià)值,我們需要先搞清楚大模型運(yùn)作的兩個(gè)基本階段。

      第一個(gè)階段是預(yù)訓(xùn)練。在這個(gè)過程中,模型通過閱讀互聯(lián)網(wǎng)上浩如煙海的數(shù)據(jù),記住了海量的知識和模式。這一點(diǎn)現(xiàn)在大家應(yīng)該都不陌生了。這是 AI 知識儲備的來源,也是它能夠回答通用問題的基礎(chǔ)。


      但問題在于,預(yù)訓(xùn)練數(shù)據(jù)是靜態(tài)的,它反映的是模型訓(xùn)練截止日期之前的世界。一旦脫離了這個(gè)范圍,模型就會變得盲目——而真實(shí)世界是動態(tài)的。

      這就來到第二個(gè)階段,情境學(xué)習(xí),也就是我們常說的上下文處理。當(dāng)你把一段全新的、內(nèi)部的、或者是極其復(fù)雜的規(guī)則文本發(fā)給 AI 時(shí),你實(shí)際上是在要求它跳出預(yù)訓(xùn)練的記憶,根據(jù)眼前的信息進(jìn)行實(shí)時(shí)推理和判斷。

      像什么呢?比如公司內(nèi)部剛剛開完會之后的紀(jì)要,或者你玩的游戲有了新活動,這些知識從未在互聯(lián)網(wǎng)上出現(xiàn)過,只能由你把規(guī)則、信息(即「上下文」)扔給 AI,讓它根據(jù)這些新知識來回答問題。

      這才是現(xiàn)實(shí),互聯(lián)網(wǎng)上并非應(yīng)有盡有,模型對于上下文的學(xué)習(xí)能力可以說是非常重要,甚至可以說:上下文,就是 AI 的靈魂


      如果 AI 記不住、或者理解錯(cuò)了上下文,它就會開始編造(幻覺),可能會根據(jù)它「記憶」里通用規(guī)則來回答——會議紀(jì)要里明明說行政部要負(fù)責(zé)下午茶,它卻說是產(chǎn)品經(jīng)理管這事兒。

      這就是混元團(tuán)隊(duì)這次建設(shè) CL-bench 在干的事情。他們構(gòu)建了近 2000 個(gè)從未在互聯(lián)網(wǎng)上公開過的、由專家精心構(gòu)造的「全新情境」,有虛構(gòu)的法律體系,新的編程語言語法等等。


      根據(jù) CL-bench 的排行榜,目前最先進(jìn)的 GPT-5.1 (High) 模型的正確率僅為 23.7%,Claude Opus 4.5 約為 21.1%,而其他的模型大都在 10%-18% 之間徘徊。

      這意味著,當(dāng)我們要求 AI 「忘掉你以前學(xué)的,只看我發(fā)給你的這段話」時(shí),它們大概率會搞砸。它們就像那些固執(zhí)的學(xué)生,哪怕老師已經(jīng)在黑板上寫了「今天 1+1=3」,它還是會大聲喊出「1+1=2」,因?yàn)樾轮R對它而言都「超綱」了。


      CL-bench 的研究揭示了幾個(gè)導(dǎo)致模型在情境學(xué)習(xí)中失敗的深層原因,這些原因解釋了為什么我們在使用 AI 時(shí)會感到它有時(shí)聰明、有時(shí)愚蠢。

      最常見的翻車原因。模型在預(yù)訓(xùn)練里學(xué)到的東西太「根深蒂固」了。當(dāng)模型接收到新的上下文時(shí),它往往無法有效抑制住預(yù)訓(xùn)練數(shù)據(jù)中那些根深蒂固的模式。

      比如,在 CL-bench 的一個(gè)測試案例中,研究人員構(gòu)建了一個(gè)虛構(gòu)的軟件開發(fā)包 Skynet SDK。雖然這只是個(gè)虛構(gòu)的名字,但因?yàn)椤窼kynet(天網(wǎng))」在 AI 的潛意識(預(yù)訓(xùn)練數(shù)據(jù))里太出名了,模型可能會下意識地把《終結(jié)者》電影里的設(shè)定帶入進(jìn)來,從而無視說明文檔里枯燥的代碼規(guī)則。


      另外,復(fù)雜邏輯的推演能力依然是目前技術(shù)的瓶頸——這點(diǎn)多少有些令人意外,都 2026 了,AI 處理超長文本不是早已經(jīng)駕輕就熟嗎?但實(shí)際上,雖然模型能吞下幾萬字,它并不一定能從數(shù)據(jù)海洋里面精準(zhǔn)地?fù)瞥瞿且桓槨?/strong>研究發(fā)現(xiàn),當(dāng)提供的上下文非常長、邏輯非常復(fù)雜(比如復(fù)雜的邏輯推理鏈條、多輪的交互依賴)時(shí),模型的表現(xiàn)會直線下降。

      如果上下文僅僅是「知識檢索」(比如從文檔里找一個(gè)名字),現(xiàn)在的模型還湊合。但一旦涉及到「邏輯推理」,模型的解決率就暴跌。

      為什么是騰訊來做?

      CL-bench 是姚順雨入主騰訊后,首次署名的研究成果。如果把它放到騰訊龐大的產(chǎn)品矩陣中去審視,就會發(fā)現(xiàn)「上下文學(xué)習(xí)」和這家互聯(lián)網(wǎng)巨頭自身業(yè)務(wù)邏輯之間的關(guān)系。


      與其他更偏向搜索或通用生產(chǎn)力工具的科技公司不同,騰訊的根基深深扎根于「社交」與「內(nèi)容」的土壤之中,而這兩個(gè)領(lǐng)域?qū)?AI 上下文能力的要求可謂極其苛刻。

      想象一下微信或 QQ 的使用場景。這里產(chǎn)生的數(shù)據(jù)并非孤立的問答,而是連綿不斷、高度碎片化的對話流——最新的元寶派就是例子。當(dāng)用戶試圖在一個(gè)擁有數(shù)百條消息的群聊中讓 AI 總結(jié)重點(diǎn),或者在一段長達(dá)數(shù)月的私聊記錄中尋找某個(gè)約定的細(xì)節(jié)時(shí),AI 面臨的挑戰(zhàn)正是 CL-bench 所測試的極限:它必須在不依賴外部通用知識的前提下,精準(zhǔn)地理解這段封閉對話中特有的語境、人際關(guān)系和隱含邏輯。


      如果 AI 無法妥善處理這種高密度的上下文,它就無法真正融入十億用戶的社交鏈路,只能作為一個(gè)甚至?xí)驍鄬υ捔鲿扯鹊睦圪槾嬖凇?/p>

      另外,騰訊在游戲與企業(yè)服務(wù)領(lǐng)域的布局,也決定了它對「情境學(xué)習(xí)」的渴求。游戲自不用說,各家都在探索 AI 如何根據(jù)即時(shí)的操作和游戲內(nèi)的實(shí)時(shí)局勢(即游戲上下文)做出反應(yīng),而不是機(jī)械地背誦預(yù)訓(xùn)練好的臺詞。

      在企業(yè)微信和騰訊會議的場景中,用戶需要的往往是基于特定會議紀(jì)要或私有文檔的精準(zhǔn)分析。在這些場景下,通用的預(yù)訓(xùn)練知識不僅無效,甚至可能因?yàn)椤富糜X」而帶來嚴(yán)重的誤導(dǎo)。

      「在場景中演滿分的學(xué)生,未必能勝任真實(shí)世界的工種」—— 混元團(tuán)隊(duì)意識到了這一點(diǎn),這也恰恰是對當(dāng)下 AI 最好的注腳。對于坐擁海量應(yīng)用場景的騰訊來說,一個(gè)能在復(fù)雜上下文中保持清醒、邏輯嚴(yán)密的模型,遠(yuǎn)比一個(gè)博學(xué)但只會死記硬背的模型,具有更大的商業(yè)價(jià)值和落地潛力。

      歡迎加入 APPSO AI 社群,一起暢聊 AI 產(chǎn)品,獲取,解鎖更多 AI 新知

      我們正在招募伙伴

      簡歷投遞郵箱hr@ifanr.com

      ?? 郵件標(biāo)題「姓名+崗位名稱」(請隨簡歷附上項(xiàng)目/作品或相關(guān)鏈接)


      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      拉波爾塔:梅西父親曾親自來我家,告訴我加盟邁阿密更好

      拉波爾塔:梅西父親曾親自來我家,告訴我加盟邁阿密更好

      懂球帝
      2026-03-10 10:07:53
      伊朗副總統(tǒng)稱將繼續(xù)捍衛(wèi)國土 未放棄通過談判解決問題

      伊朗副總統(tǒng)稱將繼續(xù)捍衛(wèi)國土 未放棄通過談判解決問題

      新華社
      2026-03-11 02:42:06
      前TVB御用奸人罕回港驚變白頭翁戾氣全消,離巢後事業(yè)家庭兩得意

      前TVB御用奸人罕回港驚變白頭翁戾氣全消,離巢後事業(yè)家庭兩得意

      粵睇先生
      2026-03-10 19:44:04
      舊金山唐人街突發(fā)血案:華人等紅燈被捅倒地,旁邊店員拿“速凍餃子”救命

      舊金山唐人街突發(fā)血案:華人等紅燈被捅倒地,旁邊店員拿“速凍餃子”救命

      華人生活網(wǎng)
      2026-03-10 04:33:56
      中國女排歷史上最厲害的主攻是誰?王一梅只能排第三

      中國女排歷史上最厲害的主攻是誰?王一梅只能排第三

      老高說體育
      2026-03-10 10:21:10
      烏軍425團(tuán)橫掃庫皮揚(yáng)斯克核心據(jù)點(diǎn),俄軍殘部盡數(shù)覆滅

      烏軍425團(tuán)橫掃庫皮揚(yáng)斯克核心據(jù)點(diǎn),俄軍殘部盡數(shù)覆滅

      老馬拉車莫少裝
      2026-03-08 13:59:40
      謝賢丟臉丟大了!前女友CoCo仍在換號直播,坦言自己家非常傳統(tǒng)!

      謝賢丟臉丟大了!前女友CoCo仍在換號直播,坦言自己家非常傳統(tǒng)!

      娛樂團(tuán)長
      2026-03-08 20:39:39
      60歲以后富養(yǎng)自己的10大黃金法則,全占,妥妥的高智商老人

      60歲以后富養(yǎng)自己的10大黃金法則,全占,妥妥的高智商老人

      暖風(fēng)吹過竹林
      2026-02-16 16:47:43
      人大代表建議每年給私家車2000公里高速免費(fèi)額度

      人大代表建議每年給私家車2000公里高速免費(fèi)額度

      界面新聞
      2026-03-10 17:04:14
      大米江湖的暗戰(zhàn):那些超市里的“陷阱米”,正在偷走你的錢和健康

      大米江湖的暗戰(zhàn):那些超市里的“陷阱米”,正在偷走你的錢和健康

      富貴說
      2026-01-18 20:36:10
      特朗普:美國愿接納伊朗女足,但因家人遭威脅,部分球員冒死回國

      特朗普:美國愿接納伊朗女足,但因家人遭威脅,部分球員冒死回國

      風(fēng)過鄉(xiāng)
      2026-03-10 06:25:58
      特朗普:我們已經(jīng)贏了,但還沒贏夠,摧毀了伊朗超90%導(dǎo)彈發(fā)射器!伊朗:擁有“更強(qiáng)大、數(shù)量更多”導(dǎo)彈,給美國人“準(zhǔn)備了許多驚喜”

      特朗普:我們已經(jīng)贏了,但還沒贏夠,摧毀了伊朗超90%導(dǎo)彈發(fā)射器!伊朗:擁有“更強(qiáng)大、數(shù)量更多”導(dǎo)彈,給美國人“準(zhǔn)備了許多驚喜”

      每日經(jīng)濟(jì)新聞
      2026-03-10 11:10:46
      《我的山與?!方Y(jié)局:劉柱鋃鐺入獄,李娟死兩任丈夫,李行客逆襲

      《我的山與?!方Y(jié)局:劉柱鋃鐺入獄,李娟死兩任丈夫,李行客逆襲

      草莓解說體育
      2026-03-10 17:55:40
      什么事讓你瞬間感到毛骨悚然?網(wǎng)友:從此再沒見過她老公發(fā)脾氣

      什么事讓你瞬間感到毛骨悚然?網(wǎng)友:從此再沒見過她老公發(fā)脾氣

      另子維愛讀史
      2026-03-10 23:08:46
      礒部花凜高清性感寫真顏值與實(shí)力并存

      礒部花凜高清性感寫真顏值與實(shí)力并存

      橙星文娛
      2026-02-27 10:50:03
      歐冠淘汰賽!英超2隊(duì)有望進(jìn)8強(qiáng),巴薩或獨(dú)撐西甲門面,拜仁無懸念

      歐冠淘汰賽!英超2隊(duì)有望進(jìn)8強(qiáng),巴薩或獨(dú)撐西甲門面,拜仁無懸念

      體育知多少
      2026-03-10 09:54:25
      江蘇一小學(xué)女教師剛辭世,丈夫離世不到百天,7歲小女兒獨(dú)留家中

      江蘇一小學(xué)女教師剛辭世,丈夫離世不到百天,7歲小女兒獨(dú)留家中

      水泥土的搞笑
      2026-03-10 07:08:42
      兩會熱點(diǎn)丨代表建言打造服務(wù)“面向國際”的國家級綠色算力樞紐

      兩會熱點(diǎn)丨代表建言打造服務(wù)“面向國際”的國家級綠色算力樞紐

      中國經(jīng)濟(jì)時(shí)報(bào)
      2026-03-10 09:26:04
      “半裙+德訓(xùn)鞋”原來可以這么好看,這么穿又颯又美!

      “半裙+德訓(xùn)鞋”原來可以這么好看,這么穿又颯又美!

      何有強(qiáng)
      2026-03-10 17:52:22
      「養(yǎng)龍蝦」翻車實(shí)錄:D盤沒了、賬號廢了、余額清空了……

      「養(yǎng)龍蝦」翻車實(shí)錄:D盤沒了、賬號廢了、余額清空了……

      機(jī)器之心Pro
      2026-03-10 18:51:15
      2026-03-11 04:39:00
      AppSo incentive-icons
      AppSo
      讓智能手機(jī)更好用的秘密
      6170文章數(shù) 26794關(guān)注度
      往期回顧 全部

      科技要聞

      全民"養(yǎng)蝦"背后:大廠集體下場瘋狂賣Token

      頭條要聞

      伊朗新最高領(lǐng)袖在襲擊中受傷未公開發(fā)表講話 官方回應(yīng)

      頭條要聞

      伊朗新最高領(lǐng)袖在襲擊中受傷未公開發(fā)表講話 官方回應(yīng)

      體育要聞

      加蘭沒那么差,但鱸魚會用嗎?

      娛樂要聞

      《逐玉》注水風(fēng)波升級!315評論區(qū)淪陷

      財(cái)經(jīng)要聞

      “龍蝦補(bǔ)貼”密集出爐 最高1000萬!

      汽車要聞

      MG4有SUV衍生 上汽乘用車多款新車規(guī)劃曝光

      態(tài)度原創(chuàng)

      本地
      教育
      旅游
      公開課
      軍事航空

      本地新聞

      云游中國|候鳥高顏值亮相!沉浸式打卡青海濕地

      教育要聞

      2026兩會給教育定調(diào) 教育邏輯大洗牌

      旅游要聞

      奇花藝境展推出多次打卡票種,滬上春日花事持續(xù)煥新

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      剛說完戰(zhàn)爭很快結(jié)束 特朗普改口

      無障礙瀏覽 進(jìn)入關(guān)懷版