<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      騰訊混元3年變形始末

      0
      分享至

      2026.01.12


      本文字?jǐn)?shù):7212,閱讀時長大約12分鐘

      作者 |新皮層NewNewThing 陸彥君 吳洋洋

      2025年11月下旬,大學(xué)畢業(yè)生林楓在深圳參加了騰訊青云計劃閉門會。活動采取定向邀請制,為期兩天,會議內(nèi)容除了郵輪觀光、參觀騰訊總部,還有一個環(huán)節(jié)是部門見面會——姚順雨在現(xiàn)場。

      這次見面會兩個小時左右,姚順雨是開場發(fā)言者,他講了大概只有20分鐘,但富有雄心。

      「他說混元的目標(biāo)是對標(biāo)全球最頂尖的一批大模型。」林楓對第一財經(jīng)「新皮層」說。

      林楓對姚順雨印象深刻,除了「感覺他是主導(dǎo)混元大模型研發(fā)進(jìn)度的管理者」,他還是林楓在現(xiàn)場看到的騰訊高管中為數(shù)不多的年輕人。


      姚順雨,2025年下半年加入騰訊,此前任職于OpenAI。

      青云計劃是騰訊2023年下半年提出的面向優(yōu)秀畢業(yè)生的AI人才專項招聘,對標(biāo)字節(jié)跳動的Top Seed人才計劃。

      與青云計劃同時進(jìn)行的是騰訊持續(xù)一年的高薪挖人行動。長期從事基座模型招聘的許嵐告訴「新皮層」,騰訊最重要的挖人對象之一是字節(jié)跳動。字節(jié)跳動2-2職級的候選人,跳槽到騰訊后可以獲得T12或T13的職級,相當(dāng)于在字節(jié)跳動的原職位連升兩級。而且,薪酬也會直接翻倍,有的甚至?xí)嵘?00%。「這種行情最近一個月才出現(xiàn),以前字節(jié)2-2的候選人會定下T9或T10的職級,薪資漲幅只有30%。」許嵐說。

      2025年的騰訊就是2024年的字節(jié)跳動。2024年,字節(jié)跳動加速基礎(chǔ)模型的研發(fā)進(jìn)度,第一個動作也是搶人才——它當(dāng)時的搶人對象主要是阿里巴巴,一年后,騰訊「接棒」,從字節(jié)跳動搶奪人才。

      多位接近騰訊的人士對「新皮層」稱,騰訊大概2024年年底就開始大規(guī)模對外招募基礎(chǔ)模型相關(guān)的人才,并啟動一系列組織架構(gòu)調(diào)整。2025年9月姚順雨的加入加速了這一進(jìn)程。

      姚順雨新政

      最開始,入職騰訊混元的外部人才主要來自微軟。自2024年12月起,微軟開源模型WizardLM團隊核心成員孫慶豐、微軟亞洲研究院視覺計算組前首席研究員胡瀚、微軟WizardLM團隊項目創(chuàng)建者徐燦陸續(xù)加入騰訊。然后是2025年8月,在月之暗面研究語音模型的研究員譚旭入職騰訊——加入月之暗面前,他任職于微軟亞洲研究院。

      「騰訊只看來自DeepSeek、月之暗面、字節(jié)和阿里這4家基座模型團隊的候選人,其他公司是不看的。」接近騰訊招聘的人士陳立峰對「新皮層」說。

      他對「新皮層」稱,2025年年中,字節(jié)跳動曾通過發(fā)放「豆包虛擬股」激勵員工,相當(dāng)于為其大模型團隊漲薪。但正是在這輪股權(quán)激勵期間,部分字節(jié)豆包員工乘勢轉(zhuǎn)身加入了騰訊混元,原本年薪總包約為250萬至300萬元的字節(jié)跳動員工,加入混元后能拿到年薪300萬以上的Offer。

      2025年12月,字節(jié)跳動再次向全球員工發(fā)布了一封漲薪郵件,將公司整體獎金和調(diào)薪投入分別提升35%和1.5倍,以確保員工薪酬的競爭力和激勵回報在全球各個市場都「領(lǐng)先于頭部水平」。

      在字節(jié)的防守下,騰訊的搶人計劃也加大了力度。「姚順雨的加入是騰訊混元人才招聘的一個關(guān)鍵節(jié)點。」許嵐說,姚順雨來之前,高管加盟騰訊「屬于大廠間的正常人才流動」,姚順雨加入后,混元不僅加強了招聘力度,「對候選人信息的保密性處理也升級了」。以姚順雨的加入為節(jié)點,騰訊招募了更多大語言模型(LLM)相關(guān)的人才,在此之前,包括孫慶豐、胡瀚、徐燦、譚旭等在內(nèi)的加入者主要研究方向都以多模態(tài)為主。


      多位招聘方人士告訴「新皮層」,姚順雨會在與LLM相關(guān)的招聘中擔(dān)任面試官,部分候選人由他親自引薦。這些新招募的人中,至少有3位T12職級的人才來自字節(jié)Seed團隊和DeepSeek,其中一位負(fù)責(zé)預(yù)訓(xùn)練的數(shù)據(jù)工作,還有一位和姚順雨一起做大模型的前沿探索。

      部分混元員工因為姚順雨的到來信心備增。「他們認(rèn)為姚順雨可能會為內(nèi)部爭取更多激勵,就像字節(jié)Seed為團隊成員發(fā)豆包股一樣。」許嵐說,姚順雨接手騰訊混元大模型不久,就與每位團隊成員都有過接觸、聊天,還參加了不同研究小組的團建和聚餐。

      姚順雨的舉動獲得了部分員工的信任。一位內(nèi)部員工認(rèn)為他「性格討喜,跟著他干活有信心」,另一位內(nèi)部員工認(rèn)為他「管理能力出色」。但也有部分混元成員開始擔(dān)心能力不足被調(diào)整,開始主動尋求外部機會。「從混元離職的人可能會變多,無論主動還是被動。」許嵐說。

      換血只是姚順雨加入混元后的新政之一。在模型策略上,他也提出了不同于混元大模型前任領(lǐng)導(dǎo)者的觀念。

      接近騰訊混元的人士告訴「新皮層」,相較于前任負(fù)責(zé)人,姚順雨更加重視后訓(xùn)練——這在很多人的意料之中,姚順雨此前的主要工作都與后訓(xùn)練更相關(guān)。不過除此之外,他還打算從預(yù)訓(xùn)練的數(shù)據(jù)部分入手,「從數(shù)據(jù)開始重新訓(xùn)練混元」,這相當(dāng)于回到起點。林楓稱,姚順雨在11月的青云計劃閉門會上還提出過一個明確要降低「發(fā)版速度」的計劃,「他說以前混元模型在內(nèi)部更新版本的速度很快,有時候一周就會發(fā)布兩個版本。他來到這里的第一件事就是降低發(fā)版速度,打磨好整體模型再發(fā)。」林楓說。

      在被騰訊挖角之前,姚順雨只在OpenAI工作過一年,深度參與Operator、Deep Research等智能體項目。更早之前,他剛剛從普林斯頓博士畢業(yè),研究方向是自然語言處理與強化學(xué)習(xí)。攻讀博士學(xué)位期間,他的主要科研成果有兩個,一個是ToT(Tree of Thoughts,思維樹),這個計算框架讓AI在解決復(fù)雜問題時能夠?qū)栴}拆解為多步思維步驟并探索多條路徑,最終找到最優(yōu)路徑。還有一個是ReAct,這個算法讓大模型可以邊推理邊行動。ToT和ReAct都可應(yīng)用于模型的后訓(xùn)練階段,提升模型的多步推理和動手操作能力。OpenAI的Operator、Deep Research等智能體項目中都有ToT和ReAct的影子。

      也就是說,騰訊把姚順雨從OpenAI挖過來時,他只有一年的工作經(jīng)驗。但騰訊提供的可能是國內(nèi)大模型人才戰(zhàn)中無論職位還是薪酬都最高的標(biāo)準(zhǔn)。2025年9月,市場傳聞騰訊為了挖走他開出了上億元的薪水,騰訊隨后辟謠。這個數(shù)字不一定真實,但1998年出生的姚順雨一定是國內(nèi)大廠中最年輕的大語言模型(LLM)「一號位」。

      2025年12月,騰訊宣布混元組織架構(gòu)調(diào)整,官宣姚順雨出任「CEO/總裁辦公室」首席AI科學(xué)家,向騰訊總裁劉熾平匯報,他同時兼任AI Infra部、大語言模型部負(fù)責(zé)人。一位接近騰訊的人士告訴「新皮層」,姚順雨平時在香港辦公室工作。另據(jù)一位騰訊內(nèi)部人士稱,騰訊的CEO/總裁辦公室在列的人員名單上只有姚順雨一個人。

      這是2023年啟動大模型研發(fā)以來,騰訊第一次把大語言模型變成一把手工程。而且,這個模型負(fù)責(zé)人對下轄的團隊擁有直接而全面的管理權(quán)和人事權(quán)。「劉熾平是財務(wù)出身,并非技術(shù)背景。姚順雨直接向他匯報,獲得資源支持的效率就更高了。」騰訊AI Lab離職員工秦瑩瑩對「新皮層」說,在此之前,騰訊的自研模型混元有著很長的向上匯報鏈路,以及復(fù)雜的向下管理體系。

      混元跟著跑

      2025年從年頭沖刺到年尾的一系列人事和組織變陣表明,騰訊在大模型領(lǐng)域開始著急。令這家大公司著急的直接原因就是,其自研模型混元的表現(xiàn)在大模型競爭中不夠靠前。

      「很多公司發(fā)新模型時,會被拿來在Benchmark中對比的模型基本就是GPT、Claude、Gemini、千問、Kimi和DeepSeek,你不會看到豆包,也不會看到混元。」一位大模型業(yè)內(nèi)人士對「新皮層」說,這種選擇基本代表了行業(yè)對誰在模型第一梯隊的認(rèn)知。

      馬化騰在2023年5月的股東大會稱,「對于工業(yè)革命(級的機遇)來講,早一個月(還是晚一個月)把電燈泡拿出來,在長的時間跨度上來看是不那么重要的。」但大模型如今已經(jīng)變成了一門「實驗科學(xué)」,「從基礎(chǔ)架構(gòu)到注意力機制,從參數(shù)量到優(yōu)化算法……每個環(huán)節(jié)都有多種方案,你需要做實驗才知道能不能行得通、在多大規(guī)模的參數(shù)量上行得通。」上述大模型業(yè)內(nèi)人士說。這種實驗性意味著,晚起步雖然有成熟方案可以借鑒,但也會比其他選手缺少從實驗中積累的經(jīng)驗,行動越慢差距越大、越難追趕。

      騰訊是國內(nèi)大廠中最晚推出自研大模型的公司。2022年11月的最后一天,OpenAI發(fā)布ChatGPT。4個月后,2023年3月,百度發(fā)布了第一代大模型文心一言;同年4月,阿里巴巴發(fā)布通義千問大模型;同年8月,字節(jié)跳動也發(fā)布了首代大模型云雀(注:后更名為豆包大模型)。

      騰訊的起跑速度就慢于這3家公司。2023年2月,騰訊才開始組建一個叫「混元助手」的團隊,從各事業(yè)群集結(jié)人才,由時任騰訊AI Lab主任張正友擔(dān)任項目總負(fù)責(zé)人。

      多位騰訊離職員工對「新皮層」稱,騰訊在大模型領(lǐng)域的緩慢起跑與公司內(nèi)部節(jié)奏有相當(dāng)大關(guān)系。在ChatGPT發(fā)布的2022年,騰訊正在經(jīng)歷多重低谷。

      低谷之一是游戲業(yè)務(wù)。2022年,中國游戲行業(yè)版號獲批通過的總量同比減少了32%,是過往年份中數(shù)量最少的一年。另一位騰訊離職員工告訴「新皮層」,游戲是騰訊最賺錢的業(yè)務(wù)之一,受版號銳減影響,游戲營收不確定性變高,公司當(dāng)年就進(jìn)行了「降本增效」,就連騰訊TEG(技術(shù)工程事業(yè)群)這樣的技術(shù)中臺也要自負(fù)盈虧。后來主導(dǎo)混元模型研發(fā)的張正友所領(lǐng)導(dǎo)的AI Lab就隸屬于TEG。「那時AI Lab并不鼓勵研究員發(fā)論文,員工若要參加學(xué)術(shù)會議,還要蹭高校的預(yù)算才能去開會。」他對「新皮層」說。

      騰訊AI Lab離職員工秦瑩瑩稱,AI Lab在2016年成立時主要任務(wù)還是做基礎(chǔ)研究。但2018年左右,AI Lab就拆分成了兩個部分,只有少部分人繼續(xù)留做AI基礎(chǔ)研究,其他大部分成員都要開始服務(wù)于公司的游戲與廣告業(yè)務(wù)。

      而且,這位AI Lab離職員工稱,在游戲業(yè)務(wù)陷入危機之前,騰訊在2020年左右面臨過一個更大的危機:QQ的「孵化器魔法」失效了。


      2020年之前,騰訊的很多新業(yè)務(wù)、新產(chǎn)品——比如QQ音樂、騰訊視頻——都是通過QQ孵化成功的。那時QQ扮演了一個分發(fā)渠道和入口的角色——就像今天抖音在豆包的分發(fā)中所扮演的角色一樣。但在2020年左右,騰訊的很多新業(yè)務(wù)都難以復(fù)制過去的成功路徑,比如騰訊電商、對標(biāo)今日頭條的天天快報,以及對標(biāo)抖音和快手的騰訊微視,都沒有獲得預(yù)期的成功。2020年,騰訊的另一大分發(fā)渠道——微信——的月活用戶已經(jīng)達(dá)到12.25億,成為移動互聯(lián)網(wǎng)時代的超級入口,但它至今沒有施展比肩當(dāng)年QQ孵化新產(chǎn)品的魔法。

      眾多新業(yè)務(wù)中,唯一一個被騰訊高層認(rèn)為有潛力的是視頻號。上述騰訊離職員工稱,2022年,騰訊創(chuàng)始人、董事長兼CEO馬化騰在內(nèi)部員工大會上稱「微信事業(yè)群最亮眼的業(yè)務(wù)是視頻號,基本上是全場的希望」。到了2023年,馬化騰又在股東大會上表示「AI是類似工業(yè)革命一樣幾百年不遇的機會」,但整個2023年和2024年,這位騰訊離職員工稱,他都沒有聽到公司從整體戰(zhàn)略上多么強調(diào)過大模型,不斷被強調(diào)的依然是視頻號。

      根據(jù)上述騰訊AI Lab離職員工的說法,2023年時騰訊內(nèi)部不同事業(yè)部如果想要訓(xùn)練模型,需要向公司總辦申請預(yù)算和立項,「當(dāng)時訓(xùn)練模型的成本還很高,一次試錯動輒幾百萬美元。就算訓(xùn)練成功,模型的用途是什么?那時候還沒人能說清楚。」這位騰訊AI Lab離職員工稱。

      一號位難當(dāng)

      3年的大模型軍備競賽已經(jīng)讓業(yè)界發(fā)現(xiàn),大模型不僅是門實驗科學(xué),還開創(chuàng)了前所未有的開發(fā)范式:它無法通過工業(yè)時代那樣主要依靠自上而下的明確規(guī)劃分工,以及大量工程師之間的分工合作完成;與這種依賴各個技術(shù)骨干的開發(fā)模式不同,大模型開發(fā)是一種系統(tǒng)工程,如果沒有一號位頭腦中對模型從預(yù)訓(xùn)練數(shù)據(jù)到預(yù)訓(xùn)練架構(gòu)和算法、后訓(xùn)練路徑以及基礎(chǔ)設(shè)施層面的整體實驗構(gòu)想,一個模型無法從多個技術(shù)骨干的暴力開發(fā)中產(chǎn)生。

      上述騰訊AI Lab離職員工告訴「新皮層」,啟動大模型研發(fā)后的3年中,騰訊很長時間里沒有為混元團隊匹配到一位合適的技術(shù)領(lǐng)導(dǎo)者。微信團隊也曾訓(xùn)練過一個模型,后來放棄了。

      上述騰訊AI Lab離職員工告訴「新皮層」,在姚順雨入職前,騰訊混元有過兩位總負(fù)責(zé)人:張正友與蔣杰。張正友的研究方向是計算機視覺,他發(fā)明的平板攝像機標(biāo)定法在全球被普遍采用,被稱為「張氏方法」。但大模型中最核心的模型是LLM,LLM的核心是自然語言處理,而非圖像處理。

      「張正友管理了近半年后,并沒有交出夠好的成果。蔣杰之后主動接手了混元項目,因為他認(rèn)為大模型可以服務(wù)于廣告投放。」秦瑩瑩說。

      蔣杰2012年加入騰訊,是騰訊企業(yè)發(fā)展事業(yè)群(CDG)與技術(shù)工程事業(yè)群(TEG)副總裁,負(fù)責(zé)騰訊廣告平臺產(chǎn)品技術(shù)管理工作。

      在蔣杰的總負(fù)責(zé)下,劉威和王迪都曾短暫地直接管理過混元一段時間,「劉威類似于統(tǒng)籌者,王迪類似于執(zhí)行者」,秦瑩瑩告訴「新皮層」。不過,劉威和王迪的技術(shù)背景也都與自然語言處理關(guān)聯(lián)不深,其中劉威的核心工作方向是計算機視覺,他在2024年年底從騰訊離職后,創(chuàng)辦了一家叫ReBirth的公司,主要方向是視頻生成。王迪2008年通過校招加入騰訊,主導(dǎo)混元LLM模型前主要在TEG負(fù)責(zé)數(shù)據(jù)與搜廣推算法方面的工作。

      2024年11月,蔣杰也開始不再實際管理混元項目下的LLM部分了,只實際負(fù)責(zé)混元多模態(tài)模型。前述騰訊AI Lab離職員工稱,當(dāng)時整個LLM團隊都在等待一位據(jù)說是「來自微軟的高階人才」,但這位微軟系一把手一直沒有被等到。直到2025年9月,姚順雨來了。

      在姚順雨負(fù)責(zé)混元LLM模型并直接向騰訊總裁劉熾平匯報之前,混元的LLM負(fù)責(zé)人是個向上、向下都很難推動工作的夾心角色。秦瑩瑩告訴「新皮層」,在張正友與蔣杰帶隊期間,混元LLM模型曾有一個小組長,但他的職級并不高,距離觸達(dá)劉熾平至少存在大模型技術(shù)負(fù)責(zé)人王迪、混元大模型負(fù)責(zé)人蔣杰、TEG總裁盧山三個層級。這種架構(gòu)使他不可能像姚順雨那樣與劉熾平直接溝通、獲得資源支持。

      對下管理方面,這位組長也需要橫跨TEG的多個部門,才能接觸到他的項目相關(guān)成員。2023年成立的混元是一個虛擬團隊,其成員來自AI Lab,甚至是TEG的多個部門。

      秦瑩瑩對「新皮層」說,機器學(xué)習(xí)部、數(shù)據(jù)平臺部等部門均隸屬于TEG舊的組織架構(gòu),而非混元團隊。抽調(diào)去參與混元項目的員工們還要額外服務(wù)于騰訊不同部門、不同業(yè)務(wù)的AI需求。「混元有小半年的時間比較混亂,職責(zé)與權(quán)限沒有梳理清楚。無論是張正友還是蔣杰,都沒能把團隊真正整合起來。」她說。


      直到2025年4月,騰訊才從組織上配備了一個類似字節(jié)Seed那樣的獨立團隊,在TEG體系內(nèi)成立大語言模型部與多模態(tài)模型部。12月官宣姚順雨入職后,騰訊進(jìn)一步調(diào)整組織架構(gòu),新成立了AI Infra部、AI Data部與數(shù)據(jù)計算平臺部,第一次從組織架構(gòu)上匹配大模式時代的研發(fā)需求。

      多位招聘方人士及騰訊員工對「新皮層」稱,騰訊AI Lab目前已被逐漸弱化,多位成員已經(jīng)離職,AI Lab副主任俞棟也將于1月底離開。許嵐告訴「新皮層」,AI Lab現(xiàn)在的工作重點就是做探索性研究、對外發(fā)表論文。這意味著騰訊2016年成立的AI Lab實際上已經(jīng)反過來成為混元的一個下屬部門,而不再是它的上層管理機構(gòu)。

      「新皮層」獲得的消息稱,隨著俞棟離職,AI Lab的語音與自然語言處理研究方向也將被裁撤。剩下的兩個方向是胡瀚負(fù)責(zé)的多模態(tài)理解方向,以及一位來自字節(jié)Seed前成員負(fù)責(zé)的多模態(tài)理解和生成統(tǒng)一方向。

      直到2025年年底,混元才變成一個更接近于字節(jié)Seed的架構(gòu),而類似的組織架構(gòu)調(diào)整,字節(jié)在2023年下半年就動手了。這個遲來但大手筆的調(diào)整意味著,擺在姚順雨這位27歲大語言模型一號位面前的障礙,騰訊已基本為其掃清。

      加速理論與甜蜜期

      進(jìn)入大模型軍備競賽的第三年,落后者趕上先發(fā)者的最優(yōu)路徑已經(jīng)非常清晰:要想快速交出符合市場預(yù)期的模型,最好直接效仿被證明有效的成熟做法,走別人走過的成功之路,而不是想著如何創(chuàng)新、彎道超車。

      最能說明這一成功法則的例子就是Google。2025年之前,「起個大早趕個晚集」在國內(nèi)形容的是百度,在硅谷形容的則是Google——它發(fā)明了大模型的基礎(chǔ)架構(gòu)Transformer,但在自ChatGPT發(fā)布以來的全球模型競賽中,Google的Gemini始終被認(rèn)為落后于OpenAI的GPT和Anthropic的Claude。

      上述大模型業(yè)內(nèi)人士告訴「新皮層」,Gemini 2.0發(fā)布之前,Google一直堅持Encoder+Decoder(注:編碼器+解碼器,Google在2017年發(fā)明 Transformer 架構(gòu)時的原始形態(tài))架構(gòu)。2024年2月發(fā)布Gemini 1.5時,其模型論文中還在強調(diào)該架構(gòu)為什么更優(yōu),但到了2024年年底發(fā)布Gemini 2.0時,Google不再宣傳Encoder+Decoder的架構(gòu)如何富有潛力,而是開始和OpenAI一樣采取Decoder only(注:純解碼器)架構(gòu)。

      不再偏執(zhí)地堅持自研架構(gòu)后,Google很快就帶著2025年3月發(fā)布的Gemini 2.5重回業(yè)界視野,11月發(fā)布的Gemini 3.0直接讓OpenAI拉響「紅色警報」,以應(yīng)對Gemini帶來的流量壓力。根據(jù)SimilarWeb統(tǒng)計的11月數(shù)據(jù),用戶在Gemini上的平均停留時間已超越了ChatGPT。

      這位業(yè)內(nèi)人士告訴「新皮層」,DeepSeek 2024年12月和2025年2月先后發(fā)布并開源的V3和R1模型,也分別扮演了GPT的Decoder only架構(gòu)曾經(jīng)扮演的角色——告訴大家一個類GPT-4和OpenAI o1效果的模型可能是怎樣的架構(gòu)。其中,V3模型為業(yè)界提供了一個可以訓(xùn)練出等效于GPT-4模型的「配方」——表明要得到類似的模型效果,模型需要是一個MoE(混和專家模型)架構(gòu),而不能是稠密模型;時隔一個多月后發(fā)布的R1模型又提供了類OpenAI o1的推理模型「配方」——表明強化學(xué)習(xí)可以直接通過對有推理步驟的語料的模仿學(xué)習(xí)實現(xiàn)。

      「此前,大家其實不知道GPT-4是怎么訓(xùn)練出來的,也不知道o1是怎么訓(xùn)練出來的。」這位業(yè)內(nèi)人士說,整個2024年,國內(nèi)大模型公司的主要目標(biāo)就是「趕上GPT-4」,但不知道如何趕上,OpenAI從GPT 3.5開始就不再在論文中公開其模型核心架構(gòu)和算法、甚至不發(fā)表技術(shù)報告了。

      DeepSeek V3和R1模型的發(fā)布和開源加速了全球類GPT-4和OpenAI o1模型的推出。聘任一個在OpenAI直接參與過模型后訓(xùn)練、并接觸過其預(yù)訓(xùn)練的研究者擔(dān)任LLM模型負(fù)責(zé)人,對騰訊混元來說是也是一種加速。


      姚順雨加入騰訊兩個月后,2025年12月初,騰訊發(fā)布混元2.0模型,總參數(shù)為4060億。其英文名更新為HY2.0,被視為重視全球市場的舉措。有人猜測該模型就是姚順雨入職后的成果。但按照業(yè)內(nèi)訓(xùn)練一代模型的周期來看,混元2.0不太會是姚順雨從零開始訓(xùn)練的模型。

      「模型參數(shù)量與模型能力之間是必要不充分關(guān)系,參數(shù)量大,模型性能不一定強,但參數(shù)量小,模型潛力一定有限。」上述業(yè)內(nèi)人士說,姚順雨大概率會訓(xùn)練出一個參數(shù)量更大的模型,估計需要大半年時間——在有「配方」、有更多資源的條件下,時間可能會更短。這意味著,姚順雨和騰訊的甜蜜期差不多就是半年,這位27歲的年輕管理者需要交出一些實際成果,才能在騰訊這個有著11萬人的大廠坐穩(wěn)大模型一號位。

      2025年4月,姚順雨在其個人博客中寫下《The Second Half》(下半場)一文,「宣布」大模型已經(jīng)具備足夠的推理能力,大模型競爭已經(jīng)完成上半場的預(yù)訓(xùn)練戰(zhàn)斗,進(jìn)入以后訓(xùn)練和Agent開發(fā)為主題的下半場。但在騰訊,他得重新鏖戰(zhàn)上半場。

      一位接近騰訊混元的人士對「新皮層」稱,混元下一個版本將是一個Agent模型,主要由姚順雨主導(dǎo)訓(xùn)練。

      (應(yīng)采訪對象要求,文中林楓、許嵐、陳立峰、秦瑩瑩為化名,記者王杰夫、實習(xí)記者李昂、肖赫對本文亦有貢獻(xiàn))

      微信編輯| 七三

      第一財經(jīng)持續(xù)追蹤財經(jīng)熱點。若您掌握公司動態(tài)、行業(yè)趨勢、金融事件等有價值的線索,歡迎提供。專用郵箱:bianjibu@yicai.com

      (注:我們會對線索進(jìn)行核實。您的隱私將嚴(yán)格保密。)

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      霍啟剛公開個人財產(chǎn):有35套房子,7套自用28套出租,網(wǎng)友炸鍋

      霍啟剛公開個人財產(chǎn):有35套房子,7套自用28套出租,網(wǎng)友炸鍋

      恪守原則和底線
      2026-01-12 05:45:06
      打進(jìn)四強的幕后功臣!李春江已經(jīng)離開山西男籃,定居?xùn)|莞

      打進(jìn)四強的幕后功臣!李春江已經(jīng)離開山西男籃,定居?xùn)|莞

      籃球大陸
      2026-01-12 15:32:41
      A股,突變!20分鐘,1萬億元!四大背離顯現(xiàn)!

      A股,突變!20分鐘,1萬億元!四大背離顯現(xiàn)!

      券商中國
      2026-01-12 12:20:18
      被批鞋子寒酸后,美國務(wù)卿在白宮穿上特朗普買的新鞋,盡管不合腳

      被批鞋子寒酸后,美國務(wù)卿在白宮穿上特朗普買的新鞋,盡管不合腳

      看盡人間百態(tài)
      2026-01-11 13:03:39
      清朝滅亡后,格格們都嫁給了誰?好幾位大明星,其實都是皇室后裔

      清朝滅亡后,格格們都嫁給了誰?好幾位大明星,其實都是皇室后裔

      小豫講故事
      2025-12-27 06:00:06
      票房破14億,只是開始!謝霆鋒、周星馳、張頌文要掀起一波新高潮

      票房破14億,只是開始!謝霆鋒、周星馳、張頌文要掀起一波新高潮

      皮皮電影
      2026-01-09 16:31:32
      女人染上“性癮”是一種怎樣的體驗?可能和你想象得不同

      女人染上“性癮”是一種怎樣的體驗?可能和你想象得不同

      紙上的心語
      2025-11-23 11:36:00
      孫千這組照片太敢!黑褲包裹蜜桃臀,蝴蝶釘在胸前,這身材絕了?

      孫千這組照片太敢!黑褲包裹蜜桃臀,蝴蝶釘在胸前,這身材絕了?

      娛樂領(lǐng)航家
      2026-01-09 22:00:03
      A股:無需等周二開盤了,種種跡象表明,明天股市很可能這樣走

      A股:無需等周二開盤了,種種跡象表明,明天股市很可能這樣走

      財經(jīng)大拿
      2026-01-12 13:37:07
      古代通房丫鬟到底有多慘?陪老爺不算,還被用來干一件“惡心”事

      古代通房丫鬟到底有多慘?陪老爺不算,還被用來干一件“惡心”事

      蜉蝣說
      2025-09-29 16:49:48
      天呀,杜海濤竟然現(xiàn)成這樣了,沈夢辰對他是真愛啊

      天呀,杜海濤竟然現(xiàn)成這樣了,沈夢辰對他是真愛啊

      草莓解說體育
      2026-01-07 01:43:18
      都是是自衛(wèi)反擊戰(zhàn),為什么對印度一個月,對越南卻打了那么久?

      都是是自衛(wèi)反擊戰(zhàn),為什么對印度一個月,對越南卻打了那么久?

      抽象派大師
      2026-01-12 13:15:21
      離婚19年,朱玲玲每周三仍回霍家吃飯。不是復(fù)婚,也不是演戲。

      離婚19年,朱玲玲每周三仍回霍家吃飯。不是復(fù)婚,也不是演戲。

      百態(tài)人間
      2026-01-10 05:15:03
      末代皇帝:溥儀回到故宮時買了票,發(fā)現(xiàn)了自己藏在椅子底下的寶貝

      末代皇帝:溥儀回到故宮時買了票,發(fā)現(xiàn)了自己藏在椅子底下的寶貝

      銘記歷史呀
      2026-01-10 12:27:42
      600118,千億龍頭創(chuàng)新高!商業(yè)航天,多股爆發(fā)

      600118,千億龍頭創(chuàng)新高!商業(yè)航天,多股爆發(fā)

      證券時報e公司
      2026-01-12 10:34:57
      聲音 | 李章洙:如果每場比賽都能如此激烈,所有人都會想?yún)⒓?>
    </a>
        <h3>
      <a href=足球報
      2026-01-12 12:03:12
      現(xiàn)場視頻公布!巴基斯坦海軍戰(zhàn)艦演習(xí)時 發(fā)射中國產(chǎn)艦空導(dǎo)彈 摧毀空中目標(biāo)

      現(xiàn)場視頻公布!巴基斯坦海軍戰(zhàn)艦演習(xí)時 發(fā)射中國產(chǎn)艦空導(dǎo)彈 摧毀空中目標(biāo)

      閃電新聞
      2026-01-12 11:57:14
      廣東3消息!徐杰創(chuàng)造紀(jì)錄,朱芳雨買斷王少杰,奎因無情打臉遼籃

      廣東3消息!徐杰創(chuàng)造紀(jì)錄,朱芳雨買斷王少杰,奎因無情打臉遼籃

      多特體育說
      2026-01-12 01:07:53
      或結(jié)束留洋,7年3隊,扣除上繳排協(xié),朱婷賺到多少薪水?

      或結(jié)束留洋,7年3隊,扣除上繳排協(xié),朱婷賺到多少薪水?

      樂聊球
      2026-01-11 14:28:05
      電視真的被嚴(yán)重低估了!換個思路居然好用到驚呆,簡直是人類之光

      電視真的被嚴(yán)重低估了!換個思路居然好用到驚呆,簡直是人類之光

      Home范
      2026-01-10 14:55:03
      2026-01-12 16:16:49
      第一財經(jīng)資訊 incentive-icons
      第一財經(jīng)資訊
      第一財經(jīng)官方賬號
      241075文章數(shù) 621172關(guān)注度
      往期回顧 全部

      科技要聞

      小米二手車價大跳水:SU7半年跌5萬元

      頭條要聞

      女子坐火車遇71歲初中班主任 被一口叫出名字感動落淚

      頭條要聞

      女子坐火車遇71歲初中班主任 被一口叫出名字感動落淚

      體育要聞

      聰明的球員,不是教練教出來的

      娛樂要聞

      閆學(xué)晶:脫離群眾太久 忘了自己的根

      財經(jīng)要聞

      A股大漲 兩市成交額3.6萬億創(chuàng)歷史新高

      汽車要聞

      增配不加價 北京現(xiàn)代 第五代 勝達(dá)2026款上市

      態(tài)度原創(chuàng)

      本地
      時尚
      游戲
      藝術(shù)
      公開課

      本地新聞

      云游內(nèi)蒙|“包”你再來?一座在硬核里釀出詩意的城

      普通人就該照搬這些穿搭!衣服不用買太貴,自然耐看又舒適

      《神界》確認(rèn)首發(fā)支持合作模式 可打MOD擴展人數(shù)

      藝術(shù)要聞

      畫完這組畫,他抑郁了,后來自殺了

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 午夜欧美精品久久久久久久| 成人中文在线| 精品亚洲国产成人| 久艹视频在线观看| 国产添下面视频全过程教程| 狠狠色狠狠色综合久久蜜芽| 国产高清国产精品国产专区| aⅴ久久欧美丝袜综合| 人妻久久Aⅴ| 久久精品日日躁夜夜躁| 在线欧美日韩| 国产一区二区三精品久久久无广告 | 国产免费毛卡片| 97人人看| 精品一区二区三区免费播放| 久久不卡精品| 欧美乱大交xxxxx潮喷l头像| 福利姬液液酱喷水| 国产精品毛片av999999| 乱熟女高潮一区二区在线| 91视频在线免费看| 黑人巨大精品欧美| 国产V视频| 人妻另类综合| 久久国产成人午夜av影院| 欧美日韩精品综合在线一区 | 最近2019中文字幕大全视频1| 国产亚洲一二三区精品| 欧美寡妇xxxx黑人猛交| av一本久道久久综合久久鬼色| 国产添下面视频全过程教程| 久久99精品久久久久久hb无码| 琼海市| 777天堂麻豆爱综合视频| 国产亚洲成人网站| 国产色视频网站免费| 人人插人人| 精品国产青草久久久久福利| 不卡无码av| 五十路老熟妇| 欧美精品在线视频|