<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      騰訊大模型重回牌桌了嗎?

      0
      分享至

      文 / 山杉
      追趕者的四月

      4月23日,騰訊混元Hy3 preview發(fā)布并開源。幾個(gè)小時(shí)后,OpenAI深夜扔出GPT-5.5。不到24小時(shí),DeepSeek V4預(yù)覽版跟著上線,終于交出了新一代旗艦?zāi)P汀?/p>

      這只是一個(gè)縮影。這個(gè)4月,全球AI大模型依然如過江之鯽、頻頻上新。其中有三家特別值得留意:

      首先是Meta。4月8號那天扎克伯格大概是長舒了一口氣——投入不少卻始終差口氣的Meta AI,終于憑最新大模型Muse Spark打了個(gè)翻身仗,其性能表現(xiàn)出色,股價(jià)當(dāng)日大漲6.5%;還有Google,Gemini 3.1系列繼續(xù)保持強(qiáng)勢,在各方面都有拉開差距的跡象——盡管它在另一些地方又亮起了紅燈。然后是國內(nèi)巨頭騰訊,帶著它剛剛發(fā)布的Hy3 preview。

      之所以將它們類比,在于這三個(gè)各自領(lǐng)域的王者,都在AI大戰(zhàn)中經(jīng)歷了一段頗受質(zhì)疑的時(shí)期。

      最難受的當(dāng)然是Google,畢竟連AI基礎(chǔ)架構(gòu)Transformer都是它發(fā)明的。三年前,OpenAI用它的技術(shù)路線搞出ChatGPT,Google被迫應(yīng)戰(zhàn)、倉促推出大模型Bard,結(jié)果大失水準(zhǔn),在演示中連韋伯望遠(yuǎn)鏡的常識(shí)都搞錯(cuò),公司市值當(dāng)即蒸發(fā)千億美元,甚至一度有人認(rèn)為Google大勢已去。

      Meta更戲劇化,經(jīng)歷過戰(zhàn)略錯(cuò)判、內(nèi)部斗爭,也吃過慘痛教訓(xùn)——去年4月高調(diào)發(fā)布LLaMA 4,號稱超越DeepSeek V3,結(jié)果不到兩天就淪為一顆"啞彈"。部分測試數(shù)據(jù)低到離譜,隨后更被曝出刷榜丑聞——提交給排行榜的版本,和公開給開發(fā)者的版本不是同一個(gè)模型。為此,其AI研究副總裁宣布離職。

      跟上述兩家相比,騰訊的遭遇倒不至于那么劇烈,但"騰訊慢了"、"騰訊AI到底行不行"的疑問從未停止過。

      此前,混元核心團(tuán)隊(duì)背景多集中在計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)等方面,而非大語言模型最核心的方向。過去三年,混元受困于組織分散,數(shù)據(jù)和Infra等基礎(chǔ)設(shè)施薄弱,認(rèn)知與全球頂尖團(tuán)隊(duì)有較大差距,其基礎(chǔ)模型給外界留下的印象是,"四平八穩(wěn),缺乏特色"。在2026年初的騰訊年會(huì)上,馬化騰也直言"動(dòng)作慢了"。

      大模型技術(shù)固然是一場馬拉松式的競爭,但面對一日千里、紛繁復(fù)雜的態(tài)勢,很難沒有焦慮——尤其是必須直面一個(gè)問題:是否走對了方向。

      面對嚴(yán)峻的局面,Meta和Google做了同一件事:自我糾偏、痛苦地聚焦。

      Google將Brain和DeepMind兩個(gè)團(tuán)隊(duì)合并——此前這兩個(gè)團(tuán)隊(duì)都很優(yōu)秀,卻各自為戰(zhàn)。之后是大舉投入,從Gemini 1.0的低于預(yù)期,到1.5 Pro方向回正,到3.1 Pro多維度領(lǐng)先——近三年持續(xù)迭代,Gemini的AI聊天機(jī)器人市場份額已從不到6%攀升至約20%以上。

      糾偏是持續(xù)的過程。就在這個(gè)4月,紅燈在谷歌再一次亮起,聯(lián)合創(chuàng)始人布林親自掛帥組建了一支"編碼突擊隊(duì)",在當(dāng)下火熱的編碼智能體新戰(zhàn)場,重新追趕。

      而經(jīng)歷過短暫的慌亂,Meta去年重組AI部門,成立超級智能實(shí)驗(yàn)室(MSL),并豪擲重金延攬頂級人才。九個(gè)月后交出了Muse Spark,其風(fēng)格和LLaMA 4截然不同,不喊"SOTA",主動(dòng)標(biāo)明弱項(xiàng),但在圖表理解和醫(yī)療推理上等方面表現(xiàn)突出,token效率極高。一個(gè)因?yàn)樽非髷?shù)字而翻車的公司,如今選擇了克制和場景聚焦。終于重新贏得了外界的認(rèn)可。

      反觀騰訊,它過去三年似乎經(jīng)歷了Meta、Google故事的前半段。到了這最近半年,騰訊內(nèi)部也密集經(jīng)歷了重建、重構(gòu)和聚焦:延攬前OpenAI研究員姚順雨出任首席AI科學(xué)家,AI Lab撤銷,收攏AI研發(fā)力量,招攬一批頂級人才,重建研發(fā)架構(gòu)和基礎(chǔ)設(shè)施……幾個(gè)月之后,推出Hy3 preview。

      據(jù)了解,這一模型進(jìn)行了底層重構(gòu),"總參數(shù)295B,激活參數(shù)21B,最大支持256K上下文長度,在復(fù)雜推理、指令遵循、上下文學(xué)習(xí)、代碼、智能體等能力及推理性能上實(shí)現(xiàn)了大幅的提升。"

      新模型很驚艷嗎?在1T參數(shù)以上巨型模型林立的當(dāng)下,很難這么評價(jià),畢竟還只是一個(gè)不到300B的Preview版。但對騰訊自身來講,是一個(gè)轉(zhuǎn)變的信號彈。模型發(fā)布后,外界立刻將它與主流模型進(jìn)行了比較,感知最強(qiáng)的是其實(shí)用性和體驗(yàn)的改善。一位大模型測評博主寫道:Hy3終于如愿進(jìn)入了國模第一梯隊(duì)。更直接的信號是,Hy3 preview上線即成為騰訊十余款核心產(chǎn)品的首選模型,這在混元?dú)v史上是第一次。有博主直言:"先上桌,再追趕,這一步算是邁出來"。

      對大模型競爭來說,最重要的可能不是這個(gè)版本的表現(xiàn)"數(shù)據(jù)"——Meta和Google證明了,落后了的巨頭只要敢于自我變革、重新出發(fā),走到正確的路上,極大概率會(huì)靠著獨(dú)特的優(yōu)勢加速兌現(xiàn)其潛力的。

      于是,值得一問的問題是:騰訊開始走上正確的道路了嗎?


      不是迭代,是推倒重來

      "Hy3 preview是混元大模型重建的第一步。"在Hy3 preview發(fā)布的官方Blog中,騰訊首席AI科學(xué)家、AI Infra部及大語言模型部負(fù)責(zé)人姚順雨寫道。很顯然,Hy3 preview不是在上一個(gè)版本基礎(chǔ)上修修補(bǔ)補(bǔ)。

      據(jù)了解,Hy3 preview是從2026年1月底左右才開始起步,組織架構(gòu)、基礎(chǔ)設(shè)施基本上重建了一遍。原有的訓(xùn)練框架沒有沿用,Agent系統(tǒng)幾乎從零搭建。一位內(nèi)部人士用了一個(gè)形象的說法:這不是翻新裝修,是把房子拆了重蓋。

      "重訓(xùn)一個(gè)底座"到底意味著什么?

      首先需要海量優(yōu)質(zhì)數(shù)據(jù),經(jīng)過清洗、篩選、去重、分類、配比——數(shù)據(jù)比例配錯(cuò)了,模型可能中文好但英文差,或者會(huì)聊天但不會(huì)寫代碼。

      然后是大規(guī)模張GPU組成集群,穩(wěn)定運(yùn)行幾十天甚至幾個(gè)月,中間任何一張卡出故障、任何一次通信中斷都可能導(dǎo)致訓(xùn)練回滾——Meta訓(xùn)LLaMA 3.1 405B,16384張H100跑了54天,期間遭遇419次意外中斷,平均三小時(shí)一次,而這還是在成熟的訓(xùn)練基礎(chǔ)設(shè)施上。

      訓(xùn)完底座只完成了一半,之后還要通過強(qiáng)化學(xué)習(xí),把一個(gè)"讀了很多書但不會(huì)說人話、不會(huì)干活"的毛坯打磨成能和人正常交互的產(chǎn)品。

      混元面對的恰恰是重構(gòu)級別的難度——基礎(chǔ)設(shè)施全新搭建,訓(xùn)練范式切換,團(tuán)隊(duì)大規(guī)模大量新人加入。

      既然難度這么大,也已經(jīng)有了上一代模型,為什么不在已有基礎(chǔ)上迭代,非要從頭來過?而且是在所有人都在加速奔跑的時(shí)候。

      答案可能和直覺相反??雌饋硗频怪貋沓錆M不確定性,實(shí)則恰恰是為了獲得確定性。

      混元Hy3 preview選擇的技術(shù)路線——MoE架構(gòu)、強(qiáng)化學(xué)習(xí)驅(qū)動(dòng)的后訓(xùn)練等等,很多是被多家頭部團(tuán)隊(duì)反復(fù)驗(yàn)證過的成熟方案。曾經(jīng)DeepSeek V3用MoE做到了業(yè)界標(biāo)桿,OpenAI和Anthropic早已把強(qiáng)化學(xué)習(xí)作為后訓(xùn)練的核心引擎,Google和Meta都在把底座與應(yīng)用場景越拉越近。選擇它們的風(fēng)險(xiǎn)反而是可控的。

      Google當(dāng)年面對的也是同樣的重構(gòu)難題。Brain和DeepMind分別都很強(qiáng),但這個(gè)組織形態(tài)跑不出統(tǒng)一的大模型產(chǎn)品。皮查伊選擇強(qiáng)行合并,短期代價(jià)是Gemini 1.0低于預(yù)期,但這個(gè)決定讓Google獲得了一個(gè)統(tǒng)一的底座和一致的迭代方向——之后所有加速都建立在這個(gè)基礎(chǔ)上。Meta更極端,LLaMA 4翻車之后,扎克伯格沒有在原來基礎(chǔ)上修補(bǔ),而是另起爐灶,連品牌都換了。

      重建的本質(zhì),是用短期的陣痛換取長期的確定性——讓自己站到一條被驗(yàn)證過的、正確的道路上,為混元更大參數(shù)的模型迭代打好基礎(chǔ)。

      這或許便是混元的選擇。那么具體來說,這條路通向哪里?

      重建一條"實(shí)用"的道路

      如果用一個(gè)詞概括Hy3 preview的重構(gòu)方向,大概是"實(shí)用"。

      這兩個(gè)字聽起來樸素,但在大模型行業(yè)的語境里,其實(shí)是一個(gè)鮮明的立場選擇。

      以前很多大模型團(tuán)隊(duì)默認(rèn)的敘事是線性的:先把模型參數(shù)做大、做到更聰明、更通用,榜單更高;然后再談落地、可用、體驗(yàn)。但混元沒有選擇"先極致智能再可用"的從眾路線,而是從源頭就把"實(shí)用性"塞進(jìn)整個(gè)鏈路里——從數(shù)據(jù)理解、預(yù)訓(xùn)練,到強(qiáng)化學(xué)習(xí),再到評估——都是圍繞真實(shí)場景的實(shí)用性來構(gòu)建。

      這個(gè)方向似乎正在變成行業(yè)共識(shí)。同一天發(fā)布的GPT-5.5,定位從"回答"轉(zhuǎn)向"執(zhí)行";DeepSeek V4萬億參數(shù)開源,核心方向也聚焦Agent。

      對混元而言,這種"有用哲學(xué)"首先體現(xiàn)在底座的能力選擇上:聚焦騰訊社交、游戲、廣告等核心業(yè)務(wù)場景中最需要的模型能力,做體系化建設(shè)。

      復(fù)雜推理——Agent時(shí)代對模型最基本的要求是"能想":面對復(fù)雜任務(wù)能規(guī)劃、能拆解、能一步步推導(dǎo)。

      指令遵循與上下文學(xué)習(xí)——長期以來國產(chǎn)模型的痛點(diǎn)。舉個(gè)具體例子:多人群聊到第100輪,中間插了幾個(gè)人說話,準(zhǔn)確識(shí)別"某句話是在回復(fù)兩條之前的那條"——人類做得到,大多數(shù)模型做不到。這恰恰是Hy3 preview此次的突破,直接服務(wù)于元寶和元寶派的真實(shí)交互場景。

      代碼與智能體能力——也許是最出乎意料的進(jìn)步。此前混元在Coding領(lǐng)域幾乎沒有存在感,之所以高優(yōu)先級投入,應(yīng)該和騰訊自身的產(chǎn)品布局直接相關(guān):今年推出的WorkBuddy、QClaw等智能體產(chǎn)品,都需要底座在代碼生成和Agent協(xié)作上過關(guān)。

      三個(gè)方向不是隨機(jī)選的。讓一個(gè)Agent完成工作,要理解指令,在長鏈條任務(wù)中不丟上下文,一步步推出方案,再用代碼實(shí)現(xiàn)——恰好是Agent時(shí)代模型最高頻被調(diào)用的三種能力。這三種能力的組合本身就是一個(gè)體系化的選擇。混元的官方博客闡釋了"實(shí)用"的三條原則,第一條就是能力體系化:不推崇"偏科",因?yàn)榧词故谴a智能體的單一應(yīng)用,也涉及推理、長文、指令、對話、代碼、工具等多種能力的深度協(xié)同。

      底座選擇打哪幾個(gè)點(diǎn)只是第一步,怎么訓(xùn)也變了。這可能是混元最重要的方法論轉(zhuǎn)向:重點(diǎn)攻堅(jiān)RL。

      此前混元的后訓(xùn)練重度依賴SFT——用大量標(biāo)注好的問答對教模型"看到這種輸入就這樣輸出"。但據(jù)接近團(tuán)隊(duì)的人士透露,新版本做法截然不同,重點(diǎn)精力都在RL上。

      區(qū)別可以這樣理解:SFT給標(biāo)準(zhǔn)答案——"正確答案是A";RL只告訴模型好與不好,自己去推測為什么。前者讓模型快速學(xué)會(huì)應(yīng)對已知題型,后者教會(huì)模型面對陌生問題時(shí)自行判斷。在真實(shí)場景里,用戶的提問千奇百怪,不可能每一種都提前標(biāo)注,RL的價(jià)值就在這里。

      更關(guān)鍵的是,RL模式下,訓(xùn)練數(shù)據(jù)量可以非常大,持續(xù)訓(xùn)下去,不斷地用真實(shí)復(fù)雜的任務(wù)把模型的上限拉高。

      "各家的差異就是你的模型到底能接觸到多少復(fù)雜業(yè)務(wù)——這就是生命力的來源。"一位業(yè)內(nèi)人士評價(jià)。

      這句話指向一個(gè)值得品味的遠(yuǎn)期含義。騰訊覆蓋社交、游戲、內(nèi)容、廣告、生活服務(wù)等多樣場景,其豐富度在全球范圍內(nèi)都屬于第一梯隊(duì)。一旦"場景-反饋-訓(xùn)練-更強(qiáng)模型-更多場景"的循環(huán)跑通,能量巨大。

      當(dāng)然,從"有場景"到"反饋真正回流為RL的訓(xùn)練燃料",中間還隔著數(shù)據(jù)合規(guī)、反饋標(biāo)注、工程鏈路等多重問題——這是混元下一階段真正要啃的硬骨頭。但無論如何,重點(diǎn)關(guān)注RL是一條越跑越寬的路。

      訓(xùn)練范式之外,還有一個(gè)更隱蔽但也許更深層的變化:場景需求從一開始就寫進(jìn)了技術(shù)方案。

      混元團(tuán)隊(duì)內(nèi)部的說法叫"聯(lián)合設(shè)計(jì)"(Co-design)。過去比較典型的模式是:基模團(tuán)隊(duì)悶聲訓(xùn)模型,訓(xùn)完交給產(chǎn)品業(yè)務(wù)團(tuán)隊(duì);用得不順,再下場幫業(yè)務(wù)一起調(diào)??捎眯栽谀┒搜a(bǔ)救,甚至不少產(chǎn)品優(yōu)先選用外部開源模型。但混元這次做了一個(gè)重要變化——在強(qiáng)化框架搭建、數(shù)據(jù)策略、評估指標(biāo)設(shè)計(jì)的早期,就建立了與業(yè)務(wù)方的Co-design機(jī)制。

      元寶是一個(gè)典型的例子。Hy3 preview的研發(fā)過程中,元寶團(tuán)隊(duì)與模型團(tuán)隊(duì)做了深度的聯(lián)合設(shè)計(jì)。元寶團(tuán)隊(duì)帶進(jìn)來的,是一套從真實(shí)用戶行為中提煉出的多維評測體系——覆蓋意圖理解精準(zhǔn)度、文本創(chuàng)作質(zhì)量、深度搜索召回效果,比通用benchmark更貼近產(chǎn)品場景。同時(shí),他們把用戶反饋中沉淀下來的判斷也注入了訓(xùn)練過程:文筆是否自然、情商是否到位、內(nèi)容組織是否清晰、專業(yè)表達(dá)是否有分寸感。這些維度很難從模型側(cè)自行定義,需要離用戶近的人來提供標(biāo)準(zhǔn)。

      在應(yīng)用Hy3 preview的產(chǎn)品盲測中,元寶在寫作、閑聊、搜索三個(gè)場景上效果體現(xiàn)得最明顯。用戶反饋中反復(fù)出現(xiàn)一個(gè)詞:"活人感"

      這就是聯(lián)合設(shè)計(jì)真正在做的事:"實(shí)用性"的定義,從基模團(tuán)隊(duì)單方面決定,變成和場景共同決定。

      與之配套的是評估體系的轉(zhuǎn)變。一方面,混元團(tuán)隊(duì)通過自建題目、最新考試、人工評測、產(chǎn)品眾測等多種方式評估和改進(jìn)模型的"真實(shí)戰(zhàn)斗力",另一方面,混元也開始引入真實(shí)業(yè)務(wù)場景來評估:在某條具體鏈路上,模型是否穩(wěn)定、是否貼合語境、是否能理解用戶的實(shí)際意圖、能讓用戶感到自然——這些是"實(shí)用"的證據(jù)。而一旦評估被真實(shí)場景牽引,訓(xùn)練數(shù)據(jù)、強(qiáng)化策略、工具鏈設(shè)計(jì)都會(huì)被迫跟著改變。這也是為什么"實(shí)用"不只是一句口號——它正在反向重塑整個(gè)研發(fā)系統(tǒng)。

      "實(shí)用"落到工程層面,還意味著必須在乎性價(jià)比。這個(gè)詞聽起來庸俗,但在Agent時(shí)代是嚴(yán)肅的硬約束。一個(gè)Coding Agent完成一個(gè)任務(wù)可能調(diào)用模型50到100次,Token消耗量是普通對話的5到30倍。中國信通院數(shù)據(jù)顯示,國內(nèi)日均Token調(diào)用量兩年增長超過1400倍;Gartner則警告,單個(gè)Token價(jià)格在暴跌,但Agent總消耗量增長更快——Token越便宜用得越多,總成本反而可能上升。

      Hy3 preview有295B總參、21B激活——模型內(nèi)部有大量"專家",每次推理只激活其中一小部分。關(guān)鍵不在于專家多少,而在于路由網(wǎng)絡(luò)能不能把問題精準(zhǔn)分配給最合適的那個(gè)。從官方信息看,混元AI Infra做了全棧優(yōu)化,同等成本下推理效率提升40%。一位業(yè)界人士說得直接:"推理成本降低,也會(huì)給元寶省下一批卡。"對騰訊的體量而言,單Token成本哪怕降10%,累積節(jié)省就是天文數(shù)字。

      幾個(gè)層面合在一起看,Hy3 preview的更大的意義,可能在于它搭起了一套圍繞真實(shí)場景的實(shí)用性來定義目標(biāo)、組織研發(fā)、評估結(jié)果的系統(tǒng)。據(jù)透露,作為重新起步的一個(gè)開始,混元也希望通過這次發(fā)布獲得全面的用戶體驗(yàn)反饋,用以提升Hy3正式版的性能。正式版仍在持續(xù)迭代,下一代模型也已啟動(dòng)生產(chǎn)——這個(gè)版本搭好的基礎(chǔ)設(shè)施和跑通的流程,后續(xù)不用重建。


      圖注:代碼能力評測


      圖注:Agent綜合能力評測,Hy3 preview 展現(xiàn)出高性價(jià)比

      罕見的加速度

      方向?qū)α?,只是必要條件。在這個(gè)行業(yè)里,幾乎不可能慢慢走在正確的路上,同樣需要考驗(yàn)的是:速度。

      Hy3 preview從預(yù)訓(xùn)練啟動(dòng)到模型發(fā)布,三個(gè)月完成。

      而以行業(yè)實(shí)際節(jié)奏為參照,通常需要6個(gè)月以上。一個(gè)業(yè)界人士評價(jià),"在三個(gè)月左右時(shí)間里一次性極致壓縮,其實(shí)是極大的挑戰(zhàn)。"

      但所有人都知道,他們必須要完成這一項(xiàng)極限任務(wù)。

      為此,他們做了一個(gè)決策:并行生產(chǎn)(而非傳統(tǒng)的串行)。幾條線同時(shí)拉起來。

      開始正式訓(xùn)練的時(shí)間是1月31日。預(yù)訓(xùn)練開始的同時(shí),后訓(xùn)練團(tuán)隊(duì)在小模型上做驗(yàn)證,全新的RL基礎(chǔ)設(shè)施同步建設(shè),到某個(gè)節(jié)點(diǎn),業(yè)務(wù)鏈路同步適配。所有能并行的環(huán)節(jié)全部并行,嚴(yán)絲合縫咬合在一起。

      中間穿過了春節(jié)——沒有停工??ㄔ谂埽司透?。有人凌晨三點(diǎn)起來讓實(shí)驗(yàn)繼續(xù)。"但凡有一點(diǎn)buffer,你都會(huì)想要節(jié)約出一點(diǎn)可能的試錯(cuò)空間。"

      一個(gè)有意思的細(xì)節(jié)是,Agent訓(xùn)練時(shí),在新的RL infra上首次投產(chǎn)應(yīng)用,就長跑成功。但真正讓這個(gè)團(tuán)隊(duì)高興的是,這驗(yàn)證了他們的"solid"工作文化——如果每一步做得質(zhì)量很高,就能帶來一個(gè)好的結(jié)果。

      熟悉行業(yè)的人知道這樣的速度意味著什么,基本就是很難容忍重大的BUG或者回滾。這個(gè)過程就像經(jīng)驗(yàn)老道的醫(yī)生團(tuán)隊(duì)做一檔高難度的手術(shù)——除了方法技巧,也得知道各種風(fēng)險(xiǎn)和意外,以及能快速應(yīng)對。

      而這個(gè)大規(guī)模的咬合過程,還伴隨著一個(gè)組織的磨合的挑戰(zhàn),大量新人,來自不同公司,并帶著各自的經(jīng)驗(yàn)和方法論。

      最終,在一種極限作戰(zhàn)的狀態(tài)中,這個(gè)團(tuán)隊(duì)都更深理解了彼此,比如姚順雨常掛在嘴邊的,做事要"solid";預(yù)訓(xùn)練的同學(xué)常說,"預(yù)訓(xùn)練就是debug"。

      據(jù)了解,自去年12月底混元架構(gòu)調(diào)整以來,整個(gè)組織在持續(xù)發(fā)生變化。其中一個(gè)舉措是:正式取消管理層級頭銜,試行負(fù)責(zé)人制。不叫總經(jīng)理,不叫總監(jiān)和組長——所有崗位名稱簡化為"某某方向負(fù)責(zé)人"。管理角色跟著業(yè)務(wù)走,不是一個(gè)固定身份:你今天帶這個(gè)方向,就有管理標(biāo)簽;明天方向調(diào)了,標(biāo)簽跟著摘掉。

      這種扁平化,在日常協(xié)作帶來了一些非常具體的結(jié)果。比如,開會(huì)時(shí),沒人需要"向上管理"了。

      一位參與跨部門協(xié)作的員工描述了他的直觀體感:"不管你是什么角色,有問題會(huì)上直接提,當(dāng)場拍掉。誰是責(zé)任人,馬上就定。不需要層層匯報(bào)。"

      這種扁平和做事導(dǎo)向的文化,肉眼可見地帶來一種工作氛圍的變化:"大家不是拼體力、拼加班——而是變成了怎么聰明、高效地做事。"

      甚至跨部門合作都更順暢了。Hy3 preview要上到產(chǎn)品線,"比如上元寶、CodeBuddy……模型同學(xué)跟產(chǎn)品側(cè)一拉群,當(dāng)天就推進(jìn)。大家的思路很明確——以事為導(dǎo)向。"該內(nèi)部人士說。

      "因?yàn)檎麄€(gè)騰訊都在加速的狀態(tài)中。因?yàn)槲覀冃陆▓F(tuán)隊(duì)的文化基調(diào),就是要把這事搞成。"

      三四個(gè)月很難盡善盡美。

      "bench表現(xiàn)挺好的,但它還沒有到真實(shí)世界去被'毒打'過。"一位內(nèi)部人士表達(dá)了她的擔(dān)憂,但這也是混元先推出過程性版本的原因——更快更多獲得真實(shí)世界反饋,才更有機(jī)會(huì)變得強(qiáng)大。

      更重要的是,這個(gè)加速度是面向未來的。換句話說,只有迭代速度持續(xù)加快,混元在這個(gè)注定是長周期的AI競賽中,才能得以持續(xù)改善。

      一個(gè)既快又慢的新紀(jì)元

      在AI競賽中,有一個(gè)反直覺的規(guī)律:在任何一個(gè)時(shí)間截面上判斷"誰贏了",幾乎注定是錯(cuò)的。

      2023年初所有人說Google完了,三年后王者歸來,如今又重新追趕。2024年中Meta是開源之王,一年后翻車,再之后以全新面目重來。DeepSeek V3以極低成本震驚世界,三個(gè)月后行業(yè)又向前走了一大步,直至這幾天又帶來了驚人的"性價(jià)比"。領(lǐng)先和落后不斷交替,沒有誰能鎖定贏面。

      行業(yè)真正在獎(jiǎng)勵(lì)的,并非某一次發(fā)布的"最強(qiáng)",而是方向選擇的正確性、持續(xù)迭代的能力、以及把模型能力轉(zhuǎn)化為用戶價(jià)值的效率。

      Google用近三年證明了這一點(diǎn)。不僅是底座變強(qiáng),更是Gemini和Google產(chǎn)品矩陣的深度整合;這一舉措還在加碼,今年首次設(shè)立了"首席AI架構(gòu)師"一職,直接向皮查伊匯報(bào),只干一件事——加速把AI模型整合進(jìn)Google全產(chǎn)品線。Meta的Muse Spark從一開始就嵌入WhatsApp和Instagram,服務(wù)32億用戶。當(dāng)?shù)鬃芰θ諠u趨同,底座和場景的咬合深度就是長期勝負(fù)手。

      Token經(jīng)濟(jì)學(xué)在加速這個(gè)趨勢。中國大模型API價(jià)格在過去兩年里已經(jīng)下降了90%以上。當(dāng)推理的邊際成本趨近于零,單純賣Token的商業(yè)模式注定不可持續(xù)。真正的價(jià)值在于Token被用來做什么——用在哪個(gè)場景、解決什么問題,這需要模型、場景和工程系統(tǒng)的深度咬合,而不是benchmark上多0.5%。

      騰訊豐富的場景里,每天覆蓋數(shù)以億計(jì)的用戶。這些場景產(chǎn)生的反饋密度和迭代驅(qū)動(dòng)力,是純做底座API的所團(tuán)隊(duì)不具備的。Hy3 preview在元寶和Workbuddy等十余個(gè)騰訊核心業(yè)務(wù)場景的先行落地,以及RL與復(fù)雜真實(shí)場景的相互依存——都指向這個(gè)長周期的競爭邏輯。

      一位內(nèi)部人士給了一個(gè)耐人尋味的比喻:"可以把它理解成一個(gè)清華畢業(yè)生。學(xué)完了,終于下山了。他行萬里路的起點(diǎn),就是要充分在各種場景里深度沉淀。"

      不是出道即巔峰——是出道即起點(diǎn)

      如果它是一顆新種子,如今似乎已經(jīng)證明它能發(fā)芽。接下來的問題是——土壤里的養(yǎng)分能不能順暢滋養(yǎng)它。

      畢竟AI競爭,不再只是模型的單一競爭,更是模型能力、場景理解、工程能力、產(chǎn)品能力和上下文深度的乘數(shù)效應(yīng)。真正的壁壘在別人不容易復(fù)制的場景積累和系統(tǒng)能力里。

      所有人都在同時(shí)奔跑,真正的考驗(yàn)還在后面。

      在面向未來漫長的旅程中,大模型仍在一種"各領(lǐng)風(fēng)騷幾個(gè)月"的階段。就像Google迎頭趕上,不久后又有Claude強(qiáng)勁崛起,在編碼智能體的新戰(zhàn)場上,定義了方向,OpenAI緊隨其后,布林不得不再次啟動(dòng)戰(zhàn)時(shí)機(jī)制。Meta的新狀態(tài)保持多久,也不得而知。

      沒有永遠(yuǎn)的領(lǐng)先者,也沒有永遠(yuǎn)的落后者。但確定的是,巨頭一旦走在正確的道路上,加速度會(huì)比想象的更快。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      震撼!曾精確預(yù)言911的盲眼神婆預(yù)測今年8大事件,有一條暗指中國

      震撼!曾精確預(yù)言911的盲眼神婆預(yù)測今年8大事件,有一條暗指中國

      刀刃故事
      2024-11-22 01:55:03
      阿塞拜疆拋售30億美元黃金,這些國家也在賣!已有機(jī)構(gòu)大幅下調(diào)黃金價(jià)格預(yù)期

      阿塞拜疆拋售30億美元黃金,這些國家也在賣!已有機(jī)構(gòu)大幅下調(diào)黃金價(jià)格預(yù)期

      都市快報(bào)橙柿互動(dòng)
      2026-04-25 10:12:56
      1.2億天王復(fù)出,埃澤世界波救主!阿森納終結(jié)連敗,反超曼城登頂

      1.2億天王復(fù)出,埃澤世界波救主!阿森納終結(jié)連敗,反超曼城登頂

      我的護(hù)球最獨(dú)特
      2026-04-26 02:29:10
      楊威雙胞胎女兒太爭氣,9歲同臺(tái)拿下全國冠軍+季軍,體操最強(qiáng)二代

      楊威雙胞胎女兒太爭氣,9歲同臺(tái)拿下全國冠軍+季軍,體操最強(qiáng)二代

      觀魚聽雨
      2026-04-25 23:23:30
      全紅嬋最新照片曝光!變化令人驚喜 剩最后41天 周繼紅計(jì)劃落空?

      全紅嬋最新照片曝光!變化令人驚喜 剩最后41天 周繼紅計(jì)劃落空?

      念洲
      2026-04-25 12:57:22
      中國國際法學(xué)會(huì)關(guān)于呼吁世界各國遵守國際法、反對非法使用武力的聲明

      中國國際法學(xué)會(huì)關(guān)于呼吁世界各國遵守國際法、反對非法使用武力的聲明

      澎湃新聞
      2026-04-25 15:37:08
      從芯片到服務(wù)器到液冷:算力產(chǎn)業(yè)鏈10大核心龍頭全名單

      從芯片到服務(wù)器到液冷:算力產(chǎn)業(yè)鏈10大核心龍頭全名單

      小白鴿財(cái)經(jīng)
      2026-04-25 20:30:03
      成都蓉城4-0浙江,賽后評分:不是韋世豪第1,成都蓉城11號排第1

      成都蓉城4-0浙江,賽后評分:不是韋世豪第1,成都蓉城11號排第1

      側(cè)身凌空斬
      2026-04-25 20:58:18
      前海牛外援薩里奇重返青島,大量球迷前往火車站迎接

      前海牛外援薩里奇重返青島,大量球迷前往火車站迎接

      懂球帝
      2026-04-25 19:22:06
      霍汶希力挺張敬軒僅6天后續(xù):英皇全藝人遭集體抵制 態(tài)度一邊倒

      霍汶希力挺張敬軒僅6天后續(xù):英皇全藝人遭集體抵制 態(tài)度一邊倒

      觀察鑒娛
      2026-04-23 12:01:07
      一國之君跨國手術(shù),洪森父子三人齊赴北京陪同!全程不在本國治療引發(fā)全網(wǎng)熱議!

      一國之君跨國手術(shù),洪森父子三人齊赴北京陪同!全程不在本國治療引發(fā)全網(wǎng)熱議!

      吃貨的分享
      2026-04-25 21:50:29
      重磅!漢莎航空將取消約兩萬個(gè)航班

      重磅!漢莎航空將取消約兩萬個(gè)航班

      開元周游
      2026-04-25 18:03:52
      回顧陜西男子3次報(bào)警,民警拒不派警,致兩家四口被殺,法院判了

      回顧陜西男子3次報(bào)警,民警拒不派警,致兩家四口被殺,法院判了

      談史論天地
      2026-04-25 13:10:12
      女人最“花心”的年紀(jì),不是20歲,也不是50歲,而是這個(gè)年齡段

      女人最“花心”的年紀(jì),不是20歲,也不是50歲,而是這個(gè)年齡段

      匹夫來搞笑
      2026-03-29 04:08:34
      新血糖標(biāo)準(zhǔn)已更新,空腹血糖最佳值不再是5.4,早干預(yù)更安心

      新血糖標(biāo)準(zhǔn)已更新,空腹血糖最佳值不再是5.4,早干預(yù)更安心

      健康科普365
      2026-04-24 19:30:03
      李嘉欣現(xiàn)身倫敦街頭被路人偶遇,頂級骨相美到發(fā)光完全不像55歲

      李嘉欣現(xiàn)身倫敦街頭被路人偶遇,頂級骨相美到發(fā)光完全不像55歲

      喜歡歷史的阿繁
      2026-04-24 11:57:41
      90年代下崗潮的賬,正在慢慢清還!一代人的犧牲,正在被時(shí)代接住

      90年代下崗潮的賬,正在慢慢清還!一代人的犧牲,正在被時(shí)代接住

      匹夫來搞笑
      2026-04-19 11:51:55
      父親住院37天女婿陪37天,兒子只來2次,出院當(dāng)天兒子開車接他,兒子:爸,你給我76萬,我換輛車吧

      父親住院37天女婿陪37天,兒子只來2次,出院當(dāng)天兒子開車接他,兒子:爸,你給我76萬,我換輛車吧

      大愛三湘
      2026-04-24 20:49:35
      曼聯(lián)名宿斯科爾斯愛女僅穿內(nèi)衣錄美妝視頻!引粉絲驚呼:美絕了

      曼聯(lián)名宿斯科爾斯愛女僅穿內(nèi)衣錄美妝視頻!引粉絲驚呼:美絕了

      仰臥撐FTUer
      2026-04-25 09:53:02
      恒大集團(tuán)與特朗普合作往事

      恒大集團(tuán)與特朗普合作往事

      地產(chǎn)微資訊
      2026-04-24 18:09:33
      2026-04-26 04:47:00
      鈦媒體APP incentive-icons
      鈦媒體APP
      獨(dú)立財(cái)經(jīng)科技媒體
      132781文章數(shù) 862117關(guān)注度
      往期回顧 全部

      科技要聞

      DeepSeek V4發(fā)布!黃仁勛預(yù)言的"災(zāi)難"降臨

      頭條要聞

      媒體:美軍在中東罕見高密度集結(jié) 伊朗開始調(diào)整戰(zhàn)術(shù)

      頭條要聞

      媒體:美軍在中東罕見高密度集結(jié) 伊朗開始調(diào)整戰(zhàn)術(shù)

      體育要聞

      那一刻開始,兩支球隊(duì)的命運(yùn)悄然改變了

      娛樂要聞

      《我們的爸爸2》第一季完美爸爸翻車了

      財(cái)經(jīng)要聞

      90%訂單消失,中東旺季沒了

      汽車要聞

      2026款樂道L90亮相北京車展 樂道L80正式官宣

      態(tài)度原創(chuàng)

      本地
      游戲
      家居
      數(shù)碼
      旅游

      本地新聞

      云游中國|逛世界風(fēng)箏都 留學(xué)生探秘中國傳統(tǒng)文化

      金發(fā)美少女魔王和我是鄰居!新游首曝美女角色太吸睛

      家居要聞

      自然肌理 溫潤美學(xué)

      數(shù)碼要聞

      聯(lián)發(fā)科亮相2026北京車展:主動(dòng)式智能體座艙解決方案

      旅游要聞

      美猴王VS水蜜桃,連云港、無錫文旅“雙向奔赴”

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产高清在线A免费视频观看 | 天堂网国产| 国产一区二区精品网站看黄 | 中文无码久久精品| 日韩久久久久久中文人妻| 伊人五月久久1区| 国产精品成人观看视频国产奇米| 亚洲综合无码一区二区三区不卡| 中文字幕久久久久人妻| 爱3P| 大胸少妇午夜三级| 爽爽影院免费观看视频| 国产午夜亚洲精品久久| 影音先锋资源在线| 日本黄色免费看| 国产人妇三级视频在线观看| 伊人九九网香蕉精品| 欧美AA视频| 色天使色综合| 亚洲欧美伊人久久综合一区二区| 色婷婷综合久久久久中文| 精品伊人久久久大香线蕉欧美| 中文无码熟妇人妻| 无码午夜人妻一区二区三区不卡视频 | 国产精品2025在线免费| 91国内精品久久精品一本| 久久精品国产亚洲av麻豆长发 | 八个少妇沟厕小便漂亮各种大屁股| 男女毛多水多亚洲| 午夜人成免费视频| 久国产精品韩国三级视频| 亚洲精品日韩中文字幕| www.abcfun.cn| 韩国三级大全久久网站| 毛片24种姿势无遮无拦| 亚洲人妻久久| yy111111少妇无码影院| 人妻无码第一区二区三区| 亚洲老熟女@TubeumTV| 91精品人妻一区二区| 中文字幕人成无码人妻综合社区|