網易首頁 > 網易號 > 正文申請入駐

剛剛，姚順雨帶隊「重建」混元，首個大模型上線了

2026-04-23 17:07:34　來源: 機器之心Pro

北京舉報

分享至

編輯｜澤南、楊文

剛剛，騰訊 Hy3 preview 來了。

這是騰訊混元團隊在架構、基礎設施重新出發后的第一個版本，首批發布的模型尺寸較小，定位于實用性。

同樣值得關注的是，Hy3 preview 是姚順雨歸國加盟騰訊后的第一個重要成果，遵循了他「AI 下半場」的理念，模型在騰訊真實業務和復雜場景中打磨提升，關注在真實業務場景的效果與實用性。

騰訊表示，新一代模型增強了在聊天、代碼、智能體、數理推理、指令遵循、上下文理解等方面的能力。

目前，Hy3 preview 已在騰訊云、元寶、ima、CodeBuddy、WorkBuddy、QQ、QQ 瀏覽器、騰訊文檔、騰訊樂享等首發上線，微信公眾號、和平精英、騰訊新聞、騰訊自選股、騰訊客服、微信讀書等多個主線產品也在陸續上線。

另外，Hy3 preview 支持接入流行的開源智能體產品，如 OpenClaw、OpenCode、KiloCode 等，并已上架騰訊云大模型服務平臺 TokenHub。

五一假期前，全球 AI 團隊紛紛出招，我們已經陸續見證了千問的 Qwen 3.6 Max Preview、月之暗面的 Kimi 2.6，緊接著小米 MiMo-V2.5-Pro 上線。

基礎大模型的騰訊混元 Hy3 preview 究竟水平如何？接下來，我們就上手測評一番。

Agent 硬核測試，「龍蝦」任務它接住了嗎？

姚順雨是 ReAct 框架（智能體核心邏輯）的提出者，Hy3 preview 模型的能力提升當然包括代碼和智能體方面，也順應 Agent 下半場的技術趨勢和市場需求。

在騰訊版 AI 辦公助手 WorkBuddy 上，我們可以讓它進行代碼開發、深度研究、產品管理、數據分析等。

比如讓它調研關于 DeepSeek 融資傳聞，要求對比至少 5 個不同背景的權威信源，列出已知事實與邏輯沖突點，并給出信度評分。

它能自主啟動多步搜索，完成長鏈推理后，系統性地梳理出信源間的矛盾之處，最終呈現出一份客觀中立的調查報告，整個過程無需人工干預。

我們進一步要求它聯網獲取聯合國人口司數據，完成一項「全球人口結構變遷」可視化分析。

這是一個涉及數據獲取、清洗、分析與可視化呈現的復合型任務，Hy3 preview 同樣完成得較為順暢，最終輸出了直觀的圖表與分析文本。

在代碼能力測試中，我們讓它生成一款「開心消消樂」網頁游戲。最終結果畫面精美，邏輯完整，可以正常運行，整體完成質量超出預期。

嘮嗑、編故事……

它的基本功到底扎不扎實？

我們可以看到，騰訊混元大模型和其他家模型一樣區分了模式：快速思考可以更快給出答案，深度思考可以讓元寶思考更充分，回答更優質。當然我們這里全都選上深度思考。

騰訊混元這次升級主打一個實用，我們先來跟它嘮嘮嗑

和 Hy3 preview 吐槽自己最近變笨了，它耐心開解可能是最近睡得太少、工作壓力大或者刷短視頻太多，并給出了 3 個小 tips。

針對寫稿沒靈感的話題延續，它能自然銜接對話上下文，根據我們當下的情緒狀態調整回應語氣和深度，并給出有針對性的創作建議。

還能情緒價值拉滿，變著花樣夸人。

此前，知乎搞了個「AI 請接招」討論，里面收錄了一批 AI 易翻車的刁鉆問題，其中一道是「今年才知道，親生父母結婚時候沒有叫我，我很難過怎么辦？」

很多大模型被繞進去了，忽略了父母結婚時子女尚未出生的基本邏輯。Hy3 preview 敏銳察覺到這個點，引導用戶理清情緒，表現出較強的常識推理與共情能力。

再來試試創意寫作

前段時間，NASA 宇航員透過獵戶座飛船主艙窗戶遙望地球的神圖，刷屏社交媒體。

我們讓 Hy3 preview 為這張圖片生成 5 條朋友圈文案。它先分析了圖片氛圍，選擇了孤獨震撼、對地球的敬畏、人類渺小與偉大等幾個情感點，生成了不同風格的文案，有文藝掛的、有哲學性的，隨便拿出來一條就能發朋友圈。

在模仿文風方面，我們要求它以歐?亨利的筆調創作一個短篇小說。

搜索能力方面，我們讓 Hy3 preview 調查 Meta 強制收集鼠標鍵盤輸入的原因，它迅速援引權威信源，給出了清晰、有據可查的回答。

無論是查新聞、查政策還是核實具體信息，整體表現均較為可靠。

「AI 下半場」的底層重構

據介紹，Hy3 preview 是一個快慢思考融合的 MoE 語言模型，總參數量為 295B，激活參數 21B，支持的上下文長度為 256K，兼具實用性和性價比。

在新一代模型上，混元團隊的主要工作是進行底層重構，進而把很多工作做得更加牢固，特別是預訓練和強化學習基建已被完全重做。他們在模型的大版本更新上，并沒有過多把精力放在注意力機制、底層架構等方面的微小創新，而是選擇了成熟的 MoE（混合專家）路線，把精力和資源全部砸在工程基座（Infra）的穩固性上。

這意味著 Hy3 preview 的穩定性、數據吞吐效率、強化學習（RL）管線的良品率可能達到了前所未有的工業級水準。

另外在訓練的過程中，混元強調了模型評估，并加強了對自建 Benchmark 的研究，這就與之前順雨在博客中展示的思路一致（評估大于訓練，Evaluation > Training）。

在《大模型的下半場》中姚順雨曾指出，現有的大模型「配方」（預訓練 + 強化學習 + 算力擴展）已經高度成熟，具備了泛化和解決難題的能力，下半場的邏輯在于提出問題：「我們應該訓練人工智能做什么？」

在下半場，由于現有通用模型配方極其強大，花費巨大精力做出微調可能只帶來 5% 的提升，因此，評估變得比訓練更重要。行業需要重構評估體系，設計出貼近現實世界的新任務和新范式，而不是簡單地設計更難的考卷。

要在 AI 下半場生存和發展，從業者必須轉變思維模式，具備類似「產品經理」的視角。這意味著必須去深入思考：AI 究竟該為誰解決什么實際問題？我們又該如何客觀地衡量它解決得好不好？

在這方面，騰訊擁有微信、游戲、廣告、云服務等國內、甚至全球最復雜的業務場景，其自建的評測環境，必然高度貼合真實業務流的難點和痛點。Hy3 preview 的推出，或許已為騰訊在其生態內構建出了一個能夠解決實際問題的生產力工具。

Hy3 preview 于 2026 年 1 月底啟動訓練，從訓練到上線僅用了不到三個月，這是混元大語言模型從「讀萬卷書」到「行萬里路」，嘗試解決真實世界問題的一個開端。

Hy3 preview 只是一個起點，未來混元團隊還希望通過開發者與用戶共同協作的方式進一步提升模型能力，使其在真實場景和任務中持續發展。

文中視頻鏈接：https://mp.weixin.qq.com/s/49sPn3OqJBl0bLlc-Sr-Pg

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

今天，姚順雨在DeepSeek V4前交卷了

智東西 2026-04-23 18:47:10
0 跟貼 0
谷歌云打出智能體組合拳：第八代TPU發布，Workspace一句話生成PPT

智東西 2026-04-23 18:36:40
0 跟貼 0

實測混元Hy3 preview：混元再出發，中型模型的務實之戰

鈦媒體APP 2026-04-23 17:22:18
0 跟貼 0

姚順雨帶隊、Hy3 preview上線！騰訊現在適合上車嗎？

機器之心Pro 2026-04-23 20:04:42
0 跟貼 0
大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0

00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0

OpenAI推Workspace Agents，GPTs成為過去式

智東西 2026-04-23 20:11:52
0 跟貼 0
OpenAI最新生圖模型，馬斯克直播賣老干媽？

量子位 2026-04-21 04:17:17
0 跟貼 0

普華永道金軍：無人駕駛爆發點在 Robotaxi，明年將成市場亮點

每日經濟新聞 2026-04-23 20:48:04
0 跟貼 0
破局“智駕雙雄”，千里科技如何以AI之力重塑行業格局

36氪 2026-04-23 20:16:06
0 跟貼 0
俄副外長：俄方獲邀以最高級別參加美國G20峰會

財聯社 2026-04-23 11:20:05
17112 跟貼 17112
94%任務完成率，商湯Sage讓車載智能體跑出云端實力

南方都市報 2026-04-23 21:55:08
0 跟貼 0
從人工到機器，插秧邏輯已經變了！

秘密大爆炸 2026-04-22 10:16:34
1 跟貼 1
太炸了！脫口秀冠軍文本誕生！不好笑就露宿街頭！

徐醇老表哥 2026-04-20 17:41:45
1 跟貼 1
格力回應鋁線電機爭議：相關工程機已停產，海信稱靠多三兩銅多500元時代已終結

紅星資本局 2026-04-21 20:40:16
17351 跟貼 17351
戰后日本首次在境外發射進攻型導彈

北京青年報 2026-04-22 22:28:46
10386 跟貼 10386
V8發動機模型

制造科技 2026-04-19 17:41:19
0 跟貼 0
我們拷打了小米最新大模型：全模態很驚艷，但聯網檢索仍是短板

雷科技 2026-04-23 20:44:21
0 跟貼 0
什么是Token？5分鐘徹底搞懂大模型Token 原理、計算方式與作用詳解！

盧菁老師 2026-04-20 11:49:21
0 跟貼 0
美國街道展示這樣的尸體模型，路過的人目睹此景，表情太無助

萌力暴擊 2026-04-22 16:26:18
1 跟貼 1
英偉達 CEO 黃仁勛：AI 智能體不會取代軟件公司，反而會使軟件需求暴增！

知了3C 2026-04-22 03:24:06
0 跟貼 0
【你的AI靠不靠譜？】大模型項目落地評測標準：5 大類 30項指標，從技術到商業全覆蓋！AI大模型

盧菁老師 2026-04-22 09:25:00
0 跟貼 0
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
河北保定通報蠡縣部分灌溉井出水呈紅色調查處置情況

齊魯壹點 2026-04-22 18:27:11
92 跟貼 92
半掛模型玩具車買菜，要是超重了怎么辦，雷軍都不敢這么設計！

宇宙搞笑生活 2026-04-23 14:10:00
1 跟貼 1
剛剛，DeepSeek開始頻繁更新：Tile Kernels、DeepEP V2

機器之心Pro 2026-04-23 19:58:20
0 跟貼 0
PackingStar雙智能體博弈，攻克14維難題

量子位 2026-02-16 13:12:43
0 跟貼 0
爆火！把智能體當游戲角色來玩，一個人就是一個公司

機器之心Pro 2026-02-12 18:04:44
0 跟貼 0
它喊著防止追尾，卻又有意急剎，設計這個邏輯的公司真無敵了！

旅行指南者 2026-04-20 09:47:38
0 跟貼 0
中介稱"杭州600萬房子355萬急出" 有人看房被"丟路邊"

錢江晚報 2026-04-23 14:45:39
1055 跟貼 1055
奧地利科學家通過干涉實驗發現，成功實現了量子糾纏的科學可視化

未來宇宙w 2026-04-20 07:39:37
0 跟貼 0
中際旭創市值破1萬億元，近1年股價飆漲超10倍，實控人為75歲煙臺首富

紅星資本局 2026-04-23 13:11:15
706 跟貼 706
身高不夠鞋底來湊，官方數據身高1.7米，實際1.55米！

文鴻愛搞笑 2026-04-22 16:21:30
1 跟貼 1
重磅官宣！水官高速4月25日24時起停止收費

南方都市報 2026-04-23 16:44:13
1 跟貼 1
PS5迎來重磅系統更新！超關鍵內容改進上線

游民星空 2026-04-23 19:10:16
1 跟貼 1
數據驚人啊！

一頭漂浮在北京的大妞 2026-04-23 06:40:53
0 跟貼 0
“還債騎手”被強制下線240次：“開始我很反感過勞提醒，影響賺錢”

澎湃新聞 2026-04-23 15:04:11
53 跟貼 53
猴子也有邏輯,這操作,把大哥看笑了

咖啡_1 2026-04-19 11:02:23
0 跟貼 0
港媒：江旻憓已完成放棄加拿大護照

澎湃新聞 2026-04-23 13:06:27
10 跟貼 10
多重信號集中釋放，日本祭拜鬼社又發災難預警，中方態度再次升級

點燃好奇心 2026-04-23 07:39:01
1 跟貼 1

女大學生受邀去泰國潑水節被轉賣電詐園，家屬交20萬贖金：園區初步同意放人但不給位置；廣州警方已立案，教育部門介入

機器之心Pro

專業的人工智能媒體

12839文章數 142634關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

數碼

親子

房產

時尚

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

剛剛，姚順雨帶隊「重建」混元，首個大模型上線了

馬斯克喊出"史上最大產品"，但量產難預測

男子被境外虛擬貨幣黑平臺騙30萬 躺平不上班滿頭白發

男子被境外虛擬貨幣黑平臺騙30萬 躺平不上班滿頭白發

萊斯特城降入英甲，一場虧麻了的豪賭

王大陸因涉黑討債被判 女友也一同獲刑

關于AI算力鏈"瓶頸" 這是高盛的最新看法

令人驚艷的奇瑞車 風云A9可不只是樣子貨

態度原創

全球首款SGS卓越可靠性認證！榮耀筆記本X16 Plus評測：大屏輕薄本竟如此抗造

我宣布：我再也不怕喝牛奶了！

三亞安居房，突然官宣！

無用之書｜AI時代，閱讀是否還有意義？

男子被境外虛擬貨幣黑平臺騙30萬躺平不上班滿頭白發

男子被境外虛擬貨幣黑平臺騙30萬躺平不上班滿頭白發

王大陸因涉黑討債被判女友也一同獲刑

令人驚艷的奇瑞車風云A9可不只是樣子貨