![]()
2026 年 4 月 23 日,騰訊發布并開源新一代語言模型 Hy3 preview。
![]()
Hy3 preview 是騰訊混元“重建”后首個對外發布的新旗艦模型。也是前 OpenAI 研究員姚順雨加盟騰訊、負責基礎模型研發之后推出的首個旗艦模型。
![]()
騰訊首席 AI 科學家姚順雨表示,Hy3 preview 是混元大模型重建的第一步。我們希望通過這次開源和發布,獲得來自開源社區和用戶的真實反饋,幫助我們提升 Hy3 正式版的實用性。與此同時,我們也在繼續擴大預訓練和強化學習的規模,提升模型的智能上限,并通過與騰訊眾多產品的深度 Co-Design,持續提升模型在真實場景中的綜合表現,并開始探索特色模型能力。
Hy3 preview 對騰訊意義是終于拿出了一顆能同時服務超級入口、云業務、開發者工具和企業 agent 的自研底座。
接下來,騰訊 AI 的競爭重點會從“有沒有模型”,轉向“能不能將整個生態跑起來”。
Hy3 preview 已在元寶、ima、CodeBuddy、WorkBuddy、QQ、QQ瀏覽器、騰訊文檔、騰訊樂享、騰訊地圖、騰訊電子簽等首發上線,微信公眾號、和平精英、騰訊新聞、騰訊自選股、騰訊客服、微信讀書等多個主線產品也在陸續上線。
![]()
Hy3 preview 是一個快慢思考融合的 MoE 語言模型,總參數 295B,激活參數 21B,最大支持 256K 超長上下文。它在復雜推理、指令遵循、上下文學習、代碼、智能體等能力及推理性能上實現了大幅的提升。
![]()
預訓練模型性能:
![]()
上下文學習和指令遵循(Context Learning & Instruction Following):
![]()
在各種真實的生產與生活場景,理解雜亂冗長的上下文并遵從復雜多變的規則是模型的首要挑戰。 基于騰訊多種業務場景的靈感,騰訊提出了 CL-bench 和 CL-bench-Life 來創新性地評估模型的上下文學習能力,并在 Hy3 preview 顯著地提升了模型上下文學習和指令遵循能力。 復雜推理(STEM & Reasoning)
![]()
推理能力是模型解決各種問題的基礎。Hy3 preview 在 FrontierScience-Olympiad、IMOAnswerBench 等高難度理工科推理任務中表現突出,并在最新的清華大學求真書院數學博資考(26春)和全國中學生生物學聯賽(CHSBO 2025)中取得優異成績,展現出可泛化的強推理能力。
代碼和智能體(Code & Agent):
![]()
代碼和智能體是 Hy3 preview 提升最為顯著的方向。得益于預訓練及強化學習框架的重建和強化學習任務規模的提升,騰訊以較快的速度在 SWE-Bench Verified、Terminal-Bench 2.0 等主流代碼智能體基準以及 BrowseComp、WideSearch 等主流搜索智能體基準中取得了強競爭力的結果。
在數字世界中,代碼關注的是模型在開發環境中的執行能力,搜索則聚焦于開放信息空間中的檢索、篩選與整合能力,兩者共同決定了模型在復雜智能體場景(例如 OpenClaw)中是否真正具備可用性。
![]()
開源網址:https://github.com/Tencent-Hunyuan/Hy3-preview
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.