<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      騰訊混元Hy3 preview發(fā)布并開源:混元重建后首個模型,Agent能力大幅提升

      0
      分享至

      4 月 23 日,騰訊混元 Hy3 preview 語言模型發(fā)布并開源。這是一個快慢思考融合的混合專家模型,總參數(shù) 295B,激活參數(shù) 21B,最大支持 256K 上下文長度。這是混元重建后訓(xùn)練的第一個模型,也是混元迄今最智能的模型,在復(fù)雜推理、指令遵循、上下文學(xué)習(xí)、代碼、智能體等能力及推理性能上實(shí)現(xiàn)了大幅的提升。

      2026 年2月,騰訊混元重建了預(yù)訓(xùn)練和強(qiáng)化學(xué)習(xí)的基礎(chǔ)設(shè)施,以及模型追求實(shí)用性的三個原則:

      1、能力體系化: 不推崇“偏科”,因?yàn)榧词故谴a智能體的單一應(yīng)用,也涉及推理、長文、指令、對話、代碼、工具等多種能力的深度協(xié)同。

      2、評測真實(shí)性: 主動跳出易被“刷榜”的公開榜單,通過自建題目、最新考試、人工評測、產(chǎn)品眾測等多種方式評估和改進(jìn)模型的“真實(shí)戰(zhàn)斗力”。

      3、性價(jià)比追求:實(shí)用性離不開商業(yè)合理性,深度協(xié)同模型架構(gòu)和推理框架的設(shè)計(jì),大幅降低任務(wù)成本,讓智能用得起、用得好。

      Hy3 preview可以視為混元快速探索實(shí)用性大模型、解決真實(shí)世界問題的一個開端。

      騰訊首席AI科學(xué)家姚順雨表示,Hy3 preview是混元大模型重建的第一步。我們希望通過這次開源和發(fā)布,獲得來自開源社區(qū)和用戶的真實(shí)反饋,幫助我們提升 Hy3 正式版的實(shí)用性。與此同時,我們也在繼續(xù)擴(kuò)大預(yù)訓(xùn)練和強(qiáng)化學(xué)習(xí)的規(guī)模,提升模型的智能上限,并通過與騰訊眾多產(chǎn)品的深度Co-Design,持續(xù)提升模型在真實(shí)場景中的綜合表現(xiàn),并開始探索特色模型能力。

      目前,Hy3 preview 已在騰訊云、元寶、ima、CodeBuddy、WorkBuddy、QQ、QQ瀏覽器、騰訊文檔、騰訊樂享等首發(fā)上線,微信公眾號、和平精英、騰訊新聞、騰訊自選股、騰訊客服、微信讀書等多個主線產(chǎn)品也在陸續(xù)上線。另外,Hy3 preview 支持接入流行的開源智能體產(chǎn)品,如 OpenClaw、OpenCode、KiloCode 等,并已上架騰訊云大模型服務(wù)平臺 TokenHub。

      Hy3 preview 主打全面實(shí)用性,Agent能力大幅提升

      多個測評結(jié)果顯示,Hy3 preview 模型能力全面提升。

      1、出色的上下文學(xué)習(xí)和指令遵循能力

      在各種真實(shí)的生產(chǎn)與生活場景,理解雜亂冗長的上下文并遵從復(fù)雜多變的規(guī)則是模型的首要挑戰(zhàn)。基于騰訊業(yè)務(wù)場景的靈感,騰訊混元提出了 CL-bench和 CL-bench-Life 來創(chuàng)新性地評估模型的上下文學(xué)習(xí)能力,并在 Hy3 preview 顯著地提升了模型上下文學(xué)習(xí)和指令遵循能力。


      2、復(fù)雜推理能力突出,清華數(shù)學(xué)博士資格考試國內(nèi)分?jǐn)?shù)最高

      復(fù)雜推理能力是模型解決各種問題的基礎(chǔ)。Hy3 preview 在 FrontierScience-Olympiad、IMOAnswerBench 等高難度理工科推理任務(wù)中表現(xiàn)突出,并在最新的清華大學(xué)求真書院數(shù)學(xué)博資考(26春) 和 全國中學(xué)生生物學(xué)聯(lián)賽(CHSBO 2025) 中取得優(yōu)異成績,展現(xiàn)了可泛化的強(qiáng)推理能力。


      3、代碼與智能體提升最為顯著,展現(xiàn)出高性價(jià)比

      代碼和智能體是 Hy3 preview 提升最為顯著的方向。得益于預(yù)訓(xùn)練及強(qiáng)化學(xué)習(xí)框架的重建和強(qiáng)化學(xué)習(xí)任務(wù)規(guī)模的提升,騰訊混元以較快的速度在 SWE-Bench Verified、Terminal-Bench 2.0 等主流代碼智能體基準(zhǔn)以及 BrowseComp、WideSearch 等主流搜索智能體基準(zhǔn)中取得了有競爭力的結(jié)果。


      在數(shù)字世界中,代碼關(guān)注的是模型在開發(fā)環(huán)境中的執(zhí)行能力,搜索則聚焦于開放信息空間中的檢索、篩選與整合能力,兩者共同決定了模型在復(fù)雜智能體場景(例如 OpenClaw)中是否真正具備可用性。Hy3 preview 在 ClawEval 和 WildClawBench 等評測中表現(xiàn)突出,表明我們的智能體能力正在穩(wěn)步走向全面與實(shí)用。


      除了公開榜單,騰訊混元還進(jìn)一步構(gòu)建了多個內(nèi)部的評測集,對模型在真實(shí)開發(fā)場景中的表現(xiàn)進(jìn)行評估。結(jié)果表明,無論是在后端工程任務(wù)集 Hy-Backend,貼近真實(shí)用戶開發(fā)交互的 Hy-Vibe Bench,還是高難度軟件工程開發(fā)任務(wù)集 Hy-SWE Max 上,Hy3 preview 均體現(xiàn)出了強(qiáng)競爭力。


      比較各個開源模型的大小與智能體綜合表現(xiàn),Hy3 preview 展現(xiàn)出高性價(jià)比。


      騰訊核心業(yè)務(wù)已全面接入,多主線AI 產(chǎn)品驗(yàn)證收益明顯

      正式上線之前,Hy3 preview在騰訊主要AI 業(yè)務(wù)進(jìn)行了產(chǎn)品測試,獲得明顯正收益。

      在元寶端,混元與元寶進(jìn)行了深度Co-Design。一方面,針對性地提升了模型在意圖理解精準(zhǔn)度、文本創(chuàng)作質(zhì)量、深度搜索等硬核指標(biāo)上的表現(xiàn);另一方面,對文風(fēng)、文筆、情商、內(nèi)容組織和內(nèi)容專業(yè)度上進(jìn)行了精細(xì)化調(diào)優(yōu)。模型與產(chǎn)品的深度協(xié)同,為用戶帶來了更智能且更具“活人感”的交互體驗(yàn)。

      在ima知識庫問答和通用問答兩個場景下,測試結(jié)果顯示,Hy3 preview 處理長文的能力出色,特別是檢索類任務(wù),在回答信息的準(zhǔn)確性、覆蓋度和全面性上表現(xiàn)較好。

      在CodeBuddy、WorkBuddy產(chǎn)品上,Hy3 preview 首 token 延遲降低 54%、端到端時長降低 47%、成功率提升至 99.99%+。實(shí)際用戶環(huán)境中,Hy3 preview 已穩(wěn)定驅(qū)動最長 495 步的復(fù)雜 Agent 工作流,覆蓋文檔處理、數(shù)據(jù)分析、知識檢索、MCP 工具鏈編排等多樣化辦公場景。

      在公眾號AI 分身和 AI 客服的場景專項(xiàng)評測中,Hy3 preview 展現(xiàn)出相比 Hy2 更全面的能力升級。新模型在用戶意圖理解、復(fù)雜上下文承接和知識信息組織方面表現(xiàn)更成熟,面對模糊提問、短句追問和多輪對話時,能夠更準(zhǔn)確地把握用戶訴求,并輸出更清晰、更穩(wěn)定的回復(fù)。結(jié)合知識庫、用戶記憶與上下文生成回答時更貼合AI 分身和 AI 客服的角色,過度腦補(bǔ)、主觀代入和情緒化表達(dá)顯著減少,使整體交互體驗(yàn)更貼近“可信、自然、高效”的回復(fù)目標(biāo)。

      在和平精英 AI NPC 場景評測中,和平精英團(tuán)隊(duì)第一時間在Hy3 preview上線后基于 AI NPC 場景中完成接入并開展評測,整體表現(xiàn)令人印象深刻。在游戲局外的人設(shè)扮演場景中,Hy3 Preview 不僅能夠精準(zhǔn)理解角色設(shè)定,還能針對開放性問題輸出高度關(guān)聯(lián)、富有增量價(jià)值的內(nèi)容,帶來了更加真實(shí)、自然、沉浸的對話體驗(yàn)。而在游戲局內(nèi)的復(fù)雜對戰(zhàn)場景中,模型回復(fù)節(jié)奏貼近真實(shí)玩家聊天體驗(yàn),展現(xiàn)出優(yōu)秀的穩(wěn)定性與出色的擬人化扮演能力,整體效果表現(xiàn)亮眼。

      在騰訊文檔AI PPT 場景,較上一版本(Hy2)取得了顯著進(jìn)步:生成成功率提升 20%,評測得分提升 10%,同時生成耗時縮短 20%。整體而言,新模型在評測場景中表現(xiàn)優(yōu)異,在模版選擇,色彩匹配,生成大綱,補(bǔ)充內(nèi)容多個階段,均體現(xiàn)出優(yōu)秀的表現(xiàn),無幻覺,契合主題,視覺效果好。

      在QQ AI助手小Q產(chǎn)品評測中,較上一版本,在長文本首字節(jié)時延、整體響應(yīng)速度與流式輸出效率方面顯著優(yōu)化;核心能力上,數(shù)學(xué)推理表現(xiàn)提升尤為明顯,多場景指令遵循與泛化能力進(jìn)一步增強(qiáng);在工具調(diào)用推理及多輪指代消解方面表現(xiàn)更穩(wěn)定高效,在OpenClaw官方PinchBench QQ智能體場景測試中取得突出效果,綜合體驗(yàn)實(shí)現(xiàn)明顯躍升。

      推理效率提升40%,同等成本智能密度最優(yōu)

      得益于模型和推理框架上的深度協(xié)同,以及在推理框架、算子性能、量化算法等全方面優(yōu)化,整體推理效率提升40%,Hy3 preview的成本相比上一代模型大幅下降。

      在騰訊云大模型服務(wù)平臺 TokenHub 上,Hy3 preview 輸入價(jià)格最低1.2元/百萬tokens,輸入命中緩存價(jià)格0.4元/百萬tokens,輸出價(jià)格最低4元/百萬tokens。同時,騰訊云聯(lián)合混元推出定制的 Hy3 preview Token Plan 套餐,個人版定價(jià)最低28元/月,為Agent開發(fā)和打造“龍蝦”應(yīng)用的提供更具性價(jià)比選擇。


      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      大鬧亞航后續(xù):女子冒充空姐,正臉曝光已社死,寫保證書只是開始

      大鬧亞航后續(xù):女子冒充空姐,正臉曝光已社死,寫保證書只是開始

      社會日日鮮
      2026-04-24 07:15:27
      A股:大家坐穩(wěn)扶好了,從下周起,大牛市或?qū)⒃俅沃匮輾v史了!

      A股:大家坐穩(wěn)扶好了,從下周起,大牛市或?qū)⒃俅沃匮輾v史了!

      夜深愛雜談
      2026-04-24 21:33:26
      國民黨、民眾黨聯(lián)手彈劾賴清德 5月19日將投票表決 此前累計(jì)超500萬人參與網(wǎng)絡(luò)聯(lián)署

      國民黨、民眾黨聯(lián)手彈劾賴清德 5月19日將投票表決 此前累計(jì)超500萬人參與網(wǎng)絡(luò)聯(lián)署

      每日經(jīng)濟(jì)新聞
      2026-04-24 18:53:33
      太慘了!燃油車再度迎來大降價(jià):最大跌幅50%,豪車帶頭“跳水”

      太慘了!燃油車再度迎來大降價(jià):最大跌幅50%,豪車帶頭“跳水”

      混沌錄
      2026-04-24 15:56:09
      福特:解散電動汽車事業(yè)部

      福特:解散電動汽車事業(yè)部

      中國能源網(wǎng)
      2026-04-22 17:39:14
      愛奇藝早該瘋了

      愛奇藝早該瘋了

      有數(shù)DataVision
      2026-04-23 20:35:46
      德普前妻隱居歐洲迎雙胞胎!單親媽媽帶3娃新照引熱議,有人猜生父是她前任馬斯克?

      德普前妻隱居歐洲迎雙胞胎!單親媽媽帶3娃新照引熱議,有人猜生父是她前任馬斯克?

      英國報(bào)姐
      2026-04-24 20:39:48
      雖然靈隱寺的間諜被證偽,但有人相信其它地方的間諜仍比比皆是..

      雖然靈隱寺的間諜被證偽,但有人相信其它地方的間諜仍比比皆是..

      細(xì)雨中的呼喊
      2026-04-24 21:13:16
      石油運(yùn)不出去、賣不出去的伊朗要被“噎”死了!

      石油運(yùn)不出去、賣不出去的伊朗要被“噎”死了!

      廖保平
      2026-04-24 08:59:44
      女子被保安扇耳光后續(xù)!知情者曝內(nèi)情,保安身份被扒,學(xué)校回應(yīng)

      女子被保安扇耳光后續(xù)!知情者曝內(nèi)情,保安身份被扒,學(xué)校回應(yīng)

      180視角
      2026-04-23 12:56:07
      斯諾克世錦賽:趙心童迎首勝!單桿64分追平丁俊暉,囧哥3-5到5-5

      斯諾克世錦賽:趙心童迎首勝!單桿64分追平丁俊暉,囧哥3-5到5-5

      劉姚堯的文字城堡
      2026-04-24 22:22:43
      商務(wù)部公布將7家歐盟實(shí)體列入出口管制管控名單

      商務(wù)部公布將7家歐盟實(shí)體列入出口管制管控名單

      界面新聞
      2026-04-24 16:02:07
      美國一女子在印度遭民宿員工下藥強(qiáng)奸,民宿老板發(fā)現(xiàn)后試圖掩蓋罪行,切斷網(wǎng)絡(luò)將其“囚禁”3天

      美國一女子在印度遭民宿員工下藥強(qiáng)奸,民宿老板發(fā)現(xiàn)后試圖掩蓋罪行,切斷網(wǎng)絡(luò)將其“囚禁”3天

      揚(yáng)子晚報(bào)
      2026-04-24 14:33:11
      太給面子了!美菲聯(lián)合軍演,解放軍在南海集結(jié)“滅國艦隊(duì)”!

      太給面子了!美菲聯(lián)合軍演,解放軍在南海集結(jié)“滅國艦隊(duì)”!

      阿龍聊軍事
      2026-04-24 21:05:04
      今日最慘股,連續(xù)上漲3個月后,今天一次性跌完,股價(jià)又創(chuàng)新低!

      今日最慘股,連續(xù)上漲3個月后,今天一次性跌完,股價(jià)又創(chuàng)新低!

      丁丁鯉史紀(jì)
      2026-04-24 17:01:03
      羞于啟齒!一離異女子哭訴,因戶口滯留前夫戶籍地,陷入尷尬境地

      羞于啟齒!一離異女子哭訴,因戶口滯留前夫戶籍地,陷入尷尬境地

      火山詩話
      2026-04-24 17:39:43
      死了這條心!人民日報(bào)表態(tài):中國不會救菲律賓,馬科斯投機(jī)到頭了

      死了這條心!人民日報(bào)表態(tài):中國不會救菲律賓,馬科斯投機(jī)到頭了

      風(fēng)干迷茫人
      2026-04-24 16:01:23
      震驚!網(wǎng)傳云南某明星演唱會,因舞臺像某標(biāo)志被叫停,真相來了…

      震驚!網(wǎng)傳云南某明星演唱會,因舞臺像某標(biāo)志被叫停,真相來了…

      火山詩話
      2026-04-24 10:39:54
      英特爾美股盤前大漲超30%

      英特爾美股盤前大漲超30%

      財(cái)聯(lián)社
      2026-04-24 17:52:28
      26歲設(shè)計(jì)師凌晨猝死辦公室 1個月加班19天

      26歲設(shè)計(jì)師凌晨猝死辦公室 1個月加班19天

      閃電新聞
      2026-04-24 16:58:18
      2026-04-24 23:39:00
      鞭牛士 incentive-icons
      鞭牛士
      準(zhǔn)確、快速、有深度的科技媒體
      106741文章數(shù) 61749關(guān)注度
      往期回顧 全部

      科技要聞

      DeepSeek V4牽手華為,價(jià)格依然"屠夫級"

      頭條要聞

      賴清德面臨彈劾投票 島內(nèi)網(wǎng)友:不記名投票一定過

      頭條要聞

      賴清德面臨彈劾投票 島內(nèi)網(wǎng)友:不記名投票一定過

      體育要聞

      上海男籃23連勝+主場全勝 姚明之后最強(qiáng)一季

      娛樂要聞

      停工16個月!趙露思證實(shí)接拍新劇

      財(cái)經(jīng)要聞

      LG財(cái)閥內(nèi)斗:百億美元商業(yè)帝國爭奪戰(zhàn)

      汽車要聞

      零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

      態(tài)度原創(chuàng)

      房產(chǎn)
      家居
      時尚
      數(shù)碼
      公開課

      房產(chǎn)要聞

      新一輪教育大爆發(fā)來了!海口,開始瘋狂建學(xué)校!

      家居要聞

      自然肌理 溫潤美學(xué)

      春天穿衣千萬別老氣橫秋!短長搭配、多穿裙子,優(yōu)雅舒適顯高

      數(shù)碼要聞

      RGB-Mini LED電視普及風(fēng)暴,海信正式發(fā)布小墨E5S Pro

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 内射后入在线观看一区| 一级做a爰片久久毛片16| 国产又色又爽又黄刺激视频| 色~性~乱~伦~噜| 久久久久亚洲AV成人片一区| 成熟丰满熟妇高潮xxxxx| 久草精品在线| 蜜桃一区二区午夜啪啪| 亚洲va在线∨a天堂va欧美va| 国产在线观看网址不卡一区| 蚌埠市| 摸丰满大乳奶水www免费| 东京热大乱w姦| 人妻无码网站| 国产免费视频一区二区| 亚洲av综合av一区| 亚洲av无码专区在线亚| 欧美激情国产一区在线不卡| 亚洲国产成人精品无码区二本 | 亚洲蜜桃精久久久久久久久久久久| 国产在线精品福利91香蕉| 亚洲乱人伦aⅴ精品| 亚洲无码成人视频| 91精品人妻一区二区| 99精品久久久久久久婷婷| 灵山县| 777米奇色狠狠888俺也去乱| 欧美劲爆第一页| 女人下边被添全过视频的网址| 国产精品18| 天天躁日日躁夜夜爽| 亚洲人成人伊人成综合网无码| 九九热在线视频观看精品| 日本深夜福利在线观看| YW尤物AV无码国产在线观看| 黑人巨大精品oideo| 亚洲av无码片在线播放| yy111111少妇影院免费观看| 天天摸夜夜摸夜夜狠狠添| 久久久久国色av免费观看| 保靖县|