<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      登頂SuperCLUE DeepSearch,openPangu-R-72B深度搜索能力躍升

      0
      分享至

      機器之心發(fā)布

      機器之心編輯部

      隨著大模型推理和 Agent 工具調(diào)用能力的快速發(fā)展,其通過反復(fù)搜索處理復(fù)雜信息需求的效果愈發(fā)受到業(yè)界關(guān)注。近日,第三方評測機構(gòu) SuperCLUE 發(fā)布 11 月 DeepSearch 評測報告,國產(chǎn)大模型 openPangu-R-72B 憑借在長鏈推理、復(fù)雜信息檢索領(lǐng)域的卓越表現(xiàn),在模型榜單中名列第一,體現(xiàn)了基于國產(chǎn)昇騰算力的大模型研發(fā)實力。



      這款 MoE 架構(gòu)模型,究竟藏著哪些技術(shù)秘密,能在激烈競爭中脫穎而出?

      硬核技術(shù)底座:

      MoE 架構(gòu)下的效率與性能平衡術(shù)

      openPangu-R-72B 為考慮效率和性能平衡,重新設(shè)計了模型底座架構(gòu)。作為基于昇騰集群訓(xùn)練的 MoE(混合專家)模型,它采用 80 選 8 的專家選擇機制,在 74B 總參數(shù)量的基礎(chǔ)上,將激活參數(shù)量控制在 15B,既保留了大模型的復(fù)雜推理能力,又有效降低了計算開銷。24T tokens 的訓(xùn)練數(shù)據(jù)與 128k 長序列處理能力,為其處理深度搜索任務(wù)中的長文本信息奠定了基礎(chǔ)。

      為實現(xiàn)穩(wěn)定收斂與效果提升,openPangu 團隊在預(yù)訓(xùn)練技術(shù)上完成了以下優(yōu)化。



      圖. openPangu-R-72B 模型架構(gòu)

      1)注意力機制層面引入?yún)?shù)式 Sink Token 技術(shù):有效緩解了極大激活值問題,不僅提升了訓(xùn)練過程的穩(wěn)定性,也對后續(xù)量化更加親和;

      2)采用 K-Norm 與 Depth-Scaled Sandwich-Norm 組合的架構(gòu),其中 K-Norm 僅對 attention 的 key 施加 RMS Norm,在達到與 QK-Norm 相當(dāng)穩(wěn)定性的同時,降低計算開銷,還保留了 Query 更靈活的表達能力。

      3)注意力架構(gòu)的優(yōu)化兼顧了精度與效率:通過增加 Query 頭數(shù)和注意力頭維度,讓模型能從更多角度捕獲細粒度語義關(guān)系;引入 Partial RoPE 機制,僅對 Query 和 Key 中 1/3 維度應(yīng)用位置編碼。通過將 KV 組數(shù)量減半,在 Key 頭維度增加的情況下,仍實現(xiàn)了 37.5% 的 KV cache 縮減,平衡了推理階段的顯存占用、速度與模型效果。

      4)Adaptive Aux Free 負載優(yōu)化技術(shù):Aux free 升級版本,通過自適應(yīng)調(diào)整各個專家負載 bias 的更新幅度,有效減少均衡震蕩,讓專家負載分布更均衡。

      DeepSearch 專項突破:

      三大優(yōu)化破解復(fù)雜搜索難題

      如果說技術(shù)底座是基礎(chǔ),那么針對深度搜索任務(wù)的后訓(xùn)練優(yōu)化則是 openPangu-R-72B 登頂?shù)年P(guān)鍵。深度搜索作為大模型訪問互聯(lián)網(wǎng)獲取深度信息的核心能力,其長鏈推理與工具調(diào)用水平直接決定模型的實用價值。openPangu-R-72B 通過后訓(xùn)練階段進行長鏈難題合成、非索引信息處理、快慢思考融合三大策略,顯著提升了模型 DeepSearch 能力。



      圖.openPangu-R-72B 模型深度搜索任務(wù)執(zhí)行流程,該流程同時用于模型訓(xùn)練和評測

      1)在長鏈 QA 難題合成方面,openPangu 團隊在 DeepDiver-V2 和 WebExplorer 技術(shù)基礎(chǔ)上,通過 query 條件模糊化將問題平均難度提升 10%,同時借鑒《Pushing Test-Time Scaling Limits of Deep Search with Asymmetric Verification》工作的思想,引入 verification agent,大幅提升用于訓(xùn)練問答對的準(zhǔn)確性,讓模型在復(fù)雜推理場景中 “見多識廣”。

      2)針對傳統(tǒng)搜索引擎難以覆蓋的非索引知識問答 —— 如官網(wǎng)附件中的財務(wù)數(shù)據(jù)、學(xué)術(shù)論文引文信息獲取等場景,模型訓(xùn)練過程中注入了 “Planner 聚焦關(guān)鍵 URL+ URL_crawler 爬取網(wǎng)頁 + Document_QA 識別下一步瀏覽鏈接” 的循環(huán)工作流,通過同一站點內(nèi)的多跳瀏覽實現(xiàn)了深度信息搜集,突破了傳統(tǒng)搜索引擎的信息邊界。

      3)步驟級快慢融合策略則讓模型的 “思考” 更具效率。DeepSearch 的 ReACT 執(zhí)行過程中,不同步驟的思考強度差異顯著 ——Document_QA 需分析海量網(wǎng)頁數(shù)據(jù)與表格,對推理精度要求更高;而普通工具調(diào)用步驟更側(cè)重效率。為此,模型為不同步驟匹配不同思考模式:Document_QA 啟用慢思考保障精度,其他步驟采用快思考提升速度,實現(xiàn)了精度與效率的平衡。

      國產(chǎn)算力賦能:

      openPangu 系列模型彰顯集群優(yōu)勢

      此次 SuperCLUE DeepSearch 評測登頂,不僅是 openPangu-R-72B 模型能力的體現(xiàn),也彰顯了國產(chǎn)算力與大模型研發(fā)深度融合的成效。作為基于昇騰集群訓(xùn)練的代表模型,openPangu-R-72B 證明了國產(chǎn)算力平臺在支撐大參數(shù)量、高復(fù)雜度模型研發(fā)方面的堅實能力。

      值得關(guān)注的是,openPangu-R-72B 的兄弟模型openPangu-718B在同期 SuperCLUE 通用榜單中斬獲第二名,展現(xiàn)了該系列在不同任務(wù)場景下的全面實力。從深度搜索的 “單點突破” 到通用能力的 “全面開花”,openPangu 系列正以昇騰算力為根基,為國產(chǎn)大模型生態(tài)注做出更多貢獻。

      隨著大模型在企業(yè)服務(wù)、學(xué)術(shù)研究、政務(wù)處理等領(lǐng)域的深度落地,深度搜索能力將成為模型實用化的核心競爭力。未來,隨著 openPangu 系列模型的持續(xù)迭代,我們期待國產(chǎn)大模型在更多全球頂級評測中綻放光彩。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      陪玩陪睡只是冰山一角,認干爹,舔手指,拜高踩低,實在荒

      陪玩陪睡只是冰山一角,認干爹,舔手指,拜高踩低,實在荒

      素衣讀史
      2025-12-15 16:40:40
      王楚欽傷勢曝光!莫雷加德炮轟WTT,王皓怒懟林詩棟 張本智和發(fā)聲

      王楚欽傷勢曝光!莫雷加德炮轟WTT,王皓怒懟林詩棟 張本智和發(fā)聲

      知軒體育
      2025-12-14 16:51:34
      大眾ID.Cross純電小型SUV量產(chǎn)版諜照曝光,明年上市

      大眾ID.Cross純電小型SUV量產(chǎn)版諜照曝光,明年上市

      IT之家
      2025-12-14 14:13:11
      蘿卜是高血糖的催化劑?醫(yī)生再次叮囑:不想血糖飆升,4物別多吃

      蘿卜是高血糖的催化劑?醫(yī)生再次叮囑:不想血糖飆升,4物別多吃

      小童歷史
      2025-12-15 14:31:02
      明起上海氣溫開啟快速反彈模式,打亂入冬腳步

      明起上海氣溫開啟快速反彈模式,打亂入冬腳步

      金臺資訊
      2025-12-15 16:18:08
      上海18歲女大學(xué)生,糾纏80歲老頭4年,老頭報警后真相出乎意料

      上海18歲女大學(xué)生,糾纏80歲老頭4年,老頭報警后真相出乎意料

      民間精選故事匯
      2025-05-19 06:10:06
      外資豪華車在華遇冷:銷量下滑、二手車價跳水,國產(chǎn)車企搶占市場

      外資豪華車在華遇冷:銷量下滑、二手車價跳水,國產(chǎn)車企搶占市場

      IT之家
      2025-12-14 13:31:04
      必須拆除!這座用中國“血肉”堆起的“妖塔”,是亞洲的恥辱

      必須拆除!這座用中國“血肉”堆起的“妖塔”,是亞洲的恥辱

      小楊歷史
      2025-12-15 10:21:07
      1957年,劉伯承含淚交出帥印,接班名單讓全軍嘩然,三個湖南人硬是撐起了半壁江山

      1957年,劉伯承含淚交出帥印,接班名單讓全軍嘩然,三個湖南人硬是撐起了半壁江山

      桃煙讀史
      2025-12-11 15:17:44
      中國的最強一招果然來了?掐斷日本工業(yè)命脈,這下高市政府要急了

      中國的最強一招果然來了?掐斷日本工業(yè)命脈,這下高市政府要急了

      古事尋蹤記
      2025-12-15 07:22:29
      丈母娘手術(shù)費35萬我立馬轉(zhuǎn)過去,誰知次日丈母娘又找我要手術(shù)費

      丈母娘手術(shù)費35萬我立馬轉(zhuǎn)過去,誰知次日丈母娘又找我要手術(shù)費

      小秋情感說
      2025-12-15 13:48:37
      王楚欽退賽,誰注意他退場樣子,王勵勤不該犯錯,孫穎莎也退賽

      王楚欽退賽,誰注意他退場樣子,王勵勤不該犯錯,孫穎莎也退賽

      樂聊球
      2025-12-14 15:47:40
      誰說屁股大就不能穿瑜伽褲?黃色T恤搭薄荷綠瑜伽褲,成熟有活力

      誰說屁股大就不能穿瑜伽褲?黃色T恤搭薄荷綠瑜伽褲,成熟有活力

      小喬古裝漢服
      2025-11-12 11:46:01
      歷史最貴實戰(zhàn)球衣榜單:C羅一件球衣拍到近513萬元 梅西最高451萬

      歷史最貴實戰(zhàn)球衣榜單:C羅一件球衣拍到近513萬元 梅西最高451萬

      體壇八點半的那些事兒
      2025-12-15 16:55:55
      徐正源續(xù)約發(fā)生大反轉(zhuǎn),談判成死局,蓉城有預(yù)案,救火教練已浮現(xiàn)

      徐正源續(xù)約發(fā)生大反轉(zhuǎn),談判成死局,蓉城有預(yù)案,救火教練已浮現(xiàn)

      零度眼看球
      2025-12-15 08:47:10
      尼克松訪華,毛主席只送了4兩茶葉被嫌棄?周總理笑著說出4個字,美國總統(tǒng)立馬變了臉色

      尼克松訪華,毛主席只送了4兩茶葉被嫌棄?周總理笑著說出4個字,美國總統(tǒng)立馬變了臉色

      文史明鑒
      2025-12-13 22:15:21
      謝霆鋒大兒子深圳餐廳被偶遇,高清生圖驚艷全網(wǎng),五官立體獲好評

      謝霆鋒大兒子深圳餐廳被偶遇,高清生圖驚艷全網(wǎng),五官立體獲好評

      科學(xué)發(fā)掘
      2025-12-13 21:16:30
      中美俄開始醒悟!真正吸血的是歐洲人,如今他們終于要還債了

      中美俄開始醒悟!真正吸血的是歐洲人,如今他們終于要還債了

      來科點譜
      2025-12-10 09:03:49
      你辦綱絲節(jié),我收徒弟!著名相聲演員楊議喜收愛徒 女人身份曝光

      你辦綱絲節(jié),我收徒弟!著名相聲演員楊議喜收愛徒 女人身份曝光

      社會日日鮮
      2025-12-13 06:36:53
      韓媒確認:限日令比限韓令更嚴格,中國不讓韓國組合的日本人演出

      韓媒確認:限日令比限韓令更嚴格,中國不讓韓國組合的日本人演出

      諦聽骨語本尊
      2025-12-15 13:29:01
      2025-12-15 17:44:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      11922文章數(shù) 142509關(guān)注度
      往期回顧 全部

      科技要聞

      大佬冷酷預(yù)言:未來15年 人形機器人成廢鐵

      頭條要聞

      悉尼槍擊案后以總理猛批澳領(lǐng)導(dǎo)人 澳大利亞總理發(fā)聲

      頭條要聞

      悉尼槍擊案后以總理猛批澳領(lǐng)導(dǎo)人 澳大利亞總理發(fā)聲

      體育要聞

      戰(zhàn)勝完全體雷霆,馬刺“瘋狂動物城”只是半成品

      娛樂要聞

      何晴告別式現(xiàn)場,前夫許亞軍雙眼泛紅?

      財經(jīng)要聞

      新農(nóng)合漲到400元 農(nóng)民斷繳背后的扎心真相

      汽車要聞

      主駕配按摩還可選6座 新款捷途X90PRO售13.59萬起

      態(tài)度原創(chuàng)

      教育
      時尚
      本地
      藝術(shù)
      旅游

      教育要聞

      我是吉林歷史類考生,600分能上東北的哪些985高校?

      伊姐周日熱推:電視劇《老舅》;電視劇《啞舍》......

      本地新聞

      云游安徽|阜陽三朝風(fēng)骨,傳承千年墨香

      藝術(shù)要聞

      369米!中國第三大民企的全球運營總部,網(wǎng)傳三個設(shè)計方案

      旅游要聞

      從“歐洲后院”到“世界前臺”?葡萄牙“開搶”中國游客

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 亚洲成人性爱网| 欧美人妖另类| 亚洲AV无码成人| 大色综合| 超碰人人澡| 青青青爽视频在线观看| 国产熟女高潮视频| 亚洲欧洲日产国码无码久久99| 日韩精品久久久肉伦网站| 国产精品成人国产乱| 亚洲精品成人a?v久久| 阿荣旗| 特黄aaaaaaaaa毛片免费视频| 国产人与禽zoz0性伦多活几年 | 亚洲蜜桃精久久久久久久久久久久| 亚洲色欲色欲天天天www| 国产va| 极品少妇xxxx| 囯产精品久久久久久久久久妞妞| 成人网站免费观看| 91九色视频| 97人伦色伦成人免费视频 | 亚洲日逼| 日日爽| 欧美老熟妇色XXXXX性| 综合av| 中文字字幕在线中文乱码| 苍井空大战黑人| 久久人人妻人人爽人人爽| 亚洲sm另类一区二区三区| 级毛片内射视频| 在线观看日韩av| 国产成人?亚洲?日韩| 国产精品视频一区二区三区不卡 | 获嘉县| 久久99视频| 中文字幕高清在线| 人妻体体内射精一区二区| 人人爽人人爽人人片av东京热| 国内精品久久久久久久97牛牛| 中文字幕日韩精品一区二区三区|