<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      英偉達巧用8B模型秒掉GPT-5,開源了

      0
      分享至

      英偉達端著一個8B小模型對GPT-5說:

      不好意思,你還得練(bushi)。

      何出此言?——英偉達攜手香港大學開源的Orchestrator-8B,人類終極考試HLE分數更高、花錢更少、跑起來速度還更快。



      哦對了,還在HuggingFace被狂贊,沖到了熱門模型前五。



      而它超越GPT-5的打法是不當推理者,而是“工具主理人”,協調使用各路工具。

      如何吊打GPT-5?

      人在解決問題時會找各種幫手,比如搜索引擎、計算器 ,那這個工作能不能由模型代勞?

      Orchestrator干的就是這事兒。

      雖然自己只有8B參數,但手下管著一整個工具團隊。

      既有GPT-5、Claude Opus 4.1這樣的頂級大模型,也有Qwen2.5-Math這樣的專業數學工具,還有網頁搜索、本地檢索、代碼解釋器這些實用小幫手。



      它并不是自己解題,而是判斷現在該用哪個工具、控制工具的順序和使用次數、還能兼顧效果、成本、用戶偏好,工作日常如下:

      • 拿到難題先分析:這題需要算數學?那就調用Qwen2.5-Math;
      • 過程中動態調整:搜完資料發現需要驗證?那就先用代碼解釋器跑一遍;
      • 全程把控用戶偏好:用戶說要省錢,那GPT-5能不用就不用,優先用本地工具。

      簡單說,大模型是一個人干所有活,而Orchestrator-8B是帶著團隊干專業活。



      能讓小模型精準協調這么多工具,全靠英偉達的ToolOrchestra訓練大法。

      核心有兩個,一個是有獎有罰的強化學習,一個是量身定制的ToolScale數據集

      訓練時給Orchestrator立了三條獎懲規則:

      • 效果獎:讓GPT-5判對錯,解題對了加分,錯了扣分;
      • 效率獎:用的錢少、耗時短加分,反之扣分;
      • 偏好獎:聽用戶的話加分,比如用戶要隱私保護,多用本地搜索就加分。

      研究者建了個包含金融、醫療、電商、旅游等10個領域的訓練素材庫,里面全是“怎么用工具解題”的案例,讓模型充分接觸各類場景。

      Orchestrator-8B也在權威測試中交出了令人滿意的答卷。



      HLE測試里它拿下37.1%的得分,超過GPT-5的35.1%,成本卻僅為后者的1/2.5;



      FRAMES、τ2-Bench測試中也拿下SOTA成績,降低了開支,運行速度更是快了一倍多。

      小模型的逆襲

      實際上,在AI領域工具編排和小模型驅動復合系統的賽道上,英偉達ToolOrchestra訓練的Orchestrator-8B并非孤例。

      最早探索讓小模型學會調用工具的代表性研究,是谷歌DeepMind在2023年提出的Toolformer,通過監督學習+自生成數據,讓12B參數的模型學會調用計算器、翻譯API、搜索引擎等基礎工具;

      但當時,Toolformer僅聚焦基礎工具,并沒有把大模型納入工具庫。

      MIT和CMU聯合團隊的ToolRL,提出以獎勵為核心的工具學習框架,訓練小模型通過強化學習動態選擇工具,主要是解決“傳統工具學習過度依賴人工標注數據” 的問題,通過自動生成工具交互軌跡訓練模型。

      雖然也是獎勵機制,但ToolRL的獎勵函數更側重于任務的正確性和工具調用效率,并沒有明確納入用戶偏好,且工具庫以基礎工具和專業API為主。

      今年,香港大學和微軟提出的Optimal Tool Calls(OCT),也是專門針對“工具調用成本優化”的小模型訓練方法。

      越來越多的團隊在做相關研究,也有越來越多的人關注該領域的進展。

      就拿Orchestrator-8B來說,為什么它能獲得HuggingFace高贊?

      最明顯的原因就是實用。大模型雖強,但太貴、太慢,而Orchestrator-8B參數量小,還能實現「強+省錢」,直接解決了落地時的成本難題。

      用低成本實現高智能,這么一看,AI的未來還真不一定是超級大模型單打獨斗了。

      作者簡介

      Orchestrator-8B這篇論文的一作是香港大學博士蘇弘錦,主要研究方向是數據科學和自然語言處理,現在英偉達實習。



      共一是英偉達研究院的研究科學家Shizhe Diao,主要進行大型基礎模型的預訓練、高效調優和對齊方面的研究,曾與字節跳動人工智能實驗室的李航博士合作。



      論文地址:https://arxiv.org/abs/2511.21689
      項目主頁:https://research.nvidia.com/labs/lpr/ToolOrchestra/
      數據集:https://huggingface.co/datasets/nvidia/ToolScale
      HuggingFace地址:https://huggingface.co/nvidia/Nemotron-Orchestrator-8B

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      復旦大學領導班子調整

      復旦大學領導班子調整

      TOP大學來了
      2025-12-07 13:57:32
      臺灣封禁小紅書反助躍升下載榜首,大陸網民嘲技術落后1秒破解

      臺灣封禁小紅書反助躍升下載榜首,大陸網民嘲技術落后1秒破解

      星島記事
      2025-12-07 19:06:02
      才知道,飯店這5道菜,基本都是預制菜!點菜時,盡量少吃少碰

      才知道,飯店這5道菜,基本都是預制菜!點菜時,盡量少吃少碰

      簡食記工作號
      2025-11-26 00:12:12
      突然!美國決定:撤銷!

      突然!美國決定:撤銷!

      新浪財經
      2025-12-07 08:25:12
      王毅收到承諾后,馬克龍獲最高接見,他有4件事不得不對中方開口

      王毅收到承諾后,馬克龍獲最高接見,他有4件事不得不對中方開口

      趣史微視頻
      2025-12-07 20:00:07
      陳曉自曝光頭走紅毯真相!假發太假不如真光頭,網友:這顏值絕了

      陳曉自曝光頭走紅毯真相!假發太假不如真光頭,網友:這顏值絕了

      農村娛樂光哥
      2025-12-06 12:49:53
      23歲男中介帶看房9分鐘,女客戶報警稱被強奸,6個G視頻揭露真相

      23歲男中介帶看房9分鐘,女客戶報警稱被強奸,6個G視頻揭露真相

      懸案解密檔案
      2025-05-09 17:03:55
      貝佐斯攜妻子逛夜店,桑切斯臉上堆笑容光煥發,身上穿6萬元外套

      貝佐斯攜妻子逛夜店,桑切斯臉上堆笑容光煥發,身上穿6萬元外套

      手工制作阿殲
      2025-12-07 14:52:38
      年底惹不起!這3生肖橫財暴漲,貴人護體,誰人不羨慕?

      年底惹不起!這3生肖橫財暴漲,貴人護體,誰人不羨慕?

      毅談生肖
      2025-12-07 13:24:46
      1954年,尹先炳多次奸污女護士并致其自殺,毛主席大怒:開除黨籍

      1954年,尹先炳多次奸污女護士并致其自殺,毛主席大怒:開除黨籍

      帝哥說史
      2025-12-07 16:54:03
      汪峰再曝出軌,皮褲男為何桃花不斷

      汪峰再曝出軌,皮褲男為何桃花不斷

      不正確
      2025-12-05 19:59:53
      69年,河北某部隊師政委借宿農民家,閑聊中得知對方竟是特等功臣

      69年,河北某部隊師政委借宿農民家,閑聊中得知對方竟是特等功臣

      鶴羽說個事
      2025-12-06 14:24:28
      韓國總統府本月遷回青瓦臺

      韓國總統府本月遷回青瓦臺

      界面新聞
      2025-12-07 20:09:07
      丟冠后再遭重創!曝河南隊外援或遭足協處罰,韓國主裁判成導火索

      丟冠后再遭重創!曝河南隊外援或遭足協處罰,韓國主裁判成導火索

      體壇鑒春秋
      2025-12-07 12:56:43
      連續三屆入決賽劍指三連冠!國乒8-3韓國太輕松 莎頭5戰未丟1局

      連續三屆入決賽劍指三連冠!國乒8-3韓國太輕松 莎頭5戰未丟1局

      顏小白的籃球夢
      2025-12-07 12:03:18
      12生肖“首富潛力榜”!這4個生肖最會聚財,恭喜上榜

      12生肖“首富潛力榜”!這4個生肖最會聚財,恭喜上榜

      人閒情事
      2025-12-03 15:17:18
      馬筱梅挺孕肚現身機場,與汪小菲恩愛如常破不和傳聞,很恩愛

      馬筱梅挺孕肚現身機場,與汪小菲恩愛如常破不和傳聞,很恩愛

      小梊搞笑解說
      2025-12-07 18:25:22
      日本財務大臣被曝漏報超50萬日元款項

      日本財務大臣被曝漏報超50萬日元款項

      界面新聞
      2025-12-06 19:12:48
      全世界都在嘲諷韓男?

      全世界都在嘲諷韓男?

      奮斗在韓國
      2025-12-07 14:04:36
      臺灣問題或將突破“臨界點”,兩大跡象表明,大陸可能準備動手了

      臺灣問題或將突破“臨界點”,兩大跡象表明,大陸可能準備動手了

      阿光的技巧課堂
      2025-12-04 07:25:59
      2025-12-07 20:56:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      11820文章數 176340關注度
      往期回顧 全部

      科技要聞

      漲幅最高20%!戴爾、聯想等PC廠計劃漲價

      頭條要聞

      日方軍機滋擾中國海軍訓練 吳江浩大使提出嚴正交涉

      頭條要聞

      日方軍機滋擾中國海軍訓練 吳江浩大使提出嚴正交涉

      體育要聞

      梅開48度!2年半,這是梅西在邁阿密的一人一城

      娛樂要聞

      林俊杰AAA頒獎禮,韓娛愛豆均站起鞠躬

      財經要聞

      五糧液降價?回應來了

      汽車要聞

      傳奇超跑電動形態重生 雷克薩斯LFA純電概念車

      態度原創

      藝術
      教育
      家居
      游戲
      手機

      藝術要聞

      他單身,偷拍了5萬個姑娘,但所有女人竟都愛他!

      教育要聞

      海淀官宣!“積極探索延長義務教育年限”,釋放了哪些重磅信號?

      家居要聞

      白味湯館 當代宴飲儀式

      《艾爾登法環》大獲成功 系列銷量接近5000萬套

      手機要聞

      消息稱蘋果iPhone 18系列測試屏下3D解鎖、拼接微透玻璃

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 精品国产乱码久久久久久婷婷| 九九九国产| 亚洲精品国产美女久久久| jizz日本版| 垦利县| 四川少妇被弄到高潮| 国产精品无码午夜福利| 亚洲色欲在线播放一区| 久草福利资源站| 亚洲色另类| 久久综合香蕉国产蜜臀av| 人妻丰满av无码久久不卡| 久久一本人碰碰人碰| 极品熟女精品| 亚洲人妻影院| 成人性生交大片免费看| 中文字幕不卡在线播放| 亚洲色涩| Z〇Z○女人ZOZO另类| 亚洲欧洲av综合色无码| 干老熟女干老穴干老女人| 91资源总站| 建昌县| 久久久影院| 国产av制服丝袜| 国产精品被狂躁到高潮| 国产99视频精品免费视频76| 少妇人妻偷人精品视蜜桃| 欧美日韩不卡视频合集| 色欲AV涩爱AV蜜芽AV三区| 中文字幕亚洲在线观看| 国产精品国产三级国产试看| 亚洲精品久久久中文字幕痴女| 鲜嫩高中生无套进入| 91小电影| 国产中文在线| 亚洲精品日本久久一区二区三区| 久久亚洲精品中文字幕馆| 曰韩一级| 国产成人无码精品亚洲| 岛国av无码免费无禁网站 |