<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      英偉達巧用8B模型秒掉GPT-5,開源了

      0
      分享至

      英偉達端著一個8B小模型對GPT-5說:

      不好意思,你還得練(bushi)。

      何出此言?——英偉達攜手香港大學開源的Orchestrator-8B,人類終極考試HLE分數更高、花錢更少、跑起來速度還更快。



      哦對了,還在HuggingFace被狂贊,沖到了熱門模型前五。



      而它超越GPT-5的打法是不當推理者,而是“工具主理人”,協調使用各路工具。

      如何吊打GPT-5?

      人在解決問題時會找各種幫手,比如搜索引擎、計算器 ,那這個工作能不能由模型代勞?

      Orchestrator干的就是這事兒。

      雖然自己只有8B參數,但手下管著一整個工具團隊。

      既有GPT-5、Claude Opus 4.1這樣的頂級大模型,也有Qwen2.5-Math這樣的專業數學工具,還有網頁搜索、本地檢索、代碼解釋器這些實用小幫手。



      它并不是自己解題,而是判斷現在該用哪個工具、控制工具的順序和使用次數、還能兼顧效果、成本、用戶偏好,工作日常如下:

      • 拿到難題先分析:這題需要算數學?那就調用Qwen2.5-Math;
      • 過程中動態調整:搜完資料發現需要驗證?那就先用代碼解釋器跑一遍;
      • 全程把控用戶偏好:用戶說要省錢,那GPT-5能不用就不用,優先用本地工具。

      簡單說,大模型是一個人干所有活,而Orchestrator-8B是帶著團隊干專業活。



      能讓小模型精準協調這么多工具,全靠英偉達的ToolOrchestra訓練大法。

      核心有兩個,一個是有獎有罰的強化學習,一個是量身定制的ToolScale數據集

      訓練時給Orchestrator立了三條獎懲規則:

      • 效果獎:讓GPT-5判對錯,解題對了加分,錯了扣分;
      • 效率獎:用的錢少、耗時短加分,反之扣分;
      • 偏好獎:聽用戶的話加分,比如用戶要隱私保護,多用本地搜索就加分。

      研究者建了個包含金融、醫療、電商、旅游等10個領域的訓練素材庫,里面全是“怎么用工具解題”的案例,讓模型充分接觸各類場景。

      Orchestrator-8B也在權威測試中交出了令人滿意的答卷。



      HLE測試里它拿下37.1%的得分,超過GPT-5的35.1%,成本卻僅為后者的1/2.5;



      FRAMES、τ2-Bench測試中也拿下SOTA成績,降低了開支,運行速度更是快了一倍多。

      小模型的逆襲

      實際上,在AI領域工具編排和小模型驅動復合系統的賽道上,英偉達ToolOrchestra訓練的Orchestrator-8B并非孤例。

      最早探索讓小模型學會調用工具的代表性研究,是谷歌DeepMind在2023年提出的Toolformer,通過監督學習+自生成數據,讓12B參數的模型學會調用計算器、翻譯API、搜索引擎等基礎工具;

      但當時,Toolformer僅聚焦基礎工具,并沒有把大模型納入工具庫。

      MIT和CMU聯合團隊的ToolRL,提出以獎勵為核心的工具學習框架,訓練小模型通過強化學習動態選擇工具,主要是解決“傳統工具學習過度依賴人工標注數據” 的問題,通過自動生成工具交互軌跡訓練模型。

      雖然也是獎勵機制,但ToolRL的獎勵函數更側重于任務的正確性和工具調用效率,并沒有明確納入用戶偏好,且工具庫以基礎工具和專業API為主。

      今年,香港大學和微軟提出的Optimal Tool Calls(OCT),也是專門針對“工具調用成本優化”的小模型訓練方法。

      越來越多的團隊在做相關研究,也有越來越多的人關注該領域的進展。

      就拿Orchestrator-8B來說,為什么它能獲得HuggingFace高贊?

      最明顯的原因就是實用。大模型雖強,但太貴、太慢,而Orchestrator-8B參數量小,還能實現「強+省錢」,直接解決了落地時的成本難題。

      用低成本實現高智能,這么一看,AI的未來還真不一定是超級大模型單打獨斗了。

      作者簡介

      Orchestrator-8B這篇論文的一作是香港大學博士蘇弘錦,主要研究方向是數據科學和自然語言處理,現在英偉達實習。



      共一是英偉達研究院的研究科學家Shizhe Diao,主要進行大型基礎模型的預訓練、高效調優和對齊方面的研究,曾與字節跳動人工智能實驗室的李航博士合作。



      論文地址:https://arxiv.org/abs/2511.21689
      項目主頁:https://research.nvidia.com/labs/lpr/ToolOrchestra/
      數據集:https://huggingface.co/datasets/nvidia/ToolScale
      HuggingFace地址:https://huggingface.co/nvidia/Nemotron-Orchestrator-8B

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      用凳子砸同學后續:馬某已開除,正臉被扒已社死,恐新學校不好混

      用凳子砸同學后續:馬某已開除,正臉被扒已社死,恐新學校不好混

      奇思妙想草葉君
      2026-01-20 18:52:32
      小時候驚為天人,長大后泯然眾人,這些童星咋突然就“長殘”了

      小時候驚為天人,長大后泯然眾人,這些童星咋突然就“長殘”了

      大鐵貓娛樂
      2026-01-19 14:40:03
      羽絨服里穿短袖更暖和?抗寒正確穿衣姿勢看過來|真探隊

      羽絨服里穿短袖更暖和?抗寒正確穿衣姿勢看過來|真探隊

      封面新聞
      2026-01-21 09:57:10
      體壇:本屆U23國足將在9月亞運會后解散

      體壇:本屆U23國足將在9月亞運會后解散

      懂球帝
      2026-01-21 15:37:09
      新郎貸款16萬付彩禮,因3600元“下車費”爭執婚禮泡湯,男方起訴返還彩禮,法院判了

      新郎貸款16萬付彩禮,因3600元“下車費”爭執婚禮泡湯,男方起訴返還彩禮,法院判了

      臺州交通廣播
      2026-01-21 14:21:56
      懷念中超?34歲奧斯卡患心臟病卻無法退役 圣保羅拒付欠薪+談崩了

      懷念中超?34歲奧斯卡患心臟病卻無法退役 圣保羅拒付欠薪+談崩了

      風過鄉
      2026-01-21 21:24:12
      中國隊晉級亞洲杯決賽!以下7位國腳身價必漲,李昊+彭嘯位列其中

      中國隊晉級亞洲杯決賽!以下7位國腳身價必漲,李昊+彭嘯位列其中

      球場沒跑道
      2026-01-21 17:00:33
      第四代住宅賣不動了?住進去才知道的“七宗罪”

      第四代住宅賣不動了?住進去才知道的“七宗罪”

      室內設計師有料兒
      2026-01-20 11:23:56
      孫悅自曝錄春晚被凍傷,滿臉通紅引網友心疼

      孫悅自曝錄春晚被凍傷,滿臉通紅引網友心疼

      紅星新聞
      2026-01-21 12:12:25
      俄柬菲免簽了,明星們卻扎堆北海道

      俄柬菲免簽了,明星們卻扎堆北海道

      生活時尚導刊
      2026-01-19 22:00:12
      安東尼奧:我很感動 在中國我想證明中國足球可以贏得酣暢淋漓

      安東尼奧:我很感動 在中國我想證明中國足球可以贏得酣暢淋漓

      削桐作琴
      2026-01-21 16:18:51
      女人這兩件事,99%不會告訴男人,100%的男人都不知道

      女人這兩件事,99%不會告訴男人,100%的男人都不知道

      青蘋果sht
      2026-01-20 05:45:59
      王征同志逝世

      王征同志逝世

      政知新媒體
      2026-01-20 10:18:42
      湖北蘄春通報“一中學通過家委會收取托管費”:收費情況屬實,已責令學校主要負責人停職整改

      湖北蘄春通報“一中學通過家委會收取托管費”:收費情況屬實,已責令學校主要負責人停職整改

      環球網資訊
      2026-01-21 21:39:34
      貴州省銅仁市第二人民醫院黨委書記熊蓮主動投案!

      貴州省銅仁市第二人民醫院黨委書記熊蓮主動投案!

      瀟湘晨報
      2026-01-21 15:37:11
      別再買錯了!網購時“旗艦店”和“官方店”差2字,背后差別不小

      別再買錯了!網購時“旗艦店”和“官方店”差2字,背后差別不小

      復轉這些年
      2026-01-20 08:10:05
      加拿大低稅進口4.9萬輛中國新能源車,配額最多的居然不是比亞迪

      加拿大低稅進口4.9萬輛中國新能源車,配額最多的居然不是比亞迪

      藍色海邊
      2026-01-21 03:17:15
      貝克漢姆長子在說謊?英國媒體爆料婚紗實情:為妮可拉準備了一年

      貝克漢姆長子在說謊?英國媒體爆料婚紗實情:為妮可拉準備了一年

      譯言
      2026-01-20 21:53:55
      重慶市豐都縣人大原副廳級干部秦俊仕接受審查調查

      重慶市豐都縣人大原副廳級干部秦俊仕接受審查調查

      界面新聞
      2026-01-21 21:05:20
      GE 旋轉爆轟引擎試車成功,美軍導彈要告別 “笨重助推器”?

      GE 旋轉爆轟引擎試車成功,美軍導彈要告別 “笨重助推器”?

      航空之家Aviation
      2026-01-20 18:55:15
      2026-01-21 22:51:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12044文章數 176361關注度
      往期回顧 全部

      科技要聞

      給機器人做仿真訓練 這家創企年營收破億

      頭條要聞

      西安高校創始人兩女兒爭繼承權 判完才發現公證書造假

      頭條要聞

      西安高校創始人兩女兒爭繼承權 判完才發現公證書造假

      體育要聞

      只會防守反擊?不好意思,我們要踢決賽了

      娛樂要聞

      首位捐款的明星 苗圃現身嫣然醫院捐款

      財經要聞

      丹麥打響第一槍 歐洲用資本保衛格陵蘭島

      汽車要聞

      2026款上汽大眾朗逸正式上市 售價12.09萬起

      態度原創

      旅游
      時尚
      藝術
      手機
      教育

      旅游要聞

      “神州北極”漠河兩日連現璀璨極光

      照赫本這樣穿,灰色很時髦!

      藝術要聞

      一百多年前的中國,太雄偉震撼了!

      手機要聞

      真我Neo8參數匯總,就差價格了

      教育要聞

      這才是尖子生的提分捷徑!沖刺階段,“榨干”錯題,告別死記硬背

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产经典免费播放视频| 国产v| 欧美情侣性视频| 成人视频在线观看| 亚洲AV影视| 中文字幕一区二区三区擦澡| 91色交| 亚洲av午夜福利精品一级无| 亚洲欧美色综合影院| 无码中文字| 人成午夜免费视频在线观看| 精品人妻丰满久久久a| 亚洲综合无码| 亚洲黄色在线看| 日本韩国一区二区精品 | 人妻少妇久久精品电影| 99精品久久毛片a片| 日本熟妇色xxxxx日本免费看| 色8久久人人97超碰香蕉987| 日韩十八不禁| 久久www免费人成一看片| 中文有无人妻vs无码人妻激烈| 大又大又粗又硬又爽少妇毛片| 国产精品久久777777| 这里只有精品免费视频 | 四虎成人精品无码永久在线| 欧美va| 亚洲av伊人久久青青草原| 亚洲中文字幕无码中文字在线| 久久av高潮av喷水av无码| 99国产欧美久久久精品蜜芽| 人与禽交av在线播放| www.99| 久久天天躁夜夜躁狠狠I女人| 亚洲人成伊人成综合网久久久| 快好爽射给我视频| 999国内精品视频免费| 国内精品久久久久影院日本| 新疆| 国产成人av在线影院| 久久天天躁狠狠躁夜夜av|