<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      國產AI路由系統開源逆襲!僅用19%成本達到Gemini-2.5-Pro同性能

      0
      分享至

      Avengers-Pro團隊 投稿
      量子位 | 公眾號 QbitAI

      頂級大模型性能確實很強,但對于預算不高的用戶來說就是:

      你很好但我不配。

      雖然大模型的優越表現令人矚目,但動輒高昂的使用成本也讓不少用戶望而卻步。

      為平衡性能與成本,上海人工智能實驗室科研團隊基于前期技術積累,開源推出了Avengers-Pro多模型調度路由方案。



      該方案集成了8個行業領先的大模型,并在Human Last Exam、GPQA-diamond、ARC-AGI等6個挑戰性數據集上取得了優秀成績:

      1. 性能新高:Avengers-Pro的最高性能超越GPT-5-medium 7%,超越Gemini-2.5-Pro 19%。
      2. 極致性價比:Avengers-Pro能以降低27%成本的方式,達到與GPT-5-medium同等的頂級性能;更能以僅19%的成本,獲得Gemini-2.5-Pro同等的性能水平。
      3. 帕累托最優:相比單個模型,Avengers-Pro在任何給定成本水平下都能實現最高準確率;反之,針對任何指定的準確率目標,也能將成本降至最低,實現了性能-成本平衡的帕累托最優解。



      來看看是如何做到的。

      比GPT-5更強,更便宜

      研究背景:大模型的智能調度路由

      如何平衡大模型的性能表現和推理成本是大模型領域的關鍵問題。

      在已經被優化到極致的大模型系統的基礎上進一步提升性價比的挑戰性不言而喻。

      為解決這一問題,大模型智能調度路由應運而生。其核心思想是將不同任務分配給最適合的大模型,以提升模型回復質量,同時避免”大炮打蚊子“而產生的資源浪費。

      OpenAI在最新推出的GPT-5中,首次在商業模型中引入的多模型調度路由機制:

      在推理階段,系統會根據任務特性和用戶需求,動態切換低成本低性能模型與高成本強推理模型,實現性能與成本的靈活平衡。

      這表明GPT-5會通過一個實時的路由器(Router)來動態決策,可以在保證絕大多數問題得到高效解答的同時,將復雜、困難的推理任務交給能力更強的模型處理,從而在系統層面實現性能與陳本的最佳平衡。

      Avengers-Pro多模型調度路由方案則是對GPT-5多模型調度路由機制的進一步拓展。

      Avengers-Pro: 兼顧性能與成本,推動降本增效

      Avengers-Pro實現了對不同性能與成本的大模型進行統一集成與調度路由,為性能與成本的權衡提供了一站式解決方案,有效推動了大模型的降本增效。

      其核心機制是通過對用戶請求進行嵌入(embedding)和聚類(clustering)分析,動態匹配并分配最適合的模型來處理不同任務

      只需依靠少量用戶請求-答案標簽數據,Avengers-Pro框架主要包括以下三個核心步驟:

      1. 嵌入 (Embedding): 首先,該框架使用文本嵌入模型將用戶請求轉換成高維向量,捕捉其深層語義信息。
      2. 聚類 (Clustering): 接著,該框架將這些語義向量進行聚類,將相似的問題或任務歸為一個團簇。這使得系統能夠理解不同類型任務的共性,例如“物理知識問答”、“網頁制作代碼生成”等。
      3. 評分(Scoring): 該框架會預先在每個聚類所得到的團簇(即每類任務)上評估模型池中所有模型的性能和成本。基于一個可調節的性能-成本權衡參數α,系統為每個模型在個團簇上計算一個性能-成本綜合評分。

      推理時,Avengers-Pro框架會首先將其歸類到最相關的聚類中,并結合各模型在該聚類上的性能-成本綜合評分,將請求動態分配給得分最高的模型。

      通過調整參數α(范圍在0到1之間),系統可以在追求極致性能(α=1)與極致性價比(α=0)之間靈活切換,滿足不同應用場景下對性能與成本的多樣化需求。

      實驗表現:Avengers-Pro比GPT-5更強,更便宜

      在實驗中,Avengers-Pro集成了來自4個廠家的8個業界頂尖模型:

      1. OpenAI:GPT-5-chat, GPT-5-medium;
      2. Anthropic:Claude-4.1-opus, Claude-4-sonnet;
      3. Google:Gemini-2.5-pro, Gemini-2.5-flash;
      4. 阿里: Qwen3-235B-A22B-thinking-2507, Qwen3-235B-A22B-2507。

      評測場景由6個極具挑戰性的數據集組成: GPQA-Diamond, Human’s Last Exam, ARC-AGI, SimpleQA, LiveCodeBench, τ2-bench,覆蓋了代碼生成、科學推理、智能體應用等。

      Avengers-Pro的整體性能優于任意單一模型。當權衡系數傾向于追求性能時,Avengers-Pro的平均正確率為0.66。

      相比之下,模型池中最強的單一模型GPT-5-medium的平均正確率為0.62。也就是說,Avengers-Pro即使與當前性能最強的單模型對比,仍然實現了7%的性能提升。

      Avengers-Pro實現了性能-成本平衡,形成了帕累托前沿。通過靈活調整性能-成本權衡系數,當Avengers-Pro與GPT-5-medium性能持平時,能夠節省高達27%的成本。

      如果僅需達到GPT-5-medium 90%的性能,成本更是可降至僅37%。

      而在追求與Gemini-2.5-Pro相當的性能時,Avengers-Pro甚至只需19%的超低成本即可實現。

      并且,Avengers-Pro在任何給定的成本水平上,都能提供最高的準確率;反之,對于任何給定的準確率目標,都能將成本控制在最低。



      性能-成本權衡系數的影響:

      對性能-成本平衡系數的分析顯示,隨著系數從0逐漸提升到1(追求性能),模型的性能和成本均逐步上升。



      模型選擇:

      在不同的性能-成本權衡系數下,Avengers-Pro能夠根據不同模型的性能成本靈活進行任務分配。

      當系數更傾向于成本時,Qwen族的模型由于其較低的成本會被更多選擇。

      而當系數更傾向于性能時,GPT-5-medium這一性能相對較強的模型會被更多選擇。

      在集成了多個大模型后,調度路由能實現大模型的降本增效:在性能上超越了模型池中最強的單一模型,并且在保證相同性能的情況下,能顯著降低成本。

      此外,面對不同的性能與成本權衡需求,可針對不同任務,靈活自動選擇最合適的模型,全面滿足多樣化的應用場景。

      Avergers-Pro證明了在當前大模型生態下,智能調度路由方案的突出表現和巨大潛力。

      智能路由理念也將在未來大模型應用中帶來更多突破與驚喜。

      論文地址:https://arxiv.org/abs/2508.12631
      GitHub地址:https://github.com/ZhangYiqun018/AvengersPro

      — 完 —

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      尹錫悅結局已定?心腹全都招了,聽到槍斃兩個字后,他當場呆住

      尹錫悅結局已定?心腹全都招了,聽到槍斃兩個字后,他當場呆住

      夏目歷史君
      2025-11-14 22:17:31
      馬克龍訪華的唯一遺憾是什么?看法國人的評論得笑死

      馬克龍訪華的唯一遺憾是什么?看法國人的評論得笑死

      史智文道
      2025-12-06 16:16:34
      南京大動作!市委書記周紅波親自部署,下一個黃金板塊已浮現

      南京大動作!市委書記周紅波親自部署,下一個黃金板塊已浮現

      小曙說娛
      2025-12-07 14:31:25
      2025養老金認證大調整!50-70后不用跑,4種省心操作一看就會

      2025養老金認證大調整!50-70后不用跑,4種省心操作一看就會

      墜入二次元的海洋
      2025-12-07 06:23:44
      余嘉豪西乙暴走當選MVP!順下+防擋拆蛻變統治攻守,越來越適應了

      余嘉豪西乙暴走當選MVP!順下+防擋拆蛻變統治攻守,越來越適應了

      籃球資訊達人
      2025-12-07 14:29:23
      震驚!楊蘭蘭案第四次庭審,驚爆全網

      震驚!楊蘭蘭案第四次庭審,驚爆全網

      熱點菌本君
      2025-11-16 17:48:30
      隊記:開拓者召回楊瀚森因需要人手,本想讓他多打幾場G聯賽

      隊記:開拓者召回楊瀚森因需要人手,本想讓他多打幾場G聯賽

      懂球帝
      2025-12-07 11:01:07
      2歲出道年入百萬的劉楚恬,甜美容顏被禁止整容,如今長成啥樣?

      2歲出道年入百萬的劉楚恬,甜美容顏被禁止整容,如今長成啥樣?

      日不西沉
      2025-12-07 16:24:45
      微信這兩個功能,建議大家一定要刪除,不然安全性幾乎為“0”!

      微信這兩個功能,建議大家一定要刪除,不然安全性幾乎為“0”!

      CG說科技
      2025-12-05 17:40:13
      又一個亞馬爾!巴薩妖星1戰成名,獨造驚艷3球,拉什福德遭痛批

      又一個亞馬爾!巴薩妖星1戰成名,獨造驚艷3球,拉什福德遭痛批

      話體壇
      2025-12-07 04:07:12
      股價大漲!002353,再簽大單,迎176家機構調研!

      股價大漲!002353,再簽大單,迎176家機構調研!

      證券時報e公司
      2025-12-07 08:09:54
      亞朵大戰全季,傳統五星級酒店輸麻了

      亞朵大戰全季,傳統五星級酒店輸麻了

      IC實驗室
      2025-11-13 15:50:52
      央視曝光:郭美美、謝孟偉等,賬號被查處細節

      央視曝光:郭美美、謝孟偉等,賬號被查處細節

      新京報政事兒
      2025-12-06 21:38:07
      好萊塢反派專門戶中風逝! 田川洋行享壽75歲…演惡巫師走紅全球

      好萊塢反派專門戶中風逝! 田川洋行享壽75歲…演惡巫師走紅全球

      ETtoday星光云
      2025-12-05 14:58:03
      重返中國,水哥沃特斯回歸,1年合同,馬尚也有望回歸,杜鋒期待

      重返中國,水哥沃特斯回歸,1年合同,馬尚也有望回歸,杜鋒期待

      樂聊球
      2025-12-07 13:26:48
      全新奧迪A6L申報,3.0T動力提升,開始玩抽象

      全新奧迪A6L申報,3.0T動力提升,開始玩抽象

      車動態
      2025-12-07 09:56:32
      復旦大學領導班子調整

      復旦大學領導班子調整

      TOP大學來了
      2025-12-07 13:57:32
      張亮兒子不服管,曝天天在國外搞大女同學肚子,女方父母正鬧著!

      張亮兒子不服管,曝天天在國外搞大女同學肚子,女方父母正鬧著!

      阿廢冷眼觀察所
      2025-11-29 01:58:17
      廣東3消息!杜鋒難得開竅,陳家政最新傷情,崔永熙復出時間更新

      廣東3消息!杜鋒難得開竅,陳家政最新傷情,崔永熙復出時間更新

      多特體育說
      2025-12-07 00:05:03
      八國派兵堵門,中外軍機已交手,解放軍纏斗20分鐘,現場驚心動魄

      八國派兵堵門,中外軍機已交手,解放軍纏斗20分鐘,現場驚心動魄

      林子說事
      2025-12-06 14:49:03
      2025-12-07 21:48:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      11820文章數 176340關注度
      往期回顧 全部

      科技要聞

      漲幅最高20%!戴爾、聯想等PC廠計劃漲價

      頭條要聞

      馬克龍剛走德國外長向東出發 10月曾突然取消訪華行程

      頭條要聞

      馬克龍剛走德國外長向東出發 10月曾突然取消訪華行程

      體育要聞

      梅開48度!2年半,這是梅西在邁阿密的一人一城

      娛樂要聞

      林俊杰AAA頒獎禮,韓娛愛豆均站起鞠躬

      財經要聞

      五糧液降價?回應來了

      汽車要聞

      傳奇超跑電動形態重生 雷克薩斯LFA純電概念車

      態度原創

      家居
      時尚
      本地
      旅游
      數碼

      家居要聞

      白味湯館 當代宴飲儀式

      遼京:當一個媽媽開始寫作

      本地新聞

      云游安徽|七千年敘事,第一章寫在蚌埠

      旅游要聞

      大雪染冬色 非遺映冰雪——京津冀非遺冰雪季啟幕,文旅融合解鎖冬日新體驗

      數碼要聞

      OPPO Pad Air換皮?一加Pad Go 2平板細節曝光,兩種配色可選

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧美AA视频| 国产成人精品电影在线观看| 色综合久久久久无码专区| 亚洲一区二区中文av| 人妻久久久| 一本色道久久综合精品婷婷| 国精品无码一区二区三区在线| 玩弄少妇人妻中文字幕| 午夜精品区| 超碰99在线| 99国产精品99久久久久久| 狠狠88综合久久久久综合网| 国产精品香港三级国产av| 日本色导航| 人妻精品久久久久中文字幕86 | 无码熟妇人妻av在线电影| 婷婷五月在线视频| 国产精品办公室沙发| 亚洲国产精品久久精品| 人妻va精品va欧美va| 欧美熟妇高潮流白浆| 青青青爽视频在线观看| 内射合集对白在线| 99国产精品永久免费视频| 精品制服丝袜亚洲专区| 亚洲精品二| 动漫av纯肉无码av在线播放| 农村老熟妇乱子伦视频| 亚洲精品成人无码熟妇在线| 95在线一区| 欲香欲色天天综合和网| 中文字幕乱妇无码AV在线| 石棉县| 久久久久久曰本av免费免费| 少妇被粗大的猛烈进出免费视频| 午夜精品偷拍| 博野县| 午夜成人无码福利免费视频 | 久久亚洲av成人无码软件| AV无码一区二区三区| 我和亲妺妺乱的性视频|