<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      國產AI路由系統開源逆襲!僅用19%成本達到Gemini-2.5-Pro同性能

      0
      分享至

      Avengers-Pro團隊 投稿
      量子位 | 公眾號 QbitAI

      頂級大模型性能確實很強,但對于預算不高的用戶來說就是:

      你很好但我不配。

      雖然大模型的優越表現令人矚目,但動輒高昂的使用成本也讓不少用戶望而卻步。

      為平衡性能與成本,上海人工智能實驗室科研團隊基于前期技術積累,開源推出了Avengers-Pro多模型調度路由方案。



      該方案集成了8個行業領先的大模型,并在Human Last Exam、GPQA-diamond、ARC-AGI等6個挑戰性數據集上取得了優秀成績:

      1. 性能新高:Avengers-Pro的最高性能超越GPT-5-medium 7%,超越Gemini-2.5-Pro 19%。
      2. 極致性價比:Avengers-Pro能以降低27%成本的方式,達到與GPT-5-medium同等的頂級性能;更能以僅19%的成本,獲得Gemini-2.5-Pro同等的性能水平。
      3. 帕累托最優:相比單個模型,Avengers-Pro在任何給定成本水平下都能實現最高準確率;反之,針對任何指定的準確率目標,也能將成本降至最低,實現了性能-成本平衡的帕累托最優解。



      來看看是如何做到的。

      比GPT-5更強,更便宜

      研究背景:大模型的智能調度路由

      如何平衡大模型的性能表現和推理成本是大模型領域的關鍵問題。

      在已經被優化到極致的大模型系統的基礎上進一步提升性價比的挑戰性不言而喻。

      為解決這一問題,大模型智能調度路由應運而生。其核心思想是將不同任務分配給最適合的大模型,以提升模型回復質量,同時避免”大炮打蚊子“而產生的資源浪費。

      OpenAI在最新推出的GPT-5中,首次在商業模型中引入的多模型調度路由機制:

      在推理階段,系統會根據任務特性和用戶需求,動態切換低成本低性能模型與高成本強推理模型,實現性能與成本的靈活平衡。

      這表明GPT-5會通過一個實時的路由器(Router)來動態決策,可以在保證絕大多數問題得到高效解答的同時,將復雜、困難的推理任務交給能力更強的模型處理,從而在系統層面實現性能與陳本的最佳平衡。

      Avengers-Pro多模型調度路由方案則是對GPT-5多模型調度路由機制的進一步拓展。

      Avengers-Pro: 兼顧性能與成本,推動降本增效

      Avengers-Pro實現了對不同性能與成本的大模型進行統一集成與調度路由,為性能與成本的權衡提供了一站式解決方案,有效推動了大模型的降本增效。

      其核心機制是通過對用戶請求進行嵌入(embedding)和聚類(clustering)分析,動態匹配并分配最適合的模型來處理不同任務

      只需依靠少量用戶請求-答案標簽數據,Avengers-Pro框架主要包括以下三個核心步驟:

      1. 嵌入 (Embedding): 首先,該框架使用文本嵌入模型將用戶請求轉換成高維向量,捕捉其深層語義信息。
      2. 聚類 (Clustering): 接著,該框架將這些語義向量進行聚類,將相似的問題或任務歸為一個團簇。這使得系統能夠理解不同類型任務的共性,例如“物理知識問答”、“網頁制作代碼生成”等。
      3. 評分(Scoring): 該框架會預先在每個聚類所得到的團簇(即每類任務)上評估模型池中所有模型的性能和成本。基于一個可調節的性能-成本權衡參數α,系統為每個模型在個團簇上計算一個性能-成本綜合評分。

      推理時,Avengers-Pro框架會首先將其歸類到最相關的聚類中,并結合各模型在該聚類上的性能-成本綜合評分,將請求動態分配給得分最高的模型。

      通過調整參數α(范圍在0到1之間),系統可以在追求極致性能(α=1)與極致性價比(α=0)之間靈活切換,滿足不同應用場景下對性能與成本的多樣化需求。

      實驗表現:Avengers-Pro比GPT-5更強,更便宜

      在實驗中,Avengers-Pro集成了來自4個廠家的8個業界頂尖模型:

      1. OpenAI:GPT-5-chat, GPT-5-medium;
      2. Anthropic:Claude-4.1-opus, Claude-4-sonnet;
      3. Google:Gemini-2.5-pro, Gemini-2.5-flash;
      4. 阿里: Qwen3-235B-A22B-thinking-2507, Qwen3-235B-A22B-2507。

      評測場景由6個極具挑戰性的數據集組成: GPQA-Diamond, Human’s Last Exam, ARC-AGI, SimpleQA, LiveCodeBench, τ2-bench,覆蓋了代碼生成、科學推理、智能體應用等。

      Avengers-Pro的整體性能優于任意單一模型。當權衡系數傾向于追求性能時,Avengers-Pro的平均正確率為0.66。

      相比之下,模型池中最強的單一模型GPT-5-medium的平均正確率為0.62。也就是說,Avengers-Pro即使與當前性能最強的單模型對比,仍然實現了7%的性能提升。

      Avengers-Pro實現了性能-成本平衡,形成了帕累托前沿。通過靈活調整性能-成本權衡系數,當Avengers-Pro與GPT-5-medium性能持平時,能夠節省高達27%的成本。

      如果僅需達到GPT-5-medium 90%的性能,成本更是可降至僅37%。

      而在追求與Gemini-2.5-Pro相當的性能時,Avengers-Pro甚至只需19%的超低成本即可實現。

      并且,Avengers-Pro在任何給定的成本水平上,都能提供最高的準確率;反之,對于任何給定的準確率目標,都能將成本控制在最低。



      性能-成本權衡系數的影響:

      對性能-成本平衡系數的分析顯示,隨著系數從0逐漸提升到1(追求性能),模型的性能和成本均逐步上升。



      模型選擇:

      在不同的性能-成本權衡系數下,Avengers-Pro能夠根據不同模型的性能成本靈活進行任務分配。

      當系數更傾向于成本時,Qwen族的模型由于其較低的成本會被更多選擇。

      而當系數更傾向于性能時,GPT-5-medium這一性能相對較強的模型會被更多選擇。

      在集成了多個大模型后,調度路由能實現大模型的降本增效:在性能上超越了模型池中最強的單一模型,并且在保證相同性能的情況下,能顯著降低成本。

      此外,面對不同的性能與成本權衡需求,可針對不同任務,靈活自動選擇最合適的模型,全面滿足多樣化的應用場景。

      Avergers-Pro證明了在當前大模型生態下,智能調度路由方案的突出表現和巨大潛力。

      智能路由理念也將在未來大模型應用中帶來更多突破與驚喜。

      論文地址:https://arxiv.org/abs/2508.12631
      GitHub地址:https://github.com/ZhangYiqun018/AvengersPro

      — 完 —

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      淮陽人民中學“食堂承包商舉報校領導2年拿走300余萬現金”?官方通報

      淮陽人民中學“食堂承包商舉報校領導2年拿走300余萬現金”?官方通報

      界面新聞
      2026-01-21 10:11:25
      水貝市場已禁售銅條

      水貝市場已禁售銅條

      財聯社
      2026-01-21 08:48:10
      第7艘!中國香港油輪突發被美軍扣押,對華海上封鎖預演已經打響

      第7艘!中國香港油輪突發被美軍扣押,對華海上封鎖預演已經打響

      頭條爆料007
      2026-01-21 17:35:45
      退錢哥:經中國使館與沙特足協協商,中國球迷決賽將免票入場

      退錢哥:經中國使館與沙特足協協商,中國球迷決賽將免票入場

      懂球帝
      2026-01-21 22:21:07
      直沖20℃!浙江升溫時間確定

      直沖20℃!浙江升溫時間確定

      魯中晨報
      2026-01-21 19:27:03
      10億身家換不來10分鐘!剛簽大單就突然猝死,他的悲劇戳中多少人

      10億身家換不來10分鐘!剛簽大單就突然猝死,他的悲劇戳中多少人

      叮當當科技
      2026-01-21 00:02:16
      四連勝的越南隊!為何會被U23國足吊打,越南媒體撰文給出答案

      四連勝的越南隊!為何會被U23國足吊打,越南媒體撰文給出答案

      懂個球
      2026-01-22 00:08:47
      女子違停豎中指被撞社死!司機霸氣發聲,警方出手,這下麻煩大了

      女子違停豎中指被撞社死!司機霸氣發聲,警方出手,這下麻煩大了

      阿纂看事
      2026-01-21 15:40:00
      “回國禍害人了?”女留子畢業美圖被群嘲,網友:看過牢A就懂了

      “回國禍害人了?”女留子畢業美圖被群嘲,網友:看過牢A就懂了

      妍妍教育日記
      2026-01-20 19:09:20
      鏡報:得知長子的聲明后,小貝妻子維多利亞跌倒在地徹底崩潰

      鏡報:得知長子的聲明后,小貝妻子維多利亞跌倒在地徹底崩潰

      懂球帝
      2026-01-21 21:50:13
      俄羅斯發動大規模空襲,導彈中途居然還會轉向,基輔一半地區停電

      俄羅斯發動大規模空襲,導彈中途居然還會轉向,基輔一半地區停電

      碳基生物關懷組織
      2026-01-20 19:48:05
      為支付安置項目工程款,13戶村民“被貸款”;當地回應:情況較復雜,正設法解決

      為支付安置項目工程款,13戶村民“被貸款”;當地回應:情況較復雜,正設法解決

      大風新聞
      2026-01-21 20:46:04
      多只牛股業績出爐!002636,預計盈利增長超6倍!

      多只牛股業績出爐!002636,預計盈利增長超6倍!

      證券時報e公司
      2026-01-21 21:12:47
      剛剛 | 德云社嚴正聲明!

      剛剛 | 德云社嚴正聲明!

      天津廣播
      2026-01-21 20:23:38
      委內瑞拉代總統會見美國中情局局長,特朗普:她會來但現在不合適

      委內瑞拉代總統會見美國中情局局長,特朗普:她會來但現在不合適

      合贊歷史
      2026-01-21 16:27:56
      今年沒有大年三十,什么時候貼春聯最好?這4件事要早知道,別不當回事,圖個吉利!

      今年沒有大年三十,什么時候貼春聯最好?這4件事要早知道,別不當回事,圖個吉利!

      農夫也瘋狂
      2026-01-19 11:57:16
      日本歷史性一幕發生,60年來第二次,高市早苗:不排除辭任首相

      日本歷史性一幕發生,60年來第二次,高市早苗:不排除辭任首相

      近史博覽
      2026-01-21 11:03:05
      斬殺線太狠了!揭秘:父母死了,國外定居的子女都不肯回參加葬禮

      斬殺線太狠了!揭秘:父母死了,國外定居的子女都不肯回參加葬禮

      火山詩話
      2026-01-21 08:32:35
      “觀眾的命也是命”!75歲劉曉慶演少女時期武則天,評論區炸鍋了

      “觀眾的命也是命”!75歲劉曉慶演少女時期武則天,評論區炸鍋了

      八卦南風
      2026-01-21 17:03:01
      最后48小時,無一國領導人確定出席,普京都不給特朗普留薄面

      最后48小時,無一國領導人確定出席,普京都不給特朗普留薄面

      諦聽骨語本尊
      2026-01-21 13:27:56
      2026-01-22 04:04:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12044文章數 176361關注度
      往期回顧 全部

      科技要聞

      給機器人做仿真訓練 這家創企年營收破億

      頭條要聞

      特朗普稱“美國擁有無人知曉的武器” 克宮回應

      頭條要聞

      特朗普稱“美國擁有無人知曉的武器” 克宮回應

      體育要聞

      只會防守反擊?不好意思,我們要踢決賽了

      娛樂要聞

      首位捐款的明星 苗圃現身嫣然醫院捐款

      財經要聞

      丹麥打響第一槍 歐洲用資本保衛格陵蘭島

      汽車要聞

      2026款上汽大眾朗逸正式上市 售價12.09萬起

      態度原創

      家居
      數碼
      健康
      教育
      藝術

      家居要聞

      褪去浮華 觸達松弛與欣喜

      數碼要聞

      AI浪潮讓全球供應鏈陷入危機:1TB SSD僅300元時代結束

      打工人年終總結!健康通關=贏麻了

      教育要聞

      來上課了——非謂語動詞的難點:獨立主格現象第1段

      藝術要聞

      你絕對想不到,他的油畫美得如此驚人!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 精品一区二区三区无码视频| 国产精品无码av天天爽播放器| 亚洲熟女視頻| 亚洲情人网| 国产国产乱老熟女视频网站97| 青青草原网站在线观看 | 中文字幕国产精品自拍| 无码h片在线观看网站| 精品福利一区| 天堂…中文在线最新版在线 | 德安县| 国产精品久久久久影院老司| 丝袜精品字幕| 亚洲精品1| 欧美亚洲另类自拍偷在线拍| 久久婷婷五月综合97色| 男女性高爱潮免费网站| 国产成人av无码永久免费一线天| 国产精品久久久久野外| 中文字幕久区久久中文字幕| 国产v综合v亚洲欧美久久| 吴川市| 男人的天堂av社区在线| a片地址| 国产av一区二区三区| 麻豆熟妇乱妇熟色A片在线看| 乱色熟女综合一区二区| 国产精品乱码一区二区三区| 中文国产成人精品久久不卡| 亚洲女同精品久久女同| 91青草视频| 午夜福利看片在线观看| 黑人巨大精品欧美视频一区| 91在线无码精品秘?入口动作| 精品国产免费观看一区| 窝窝午夜看片| 99热在线只有精品| 无翼乌口工全彩无遮挡h全彩 | 久久综合激情网| 国产精品美女一区二三区| 亚洲日韩中文字幕在线播放|