<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      MiniMax發(fā)布M2.5模型:1美元運行1小時,價格僅為GPT-5的1/20,性能比肩Claude Opus

      0
      分享至

      MiniMax推出了其最新迭代的M2.5系列模型,在保持行業(yè)領先性能的同時,大幅降低了推理成本,試圖解決復雜Agent應用在經(jīng)濟上不可行的痛點,并宣稱其在編程、工具調(diào)用及辦公場景中已達到或刷新了行業(yè)SOTA(當前最佳)水平。

      2月13日,MiniMax公布的數(shù)據(jù)顯示,M2.5展現(xiàn)了顯著的價格優(yōu)勢。在每秒輸出50個token的版本下,其價格僅為Claude Opus、Gemini 3 Pro以及GPT-5等主流模型的1/10至1/20。

      在每秒輸出100個token的高速運行環(huán)境下,M2.5連續(xù)工作一小時的成本僅需1美元,若降至50 token/秒,成本進一步下探至0.3美元。這意味著1萬美元的預算足以支撐4個Agent連續(xù)工作一年,極大地降低了構建和運營大規(guī)模Agent集群的門檻。

      在性能維度,M2.5在核心編程測試中表現(xiàn)強勁,并在多語言任務Multi-SWE-Bench上取得第一,整體水平比肩Claude Opus系列。同時,模型優(yōu)化了對復雜任務的拆解能力,在SWE-Bench Verified測試中,完成任務的速度較上一代M2.1提升了37%,端到端運行時間縮短至22.8分鐘,與Claude Opus 4.6持平

      目前,MiniMax內(nèi)部業(yè)務已率先驗證了該模型的能力。數(shù)據(jù)顯示,其內(nèi)部30%的整體任務已由M2.5自主完成,覆蓋研發(fā)、產(chǎn)品、銷售等核心職能。特別是在編程場景中,M2.5生成的代碼已占據(jù)新提交代碼的80%,顯示出該模型在真實生產(chǎn)環(huán)境中的高滲透率和可用性。

      擊穿成本底線:無限運行Agent的經(jīng)濟可行性

      M2.5的設計初衷是消除運行復雜Agent的成本約束。MiniMax通過優(yōu)化推理速度和token效率實現(xiàn)了這一目標。模型提供100 TPS(每秒傳輸事務處理量)的推理速度,約為當前主流模型的兩倍。

      除了單純的算力成本降低,M2.5通過更高效的任務拆解和決策邏輯,減少了完成任務所需的token總量。

      在SWE-Bench Verified評測中,M2.5平均每個任務消耗3.52M token,低于M2.1的3.72M。

      速度與效率的雙重提升,使得企業(yè)在經(jīng)濟上幾乎可以無限制地構建和運營Agent,將競爭焦點從成本轉移至模型能力的迭代速度上。

      編程能力進階:像架構師一樣思考與構建

      在編程領域,M2.5不僅關注代碼生成,更強調(diào)系統(tǒng)設計能力。模型演化出了原生的Spec(規(guī)格說明書)行為,能夠以架構師視角在編碼前主動拆解功能、結構和UI設計。

      該模型在超過10種編程語言(包括GO、C++、Rust、Python等)和數(shù)十萬個真實環(huán)境中進行了訓練。

      測試顯示,M2.5能勝任從系統(tǒng)設計(0-1)、開發(fā)(1-10)到功能迭代(10-90)及最終代碼審查(90-100)的全流程。

      為了驗證其在不同開發(fā)環(huán)境下的泛化性,MiniMax在Droid和OpenCode等編程腳手架上進行了測試。

      結果顯示,M2.5在Droid上的通過率為79.7,在OpenCode上為76.1,均優(yōu)于上一代模型及Claude Opus 4.6。


      復雜任務處理:更高效的搜索與專業(yè)交付

      在搜索和工具調(diào)用方面,M2.5展示了更高的決策成熟度,不再單純追求“做對”,而是尋求以更精簡的路徑解決問題。

      在BrowseComp、Wide Search和RISE等多項任務中,M2.5相較于前代節(jié)省了約20%的輪次消耗,以更優(yōu)的token效率逼近結果。


      針對辦公場景,MiniMax通過與金融、法律等領域資深從業(yè)者合作,將行業(yè)隱性知識融入模型訓練。

      在內(nèi)部構建的Cowork Agent評測框架(GDPval-MM)中,M2.5在與主流模型的兩兩對比中取得了59.0%的平均勝率,能夠輸出符合行業(yè)標準的Word研報、PPT及復雜的Excel財務模型,而非簡單的文本生成。



      技術底座:原生Agent RL框架驅動線性提升

      M2.5性能提升的核心驅動力來自于大規(guī)模強化學習(RL)。

      MiniMax采用了名為Forge的原生Agent RL框架,通過引入中間層解耦了底層訓推引擎與Agent,支持任意腳手架的接入。

      在算法層面,MiniMax沿用了CISPO算法以保障MoE模型在大規(guī)模訓練中的穩(wěn)定性,并針對Agent長上下文帶來的信用分配難題,引入了過程獎勵機制(Process Reward)。

      此外,工程團隊優(yōu)化了異步調(diào)度策略和樹狀合并訓練樣本策略,實現(xiàn)了約40倍的訓練加速,驗證了模型能力隨算力和任務數(shù)增加呈現(xiàn)近線性提升的趨勢。


      目前,M2.5已在MiniMax Agent、API及Coding Plan中全量上線,其模型權重也將在HuggingFace開源,支持本地部署。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      父親給兩個兒子取了同一個名字:博古之子秦剛傳奇人生與時代印記

      父親給兩個兒子取了同一個名字:博古之子秦剛傳奇人生與時代印記

      老籣說體育
      2026-02-07 11:23:49
      43歲男保姆哭訴:大媽每月給我10000工資,卻讓我每天做這樣的事

      43歲男保姆哭訴:大媽每月給我10000工資,卻讓我每天做這樣的事

      孢木情感
      2026-01-29 20:23:21
      特朗普新聯(lián)合國首會僅一人出席,中方六字回應

      特朗普新聯(lián)合國首會僅一人出席,中方六字回應

      歲暮的歸南山
      2026-02-12 22:20:50
      納稅起征點調(diào)整!2026年1月1日起執(zhí)行

      納稅起征點調(diào)整!2026年1月1日起執(zhí)行

      祥順財稅俱樂部
      2026-02-12 09:13:55
      傅作義本在上將名單中,毛主席卻沒同意,周恩來奉命向他解釋原因

      傅作義本在上將名單中,毛主席卻沒同意,周恩來奉命向他解釋原因

      大運河時空
      2026-02-12 11:10:03
      悲催!網(wǎng)傳福建一男子回家過年被妻子“趕出家”,原因是沒賺到錢

      悲催!網(wǎng)傳福建一男子回家過年被妻子“趕出家”,原因是沒賺到錢

      火山詩話
      2026-02-12 13:36:50
      沈飛宣傳片曝光殲35大連屏駕駛艙,殲35:壞了!剛服役就成牛夫人

      沈飛宣傳片曝光殲35大連屏駕駛艙,殲35:壞了!剛服役就成牛夫人

      阿龍聊軍事
      2026-02-12 17:25:09
      東航境外搞丟行李只愿賠3700 上海法院依國際公約判賠乘客七千元

      東航境外搞丟行李只愿賠3700 上海法院依國際公約判賠乘客七千元

      信網(wǎng)
      2026-02-12 18:32:31
      不藏了?解放軍各兵種高調(diào)登場,駐永暑礁網(wǎng)絡安全部隊首次公開!

      不藏了?解放軍各兵種高調(diào)登場,駐永暑礁網(wǎng)絡安全部隊首次公開!

      詩酒趁的年華
      2026-02-13 02:13:36
      爆紅!女子從上?;剜嵵葸^年“打了個順風車打到大貨車”,視頻播放過千萬!當事人回應

      爆紅!女子從上?;剜嵵葸^年“打了個順風車打到大貨車”,視頻播放過千萬!當事人回應

      揚子晚報
      2026-02-12 22:20:39
      太罕見了:臺軍上將排成一排,大陸送上一句話,鄭麗文發(fā)現(xiàn)不對勁

      太罕見了:臺軍上將排成一排,大陸送上一句話,鄭麗文發(fā)現(xiàn)不對勁

      東極妙嚴
      2026-02-12 11:08:44
      特朗普最近三件事,全世界大吃一驚

      特朗普最近三件事,全世界大吃一驚

      牛彈琴
      2026-02-13 08:23:25
      善惡有報!這次被央媒點名的張本智和,終為自己的“荒唐”買了單

      善惡有報!這次被央媒點名的張本智和,終為自己的“荒唐”買了單

      往史過眼云煙
      2026-02-11 10:34:31
      華國鋒孫女華真,目前擔任蘇富比亞洲區(qū)副主席,此前系李云迪妻子

      華國鋒孫女華真,目前擔任蘇富比亞洲區(qū)副主席,此前系李云迪妻子

      老杉說歷史
      2026-02-03 00:39:20
      又是三雙!約基奇26+15+11輕取灰熊,掘金成灰熊頭號苦主

      又是三雙!約基奇26+15+11輕取灰熊,掘金成灰熊頭號苦主

      大眼瞄世界
      2026-02-12 19:56:53
      一個殘酷的社交邏輯:底層無貴人,弱者無圈子

      一個殘酷的社交邏輯:底層無貴人,弱者無圈子

      洞見
      2026-01-10 21:41:53
      喝酒上臉的人,酒量好還是差?

      喝酒上臉的人,酒量好還是差?

      混知
      2026-02-12 14:28:54
      趕在春節(jié)前,中國加速增兵!高市急著發(fā)話,1億多日本人面臨選擇

      趕在春節(jié)前,中國加速增兵!高市急著發(fā)話,1億多日本人面臨選擇

      賈文彬的史書
      2026-02-13 11:25:28
      不滿黎智英被判20年,為了報復中國,英國決定讓2.6萬人潤英!

      不滿黎智英被判20年,為了報復中國,英國決定讓2.6萬人潤英!

      壹知眠羊
      2026-02-12 19:48:34
      庫明加家屬拿了太多食物?庫里也覺得太丟人,主動道歉!

      庫明加家屬拿了太多食物?庫里也覺得太丟人,主動道歉!

      愛體育
      2026-02-12 22:50:59
      2026-02-13 12:00:49
      華爾街見聞官方 incentive-icons
      華爾街見聞官方
      中國領先的金融商業(yè)信息提供商
      141725文章數(shù) 2652527關注度
      往期回顧 全部

      科技要聞

      DeepSeek更新后被吐槽變冷變傻?

      頭條要聞

      中戲院長落馬不足兩個月 兩任表演系主任主動投案

      頭條要聞

      中戲院長落馬不足兩個月 兩任表演系主任主動投案

      體育要聞

      這張照片背后,是米蘭冬奧最催淚的故事

      娛樂要聞

      米蘭冬奧摘銀 谷愛凌再遭美國網(wǎng)友網(wǎng)暴

      財經(jīng)要聞

      華萊士母公司退市 瘋狂擴張下的食安隱憂

      汽車要聞

      最大續(xù)航703km!全新奔馳純電GLC 350 L即將國產(chǎn)

      態(tài)度原創(chuàng)

      時尚
      藝術
      本地
      家居
      軍事航空

      50+女人怎么穿更好看?過來人告訴你答案,越老越美贏麻了

      藝術要聞

      書法大師的神作現(xiàn)身,引發(fā)網(wǎng)友熱議!

      本地新聞

      下一站是嘉禾望崗,請各位乘客做好哭泣準備

      家居要聞

      中古雅韻 樂韻伴日常

      軍事要聞

      美國新交付F35隱身戰(zhàn)機沒雷達

      無障礙瀏覽 進入關懷版