<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      MiniMax發布M2.5模型:1美元運行1小時,價格僅為GPT-5的1/20,性能比肩Claude Opus

      0
      分享至

      MiniMax推出了其最新迭代的M2.5系列模型,在保持行業領先性能的同時,大幅降低了推理成本,試圖解決復雜Agent應用在經濟上不可行的痛點,并宣稱其在編程、工具調用及辦公場景中已達到或刷新了行業SOTA(當前最佳)水平。

      2月13日,MiniMax公布的數據顯示,M2.5展現了顯著的價格優勢。在每秒輸出50個token的版本下,其價格僅為Claude Opus、Gemini 3 Pro以及GPT-5等主流模型的1/10至1/20。

      在每秒輸出100個token的高速運行環境下,M2.5連續工作一小時的成本僅需1美元,若降至50 token/秒,成本進一步下探至0.3美元。這意味著1萬美元的預算足以支撐4個Agent連續工作一年,極大地降低了構建和運營大規模Agent集群的門檻。

      在性能維度,M2.5在核心編程測試中表現強勁,并在多語言任務Multi-SWE-Bench上取得第一,整體水平比肩Claude Opus系列。同時,模型優化了對復雜任務的拆解能力,在SWE-Bench Verified測試中,完成任務的速度較上一代M2.1提升了37%,端到端運行時間縮短至22.8分鐘,與Claude Opus 4.6持平

      目前,MiniMax內部業務已率先驗證了該模型的能力。數據顯示,其內部30%的整體任務已由M2.5自主完成,覆蓋研發、產品、銷售等核心職能。特別是在編程場景中,M2.5生成的代碼已占據新提交代碼的80%,顯示出該模型在真實生產環境中的高滲透率和可用性。

      擊穿成本底線:無限運行Agent的經濟可行性

      M2.5的設計初衷是消除運行復雜Agent的成本約束。MiniMax通過優化推理速度和token效率實現了這一目標。模型提供100 TPS(每秒傳輸事務處理量)的推理速度,約為當前主流模型的兩倍。

      除了單純的算力成本降低,M2.5通過更高效的任務拆解和決策邏輯,減少了完成任務所需的token總量。

      在SWE-Bench Verified評測中,M2.5平均每個任務消耗3.52M token,低于M2.1的3.72M。

      速度與效率的雙重提升,使得企業在經濟上幾乎可以無限制地構建和運營Agent,將競爭焦點從成本轉移至模型能力的迭代速度上。

      編程能力進階:像架構師一樣思考與構建

      在編程領域,M2.5不僅關注代碼生成,更強調系統設計能力。模型演化出了原生的Spec(規格說明書)行為,能夠以架構師視角在編碼前主動拆解功能、結構和UI設計。

      該模型在超過10種編程語言(包括GO、C++、Rust、Python等)和數十萬個真實環境中進行了訓練。

      測試顯示,M2.5能勝任從系統設計(0-1)、開發(1-10)到功能迭代(10-90)及最終代碼審查(90-100)的全流程。

      為了驗證其在不同開發環境下的泛化性,MiniMax在Droid和OpenCode等編程腳手架上進行了測試。

      結果顯示,M2.5在Droid上的通過率為79.7,在OpenCode上為76.1,均優于上一代模型及Claude Opus 4.6。


      復雜任務處理:更高效的搜索與專業交付

      在搜索和工具調用方面,M2.5展示了更高的決策成熟度,不再單純追求“做對”,而是尋求以更精簡的路徑解決問題。

      在BrowseComp、Wide Search和RISE等多項任務中,M2.5相較于前代節省了約20%的輪次消耗,以更優的token效率逼近結果。


      針對辦公場景,MiniMax通過與金融、法律等領域資深從業者合作,將行業隱性知識融入模型訓練。

      在內部構建的Cowork Agent評測框架(GDPval-MM)中,M2.5在與主流模型的兩兩對比中取得了59.0%的平均勝率,能夠輸出符合行業標準的Word研報、PPT及復雜的Excel財務模型,而非簡單的文本生成。



      技術底座:原生Agent RL框架驅動線性提升

      M2.5性能提升的核心驅動力來自于大規模強化學習(RL)。

      MiniMax采用了名為Forge的原生Agent RL框架,通過引入中間層解耦了底層訓推引擎與Agent,支持任意腳手架的接入。

      在算法層面,MiniMax沿用了CISPO算法以保障MoE模型在大規模訓練中的穩定性,并針對Agent長上下文帶來的信用分配難題,引入了過程獎勵機制(Process Reward)。

      此外,工程團隊優化了異步調度策略和樹狀合并訓練樣本策略,實現了約40倍的訓練加速,驗證了模型能力隨算力和任務數增加呈現近線性提升的趨勢。


      目前,M2.5已在MiniMax Agent、API及Coding Plan中全量上線,其模型權重也將在HuggingFace開源,支持本地部署。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      45歲富哥“北京肖哥”去世,前一天還曬老婆,死因曝光仇人都惋惜

      45歲富哥“北京肖哥”去世,前一天還曬老婆,死因曝光仇人都惋惜

      嫹筆牂牂
      2025-12-31 07:07:52
      史詩級逆轉!崔佳溫從嚴重摔倒到演絕殺喊媽媽 奪韓國百年雪上首金

      史詩級逆轉!崔佳溫從嚴重摔倒到演絕殺喊媽媽 奪韓國百年雪上首金

      勁爆體壇
      2026-02-13 08:18:04
      國臺辦果然沒看錯,鄭麗文真面目被徹底揭露!小算盤到此為止了

      國臺辦果然沒看錯,鄭麗文真面目被徹底揭露!小算盤到此為止了

      比利
      2026-01-23 12:41:53
      8750萬片酬一分不讓,限薪令也不妥協,劇組直接解散血本無歸

      8750萬片酬一分不讓,限薪令也不妥協,劇組直接解散血本無歸

      老吳教育課堂
      2026-02-13 05:54:14
      又揪出來一個巨貪,金額高達9.7億,首富夫人郝斌跨境逃亡失敗了

      又揪出來一個巨貪,金額高達9.7億,首富夫人郝斌跨境逃亡失敗了

      墨蘭史書
      2026-01-17 08:30:09
      不出意外的話,中國未來超過一半人口,將會流入到這些地方

      不出意外的話,中國未來超過一半人口,將會流入到這些地方

      社會日日鮮
      2026-02-11 14:04:49
      沉默24小時,林劍一錘定音,中國漁民被日本抓走,石破茂踩下剎車

      沉默24小時,林劍一錘定音,中國漁民被日本抓走,石破茂踩下剎車

      影孖看世界
      2026-02-13 22:18:58
      為什么世界上沒有一個面積在300~700萬平方公里的國家?

      為什么世界上沒有一個面積在300~700萬平方公里的國家?

      孤云朗境
      2026-02-04 23:52:06
      林孝埈全程墊底,網友嘆英雄遲暮!賽后本人回應,2次提到了中國

      林孝埈全程墊底,網友嘆英雄遲暮!賽后本人回應,2次提到了中國

      十點街球體育
      2026-02-13 14:55:03
      紀實:四川18歲校花被51歲和尚藏禪房3個月,被解救時已神志不清

      紀實:四川18歲校花被51歲和尚藏禪房3個月,被解救時已神志不清

      談史論天地
      2026-02-05 12:38:12
      剛從印度回來,說點不中聽的:印度的真實面目,可能讓你很意外

      剛從印度回來,說點不中聽的:印度的真實面目,可能讓你很意外

      復轉這些年
      2026-02-12 23:40:15
      水落石出!南博事件結果出爐,3個大問題2個沒想到,真相不簡單

      水落石出!南博事件結果出爐,3個大問題2個沒想到,真相不簡單

      天天熱點見聞
      2026-02-10 12:23:51
      網友用Seedance2.0復刻1670年紐約市 馬斯克發文感慨:它發展很快

      網友用Seedance2.0復刻1670年紐約市 馬斯克發文感慨:它發展很快

      快科技
      2026-02-12 15:41:06
      底薪流浪!9 號秀索漢被馬刺裁掉,尼克斯撿漏是救贖還是冒險?

      底薪流浪!9 號秀索漢被馬刺裁掉,尼克斯撿漏是救贖還是冒險?

      魔血獄苼
      2026-02-14 00:39:27
      蔚盛斌任安徽省委常委

      蔚盛斌任安徽省委常委

      安徽發布
      2026-02-13 18:24:32
      劉濤這狀態太好了,一個快50歲的人,開始逆生長了,真是讓人羨慕

      劉濤這狀態太好了,一個快50歲的人,開始逆生長了,真是讓人羨慕

      可樂談情感
      2026-02-12 00:08:01
      紀實:女子強迫情夫老公三人同床,逼丈夫看兩人茍合,結局釀慘案

      紀實:女子強迫情夫老公三人同床,逼丈夫看兩人茍合,結局釀慘案

      談史論天地
      2026-01-23 10:04:14
      華國鋒孫女華真,目前擔任蘇富比亞洲區副主席,此前系李云迪妻子

      華國鋒孫女華真,目前擔任蘇富比亞洲區副主席,此前系李云迪妻子

      老杉說歷史
      2026-02-03 00:39:20
      廣東男籃官方:第二階段將在順德德勝體育中心設立第二主場

      廣東男籃官方:第二階段將在順德德勝體育中心設立第二主場

      狼叔評論
      2026-02-13 21:07:06
      姚晨新造型翻車,穿的像體操運動員賊顯壯,她和造型師有仇嗎?

      姚晨新造型翻車,穿的像體操運動員賊顯壯,她和造型師有仇嗎?

      東方不敗然多多
      2026-02-08 09:33:57
      2026-02-14 03:04:49
      華爾街見聞官方 incentive-icons
      華爾街見聞官方
      中國領先的金融商業信息提供商
      141765文章數 2652535關注度
      往期回顧 全部

      科技要聞

      獨家探訪蔡磊:答不完的卷子 死磕最后一程

      頭條要聞

      8千元的迷你小馬一夜爆火 馬主:1天排泄次數達十幾次

      頭條要聞

      8千元的迷你小馬一夜爆火 馬主:1天排泄次數達十幾次

      體育要聞

      這張照片背后,是米蘭冬奧最催淚的故事

      娛樂要聞

      大衣哥女兒風光出嫁,農村婚禮超樸素

      財經要聞

      華萊士母公司退市 瘋狂擴張下的食安隱憂

      汽車要聞

      探秘比亞迪巴西工廠 居然是這個畫風!

      態度原創

      親子
      教育
      家居
      時尚
      旅游

      親子要聞

      青少年抑郁率高達24.6%,我們的孩子為什么不快樂

      教育要聞

      今年的IC真的太霸道了!

      家居要聞

      中古雅韻 樂韻伴日常

      穿上這些鞋擁抱春天

      旅游要聞

      土耳其自駕行記(八)地中海邊的慢時光——卡什小鎮

      無障礙瀏覽 進入關懷版