<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      MiniMax M2.7國服第一!龍蝦自我進(jìn)化,海外開發(fā)者瘋狂刷屏

      0
      分享至


      新智元報道

      編輯:Aeneas 艾倫

      【新智元導(dǎo)讀】MiniMax M2.7刷屏海外開發(fā)者社區(qū),熱度直沖榜單前列!多智能體協(xié)作+自進(jìn)化能力引爆關(guān)注,它為何讓全球開發(fā)者集體沸騰?實(shí)測后我們發(fā)現(xiàn),這位AI新頂流的確實(shí)至名歸。

      最近的一波震撼,是MiniMax M2.7帶來的。

      一經(jīng)發(fā)布,它就在全球開發(fā)者社區(qū)引發(fā)巨大反響。




      << 向右滑動查看下一張圖片 >>

      構(gòu)建一個智能體,只要需要Opus 1/10的價格,開發(fā)者直呼太香了。


      有人說,開源模型和閉源的差距,每個月都在縮小,前沿實(shí)驗室應(yīng)該警覺了。


      就在昨天,它在PinchBench榜單上拿下全球第四、國產(chǎn)第一!


      這股席卷全球開發(fā)者社區(qū)的熱度,和此前 M2.5 發(fā)布時如出一轍。


      在OpenRouter上,全球大模型的智元(Token)年化吞吐量已經(jīng)突破了一千萬億,連續(xù)霸榜四周的,就是MiniMax M2.5

      就在這周的GTC大會上,老黃高度評價了全球爆火的開源項目OpenClaw,增速超過了Linux過去幾十年的速度。

      在這一趨勢下,英偉達(dá)也迅速入局,并聯(lián)合 OpenClaw 核心作者推出了 NemoClaw。

      老黃的背書,也讓OpenClaw生態(tài)瞬間成為焦點(diǎn),原因在于,MiniMax正是這個生態(tài)中的核心玩家,它是為OpenClaw運(yùn)行提供底層大模型算力支持的廠商之一。

      就在GTC大會期間,MiniMax M2.7順勢發(fā)布了,它的復(fù)雜任務(wù)執(zhí)行和智能體協(xié)作能力,簡直與大會熱點(diǎn)完美契合。

      驚喜之處不止這些,它給人的第一感覺,簡直像一個會自我進(jìn)化的團(tuán)隊成員,能在工程和科研里自己迭代自己!

      M2.7到底強(qiáng)在哪?值不值得你上手?

      一大波新鮮熱乎的測評,這就出爐了!

      最強(qiáng)Cowork Agent模型,來了

      實(shí)測后我們發(fā)現(xiàn),這次M2.7的版本更新,讓人大為驚喜。

      首先是Agent Team&Coding,模型不再只是單打獨(dú)斗,而是具備原生多智能體協(xié)作能力,不用復(fù)雜框架也能自己分工配合。

      寫代碼這塊,更是肉眼可見地進(jìn)化:不僅能看日志查bug、做代碼重構(gòu),還更懂安全,甚至覆蓋MLE、安卓開發(fā)等真實(shí)場景。

      數(shù)字化辦公上,Excel、Word、PPT的體驗都非常絲滑。

      一句話總結(jié)就是,M2.7是一個又能干活,又能協(xié)作,還挺會玩的大模型。

      多智能體協(xié)同,最佳Cowork Agent模型

      MiniMax M2.7的一大特性就是原生的Agent Teams(多智能體協(xié)作)能力。

      在這個場景下,模型需要穩(wěn)定錨定角色身份、主動挑戰(zhàn)隊友的邏輯與倫理盲區(qū)、在復(fù)雜狀態(tài)機(jī)中自主決策,這些全都內(nèi)化為了模型的原生能力。


      可以說,它是當(dāng)前最佳的Cowork agent模型,尤其擅長在多Skills交織的復(fù)雜環(huán)境中執(zhí)行長鏈路任務(wù),非常適配多Skills復(fù)雜環(huán)境的執(zhí)行。

      為了測試這一點(diǎn),我們讓M2.7構(gòu)建了一個多Agent狼人殺模擬系統(tǒng),所有角色均由獨(dú)立Agent扮演,并且能像真人一樣推理、發(fā)言和投票,同時還要做出一個模擬網(wǎng)站,展示游戲過程。

      這個高含金量測試,是一個極其復(fù)雜的工程問題,測試了模型的長鏈路任務(wù)規(guī)劃能力、多Agent建模能力、角色一致性、推理與博弈能力等等,覆蓋了指令遵循、復(fù)雜規(guī)劃、多Agent協(xié)作、長上下文記憶、編程實(shí)現(xiàn)等綜合能力。

      它不僅要求模型想明白,還要能做出來,這非常接近我們對下一代Cowork Agent的形態(tài)設(shè)想。

      很快,M2.7就完成了一個狼人殺版多Agent協(xié)作系統(tǒng),包括主持人、狼人、預(yù)言家、女巫、獵人、守衛(wèi)、村民等多個Agent,而且每個Agent都有獨(dú)立的記憶、推理和決策能力。


      不過相對而言,這個網(wǎng)頁應(yīng)用的設(shè)計還是比較粗糙。


      但這正是我們想進(jìn)一步驗證的:在復(fù)雜環(huán)境中,M2.7是否能靈活調(diào)用并整合外部技能?

      于是,我們向它提供了一些開源版的UI Skills,測試它對「外部工具+既有系統(tǒng)」的整合能力。



      在學(xué)習(xí)GitHub上的Skills之后,M2.7又新做了一個版本,果然,這次的前端設(shè)計和視覺效果大大提高,而底層的多Agent協(xié)作邏輯依然穩(wěn)定。



      好消息是,上述案例中表現(xiàn)出的「實(shí)踐-總結(jié)Skills-激勵分享」的能力,也正是團(tuán)隊在MaxClaw產(chǎn)品中打通和驗證的完整鏈路。

      隨著MiniMax龍蝦MaxClaw一并推出的,還有一批「專家」,據(jù)說專家社區(qū)里的超過一萬個「專家」都會以Skills形式開放出來。


      此前,MiniMax官方已開源6個最重要最實(shí)用的Skills,加上此前已經(jīng)上線過上萬個「專家」,MiniMax后續(xù)應(yīng)該會把這個鏈路打通,從而釋放巨大的潛力!



      「專家」里面最受歡迎的,是這個多Agent投研團(tuán)隊,我們用它來測試一下MiniMax M2.7的多智能體協(xié)作能力。


      我們向它提問了英偉達(dá)近期的市場情緒和新聞面有哪些值得關(guān)注的點(diǎn)。


      任務(wù)開始后,多個Agent分飾不同角色,從各自的視角處理自己的職責(zé)范圍內(nèi)的信息。


      各自完成思考后,先輸出各自的意見,給出不同視角的結(jié)論。


      最后,「團(tuán)隊領(lǐng)導(dǎo)者」負(fù)責(zé)整合所有人的意見后,輸出一份包含集體智慧的完整版報告,比單一 Agent 輸出的觀點(diǎn)要更全面。


      (本段文字不構(gòu)成任何投資建議)

      強(qiáng)工程與Coding能力,令人驚嘆

      在真實(shí)的工程場景中,M2.7的表現(xiàn)堪稱優(yōu)秀!

      過去,M2系列模型一直都以代碼生成能力見長,但其實(shí),代碼能力只是它的冰山一角。

      在最新版本中,M2.7已具備遠(yuǎn)超代碼編寫的綜合推理能力,化身可自主排查生產(chǎn)故障的智能體。它不僅僅是會寫代碼,而是真正理解并且能獨(dú)立解決生產(chǎn)系統(tǒng)問題。

      接下來給道測試題,測測M2.7看日志查bug的能力,也大大增強(qiáng)。

      比如某電商系統(tǒng)上線一個創(chuàng)建訂單接口,但線上出現(xiàn)大量下單失敗,而我們給模型提供的信息,只有部分關(guān)鍵代碼,和一段線上日志,要求它分析出下單失敗的根本原因,以及還有哪些潛在問題。

      根據(jù)日志和代碼,M2.7迅速分析出,失敗的根本原因是PriceService.get_price()對不存在的 SKU(如 SKU-1003)返回None,而create_order函數(shù)沒有對價格進(jìn)行空值檢查就直接使用。


      另外,我們還讓M2.7設(shè)計了一個《龍蝦逃脫計劃》的互動網(wǎng)頁。

      你是一只即將被端上餐桌的龍蝦,需要通過網(wǎng)頁上的一系列操作成功「逃脫」。

      用戶通過網(wǎng)頁與龍蝦互動,幫助它做決策、完成任務(wù),最終逃出生天。

      游戲至少有3個結(jié)局:比如成功逃回大海(Happy Ending);被做成蒜蓉龍蝦(Bad Ending);成為網(wǎng)紅龍蝦(搞笑結(jié)局)。

      很快,M2.7就成功部署了這個應(yīng)用,體現(xiàn)了超強(qiáng)的代碼能力。



      復(fù)雜Office自動化能力

      在M2.7加持下,其在金融場景下的Excel處理能力也是大大增強(qiáng)。

      比如,下面是某上市公司近三年的財務(wù)數(shù)據(jù)(單位:百萬人民幣),我們要求M2.7在Excel中完成財務(wù)分析、預(yù)測及估值。


      收到任務(wù)后,它立刻創(chuàng)建了一個專業(yè)的財務(wù)分析Excel報告,包含盈利能力指標(biāo)、收益能力指標(biāo)、財務(wù)結(jié)構(gòu)指標(biāo)、現(xiàn)金流指標(biāo)、估值分析結(jié)果,以及2025-2027財務(wù)預(yù)測。

      對于金融從業(yè)者來說,這個功能也太實(shí)用了!


      M2.7,開啟AI自我進(jìn)化!

      自我進(jìn)化,已經(jīng)成為全球大模型越來越明顯的趨勢。

      在大模型能力不斷逼近「工程化落地」的當(dāng)下,模型究竟能否參與優(yōu)化自身?

      硅谷大廠們都已經(jīng)在這條路上取得了成果。

      Anthropic內(nèi)部已經(jīng)發(fā)現(xiàn):模型有了遞歸自我提升的跡象,這個時代將提前到來;OpenAI強(qiáng)調(diào),AI研究的自動化、自我改進(jìn),將是技術(shù)起飛的開始;谷歌DeepMind,則通過AlphaTensor、AlphaCode、Gemini 3 Deep Think、AlphaEvolve等等,構(gòu)建了遞歸式的自我進(jìn)化。

      而MiniMax團(tuán)隊在M2.7上進(jìn)行的探索,給業(yè)界提供了一種新的參考范例。

      這一次,他們沒有單純提升模型能力,而是嘗試構(gòu)建一個「模型驅(qū)動模型進(jìn)化」的體系,其中的核心,就是一個研究型Agent Harness。

      團(tuán)隊讓M2系列模型以解決方案架構(gòu)師身份,僅用1人4天、零人工編碼,就自主搭建了包含CI、測試、代碼審查的開發(fā)Agent harness。


      這個系統(tǒng)整合了數(shù)據(jù)流水線、訓(xùn)練環(huán)境、評測基礎(chǔ)設(shè)施、跨團(tuán)隊協(xié)作以及持久化記憶,使模型能夠直接參與到研發(fā)流程中,而不僅僅是執(zhí)行指令。

      在實(shí)踐中,人類研究員只需要提出方向,比如一個RL實(shí)驗的方法,而模型則需要承擔(dān)大部分執(zhí)行工作,包括從文獻(xiàn)調(diào)研、實(shí)驗方案跟蹤,到數(shù)據(jù)流水線搭建與實(shí)驗啟動。

      而且在運(yùn)行過程中,Agent還會自動監(jiān)控實(shí)驗狀態(tài),分析日志,排查問題,進(jìn)行指標(biāo)分析,甚至直接修改代碼并提交合并請求,同時完成冒煙測試等流程。

      原本,這些工作都要人類團(tuán)隊協(xié)作完成,結(jié)果,M2.7竟然承擔(dān)了其中30%到50%的工作流。

      甚至,研究者還讓M2.7,直接參與到了Agent Harness的迭代中。

      他們給出命令,讓M2.7去優(yōu)化某個內(nèi)部scaffold上模型的軟件工程開發(fā)表現(xiàn)。

      它全程自主運(yùn)行,對于「分析失敗軌跡 → 規(guī)劃改動 → 修改 scaffold 代碼 → 運(yùn)行評測 → 對比結(jié)果 → 決定保留或回退」這個迭代循環(huán),執(zhí)行了超過100輪。

      這個過程中,M2.7竟然真的發(fā)現(xiàn)了針對模型的有效優(yōu)化,最終在評測集上效果提升了30%!

      M2.7,持續(xù)驗證自優(yōu)化機(jī)制

      在科研能力層面,這種「自優(yōu)化」機(jī)制也得到了驗證。

      團(tuán)隊基于一個包含短時記憶、自反饋與自優(yōu)化模塊的簡易腳手架,讓M2.7在MLE Bench Lite的22個機(jī)器學(xué)習(xí)任務(wù)中進(jìn)行持續(xù)迭代。


      每一輪,模型都會生成記憶文件,并對當(dāng)前結(jié)果進(jìn)行自反饋,再基于歷史信息進(jìn)行下一輪優(yōu)化。

      結(jié)果,在三次24小時的獨(dú)立實(shí)驗中,M2.7的表現(xiàn)隨時間持續(xù)提升。最佳成績?yōu)?金、5銀、1銅,三次平均得牌率達(dá)到66.6%,與Gemini-3.1持平,僅次于 Opus-4.6(75.7%)和 GPT-5.4(71.2%)。


      這就證明,M2.7成功驗證了一種全新的范式——在閉環(huán)系統(tǒng)中,通過記憶與反饋機(jī)制,持續(xù)優(yōu)化自身表現(xiàn)。

      它成功證明,自己有能力真正去迭代某個機(jī)器學(xué)習(xí)模型的效果!

      彩蛋:OpenRoom里的人形蝦來了

      有趣的是,隨著M2.7在人設(shè)保持與對話能力上的大幅提升,MiniMax還推出了一個很有意思的開源項目——OpenRoom。

      它不再是冷冰冰的對話框,而是一個萬物皆可互動的Web空間:你說一句話,場景就會實(shí)時變化,角色也會做出反應(yīng),甚至主動和環(huán)境產(chǎn)生互動。

      這間小屋中,你可以體驗AI的超絕沉浸感,角色們有自己的情緒,仿佛真正活在這個房間。

      看來,AI自我進(jìn)化的終極交互形式,就是多模態(tài)人形蝦!

      參考資料:

      MiniMax M2.7: 開啟模型的自我進(jìn)化

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      拉里賈尼遭暗殺對中國的重要警示:千萬不要低估敵人的殘忍,反滲透、抓間諜刻不容緩!

      拉里賈尼遭暗殺對中國的重要警示:千萬不要低估敵人的殘忍,反滲透、抓間諜刻不容緩!

      李光滿說
      2026-03-18 19:47:48
      現(xiàn)實(shí)版“汪汪隊大逃亡” 7只同村小狗被偷后結(jié)伴逃亡 不離不棄 跨越17公里安全回家

      現(xiàn)實(shí)版“汪汪隊大逃亡” 7只同村小狗被偷后結(jié)伴逃亡 不離不棄 跨越17公里安全回家

      閃電新聞
      2026-03-20 10:13:26
      男子蹭飯260頓后續(xù):拒拿2000賠償,正臉曝光,被同學(xué)認(rèn)出已社死

      男子蹭飯260頓后續(xù):拒拿2000賠償,正臉曝光,被同學(xué)認(rèn)出已社死

      離離言幾許
      2026-03-20 17:52:58
      路虎別停奔馳后續(xù)!呂先生全家信息被泄露,遭上門威脅警方再通報

      路虎別停奔馳后續(xù)!呂先生全家信息被泄露,遭上門威脅警方再通報

      奇思妙想草葉君
      2026-03-20 14:01:10
      中共中央批準(zhǔn):葛巧紅同志任河北省委常委

      中共中央批準(zhǔn):葛巧紅同志任河北省委常委

      新京報政事兒
      2026-03-20 19:17:01
      深度長文:為什么光速不能被超越?到底是什么限制了光速?

      深度長文:為什么光速不能被超越?到底是什么限制了光速?

      宇宙時空
      2026-03-19 18:07:22
      殺紅眼了!局勢急轉(zhuǎn)直下:美以伊三方都被逼到了墻角,美國的帝國體系面臨動搖!

      殺紅眼了!局勢急轉(zhuǎn)直下:美以伊三方都被逼到了墻角,美國的帝國體系面臨動搖!

      軍武速遞
      2026-03-19 19:04:45
      29歲男子僅帶一瓶水徒步南太行,失聯(lián)43天,遺體發(fā)現(xiàn)地點(diǎn)出人意料

      29歲男子僅帶一瓶水徒步南太行,失聯(lián)43天,遺體發(fā)現(xiàn)地點(diǎn)出人意料

      貓咪紀(jì)實(shí)說
      2026-03-18 11:19:27
      太佩服蘭姐了!姜還是老的辣啊,一句話讓馬筱梅放棄給兒子改姓

      太佩服蘭姐了!姜還是老的辣啊,一句話讓馬筱梅放棄給兒子改姓

      魔都姐姐雜談
      2026-03-20 16:58:58
      央媽“吹風(fēng)”救市!

      央媽“吹風(fēng)”救市!

      新浪財經(jīng)
      2026-03-20 00:05:44
      小米集團(tuán)股價盤中跌超6%

      小米集團(tuán)股價盤中跌超6%

      每日經(jīng)濟(jì)新聞
      2026-03-20 10:13:10
      不是東詹里!湖人8連勝最大贏家是他!2年前被逼帶傷出戰(zhàn)跌入谷底

      不是東詹里!湖人8連勝最大贏家是他!2年前被逼帶傷出戰(zhàn)跌入谷底

      阿浪的籃球故事
      2026-03-20 16:09:16
      許世友之子,曾任江蘇軍區(qū)司令員,49歲升少將,如今是何職務(wù)?

      許世友之子,曾任江蘇軍區(qū)司令員,49歲升少將,如今是何職務(wù)?

      混沌錄
      2026-03-19 21:59:06
      1996年美軍讓中國防長操作M1A2坦克,本想看笑話,結(jié)果一片死寂

      1996年美軍讓中國防長操作M1A2坦克,本想看笑話,結(jié)果一片死寂

      鑒史錄
      2026-03-20 07:55:31
      等我們老了,最扎心的從不是病與死,而是這無聲的“潰敗”

      等我們老了,最扎心的從不是病與死,而是這無聲的“潰敗”

      青蘋果sht
      2026-03-18 05:35:16
      看到這個文件,在職的你怕不怕?

      看到這個文件,在職的你怕不怕?

      中國民航人
      2026-03-19 20:52:46
      “遵守”特朗普要求,內(nèi)塔尼亞胡:以方將“暫停”空襲伊朗能源設(shè)施

      “遵守”特朗普要求,內(nèi)塔尼亞胡:以方將“暫?!笨找u伊朗能源設(shè)施

      界面新聞
      2026-03-20 07:19:58
      伊朗發(fā)言人剛身亡,第67波導(dǎo)彈直撲美以!三戰(zhàn)序幕在波斯灣拉開?

      伊朗發(fā)言人剛身亡,第67波導(dǎo)彈直撲美以!三戰(zhàn)序幕在波斯灣拉開?

      薛小榮
      2026-03-20 19:19:33
      受國際足聯(lián)施壓,亞足聯(lián)取消2031及2035年亞洲杯申辦

      受國際足聯(lián)施壓,亞足聯(lián)取消2031及2035年亞洲杯申辦

      星耀國際足壇
      2026-03-20 15:11:03
      黃仁勛公開演講時暴怒:我討厭的事不多 到底是誰的手機(jī)響了!

      黃仁勛公開演講時暴怒:我討厭的事不多 到底是誰的手機(jī)響了!

      快科技
      2026-03-19 15:28:12
      2026-03-20 20:43:00
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
      14765文章數(shù) 66701關(guān)注度
      往期回顧 全部

      數(shù)碼要聞

      249元!黑鯊制冷背夾6 Pro磁吸版開啟預(yù)約,性能超牛!

      頭條要聞

      美防長:盟友不知感恩 全世界都應(yīng)對特朗普說聲"謝謝"

      頭條要聞

      美防長:盟友不知感恩 全世界都應(yīng)對特朗普說聲"謝謝"

      體育要聞

      6年前的一場悲劇,造就了“法國瓦爾迪”

      娛樂要聞

      總臺首屆電影盛典,“沈馬”CP再合體

      財經(jīng)要聞

      金融法草案向社會公開征求意見

      科技要聞

      新SU7只漲4千!雷軍:真怕交車慢挨罵

      汽車要聞

      何小鵬坦白局:每月3億的“慌”與通向L4的堅定

      態(tài)度原創(chuàng)

      時尚
      教育
      家居
      游戲
      數(shù)碼

      今日熱點(diǎn):張譯張小斐擔(dān)任天壇獎評委;《白日提燈》發(fā)布定檔預(yù)告……

      教育要聞

      保護(hù)孩子的最好方法,就是讓她懂得只認(rèn)行為不認(rèn)身份!

      家居要聞

      時空交織 空間綺夢

      《生化9》“玉足”3D美圖來了!連里昂的腳都不放過

      數(shù)碼要聞

      240Hz登頂 成電競顯示器第一大刷新率

      無障礙瀏覽 進(jìn)入關(guān)懷版