![]()
Vide Coding概念的提出者Andrej Karpathy大神前段時間說今年可能不是AI Agent的元年,而只是Agent10年的開端。
英偉達CEO黃仁勛則認為Agentic AI是萬億美元的機遇。
是的,Agent幾乎是2025年AI領域的代名詞。而且,常常和邀請碼、全球首個xx等概念聯系在一起。畢竟,所有人都能看出這個賽道有多大,機會有多么的多。
顯而易見的大賽道所面臨的有趣情況是,這早晚會在大廠,尤其是頭部模型公司的射程范圍內。果不其然,一陣喧囂之后,國內AI六小龍之一的MiniMax出手了,搞出了MiniMax Agent。
我對大模型公司親自下場做Agent有很強的期待,畢竟才是最懂自己模型特點,甚至能根據Agent需求定制大模型能力來服務特點場景的,所以他們做Agent有天然的優勢:比如ChatGPT和Gemini擁有世界上最好的案頭研究、或者說信息整理方面的垂類Agent——Deep Research;而Anthropic新出的Claude Code則可以認為是AI Coding方向的Agent,最近已經把Cursor干得死去活來了。
所以,上個月底,MiniMax Agent一推出,我就覺得應該值得試試,很快丟了一堆案例做測試。
一波測試下來,我自己的體感是MiniMax Agent有四個比較突出的特點:
特點1:深度研究和上下文管理能力極強,MiniMax Agent可以輕松完成一個復雜任務所需要收集的全部信息,并且中間完全不出錯,沒有出現token溢出導致任務無法繼續的情況;
特點2:多模態輸出能力出色,尤其是語音生成的表現,我聽到后瞬間懵了;
特點3:編程能力超出預期,尤其是對接了Supabase,能輕松搞定后端開發,包括注冊登錄和API的調用;
特點4:能執行定時任務,實現自動化的工作流,這部分能解鎖很多有趣的場景,我在文章最后會提到。
特點1:深度研究和上下文管理能力
案例一是和我的愛好有關,老粉們可能知道我愛看網球,去年我就在巴黎奧運現場見證了鄭欽文的奪冠,最近也是到了倫敦看溫網,所以我為難MiniMax Agent,提了一個很煩人的網球相關任務要求:
給我生成一個網球愛好者的網站:
1、介紹網球四大滿貫和ATP/WTA全年賽程的信息;
2、提供男子和女子單打前100排名的信息;
3、并且為讓我可以跟蹤了解其中中國選手接下來的賽程情況。這個任務的難點是涉及到的信息實在是太多了,包括網球全年的上百項賽事,200名ATP/WTA選手的信息,以及再從中撈出中國選手的賽程。
我之前也拿別的Agent測過,基本上任務跑到一半就因為上下文長度溢出而無法繼續的。
而MiniMax在這個任務過程中執行了不下上百次的搜索,居然給我一次性搞定了。
案例1鏈接:https://agent.minimax.io/share/288416437637201
在案例二中,因為最近準備去看新上映的《侏羅紀世界:重生》,我讓MiniMax Agent幫我完成以下任務:
給最近上映的電影《侏羅紀世界:重生 Jurassic World: Rebirth (2025)》開發一個官方宣傳網站,提供包括但不限于以下信息:
1、《侏羅紀世界》系列電影的歷史,包括主創信息、豆瓣評論、票房等
2、新版《侏羅紀世界:重生 Jurassic World: Rebirth (2025)》在拍攝過程中的趣事,電影的主要賣點等
3、網友對這部電影的評價情況
4、實時票房信息
5、其他任何你覺得有助于吸引觀眾去收看這部電影的內容這個任務也是涉及到大量信息,尤其是除了文字之外,還有大量圖片、視頻等多模態信息的收集,MiniMax Agent給我整出的網站首頁英雄區背景就是個電影相關的視頻。
我本來還以為“觀看預告片”那個按鈕是假的,就像很多AI Coding一次性做出的界面一樣,只是給你做個實例,但沒想他還真把官方預告片給我找到并且切入到網頁中來了,
案例2鏈接:https://agent.minimax.io/share/288417684095061
特點2:出色的多模態輸出能力
在MiniMax Agent之前,我平時主要會用的其實是MiniMax Audio(海外版)的語音復刻/生成工具和AI視頻生成工具海螺。他們這在這兩個賽道也基本是SOTA級別的表現。尤其是我做視頻的時候,經常遇到需要補錄一些語音的時候,會直接把當期視頻的語音丟給MiniMax,讓他克隆后生成我需要補錄的語音,實在是給我省了太多事了。甚至可能比我自己補錄的效果還好,因為新錄制會有錄制空間環境的差異,容易導致音調和聲音的空間感挺不一樣的,但是MiniMax Audio的復刻好像考慮到了環境音的問題,效果尤其好。
扯遠了...
這部分想說的是,MiniMax確實有很的多模態模型,并且他們把這部分多模態的能力集成在MiniMax Agent中了。所以我給MiniMax Agent整了這么個任務:
我最近在倫敦,想去逛大英博物館,幫我生成一個給我做導覽的網站;
我希望上面有大英博物館主要的展品信息,點擊后可以查看或者收聽相應的中文講解說實話, 初看這個界面的時候,我覺得是有些平平無奇的,畢竟現在AI Coding搞定這么一個信息容量和結構復雜度不高的小網頁還是很容易的,首頁一眼能看出的主要優點是每個展品的圖片都是準確的,沒有隨便找或者瞎生成一些無關的圖片。
但是當我點進詳情頁去聽講解的時候,我有點被嚇到了...
這播音腔和背景噪音感,如果不是看到講解內容和AI生成的介紹文案一模一樣,我甚至都懷疑這是不是直接入侵了博物館的講解機給我下載的了。
我錄了個包含聲音的視頻,答應我,一定要把視頻和聲音都打開看看,好么
案例3鏈接:https://agent.minimax.io/share/288441068265562
特點3:能輕松搞定后端開發
最后,我們再上點強度,讓MiniMax Agent給我們開發個帶「后端」的網站。
說到后端我印象最深刻的是,原來這事不止我這種不會寫代碼,純靠AI Coding的AI Native開發者苦惱,其實很多CS出身的大神也是很困擾的。像Andrej Karpathy之前通過Vibe Coding開發了一款叫Genmenu的拍照生成含圖片菜單的小app,他提到他做完那個產品的基礎功能只花了幾小時的時間。但是為了搞定注冊、登錄、數據庫和支付等系統,他也花了一兩周的時間才搞定。
其實現在AI寫后端難倒不是AI不擅長寫后端代碼,而是后端涉及到的很多流程都非常的不標準化,需要人類閱讀大量的文檔資料才能搞定。
而MiniMax Agent顯然感受到了獨立開發者在這部分的痛,他們在產品上集成了Supabase,以及諸多MCP,也讓后端API的調用都變得可視化和簡單了很多,基本做到了你只需要授權和輸API,其他大部分工作都是通過Agent搞定了,這部分的能力在目前Agent生態中還真算是一股清流。
我給的任務是這樣的:
基于《掌控習慣》這本書的理念,幫我設計一個幫助用戶養成寫作、記錄習慣的網站;
需要包含完整的注冊、登錄,以及數據存儲系統。在任務的第一步,MiniMax就讓我登錄授權Supabase的賬戶和項目信息,然后再繼續完成后續的任務:
后面,他則表現得很像一個成熟的Agent了,自己規劃技術棧,逐步完成前端開發、后端開發,甚至開發之后自己還做了個測試,不需要我介入分毫。
最終登錄后的效果如下,我測試了一圈,不管是添加任務,還是在過程中新建、記錄,居然全無bug(AI Coding過程沒bug說實話都整得我有點不習慣了)
你也可以來試試我這個幫你培養寫作習慣的小產品https://tiropfoo4q.space.minimax.io/
特點4: 能執行定時任務
MiniMax Agent讓我挺意外的一點是,他們還提供了執行定時任務的能力。這個概念有點像ChatGPT task,你可以讓AI定時提醒你某件事,或者定時幫你收集整理一些信息。
但是MiniMax Agent融入這個功能的方式不太一樣,他是能讓Agent生成的網頁都具備定時更新的能力,而且因為他是通過代碼實現的,可以更靈活地調整更新頻率,整合你不同的需求。這能解鎖太多有趣的場景了。比如:
你是AI從業者的話,可以去建一個每天給你自動匯總更新AI資訊的網站;
你是投資者的話,可以讓Agent定時給你追蹤你所投資的企業或行業的信息,不錯過任何熱點機會;
你是體育迷的話,可以獲得一個你專屬的喜歡球隊或者體育項目的資訊網站;
以及,我永遠記得我在職場時有段時間要定期開早會,去解讀前一天的行業資訊和產品運營數據,AI這個能力早兩年來多好。
我很喜歡這個MiniMax網站上的官方案例,他們搞了個可以每6小時更新OpenAI消息的網站,作為AI博主,終于可以試試不用去刷各種不同的平臺找資訊了:https://cth57sk0va.space.minimax.io/
2025年的夏天或許仍不是AI Agent的元年,但它注定是節點之一。更強大的模型、更具協同能力的MCP生態、更細膩的多模態輸出,所有這些都預示著:這個賽道剛剛拉開帷幕,想象力才剛開始被點燃。
你也可以試試。不是說為了體驗技術多厲害,而是把你腦子里那個「一直想做但不知道該怎么做」的想法扔進去——讓AI接住它,讓Agent為你建構出雛形。
在這個人人都是Product Owner的時代,一個點子,一次動手,也許就是你和這個新世界的第一次真正握手。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.