
今年3月,AI智能體界突然殺出一匹“黑馬”——Manus。它的火爆程度,連二手平臺(tái)上的內(nèi)測(cè)邀請(qǐng)碼都被炒到上萬(wàn)元。這款由初創(chuàng)公司“蝴蝶效應(yīng)”打造的產(chǎn)品,被不少人稱為“全球第一款通用Agent”,能自己搞定篩簡(jiǎn)歷、做房產(chǎn)研究、分析股票等一系列任務(wù)。
然而,熱度還沒(méi)消退,Manus就被曝“撤出”中國(guó)市場(chǎng),一夜之間清空了國(guó)內(nèi)社交媒體賬號(hào),瞬間點(diǎn)燃了行業(yè)的爭(zhēng)議情緒。
在輿論漩渦中,聯(lián)合創(chuàng)始人季逸超發(fā)布了一篇技術(shù)博客——《AI智能體的上下文工程:來(lái)自構(gòu)建Manus的教訓(xùn)》。他沒(méi)有正面回應(yīng)質(zhì)疑,而是選擇做一次純技術(shù)復(fù)盤(pán),總結(jié)了 Manus發(fā)展的經(jīng)驗(yàn)教訓(xùn)。從一開(kāi)始的戰(zhàn)略選擇,到產(chǎn)品的不斷迭代,內(nèi)容非常詳實(shí),值得一看。
![]()
![]()
Manus的戰(zhàn)略聚焦
![]()
![]()
(季逸超技術(shù)博,截圖來(lái)自Manus官網(wǎng))
外界一直有人質(zhì)疑Manus“沒(méi)自研底層”,只是套殼。季逸超這次開(kāi)篇就亮明了態(tài)度:這是Manus的戰(zhàn)略選擇。
他提到了一個(gè)詞,叫PMF(Product-Market Fit,意思是產(chǎn)品與市場(chǎng)需求達(dá)到一個(gè)最佳的狀態(tài)),這是網(wǎng)景創(chuàng)始人Marc Andreessen提出的一個(gè)概念。說(shuō)初創(chuàng)企業(yè)最需要優(yōu)先驗(yàn)證的就是產(chǎn)品與市場(chǎng)的契合度,這是創(chuàng)業(yè)成功的首要前提。
很顯然Mauns聽(tīng)進(jìn)去了。
在創(chuàng)業(yè)初期,季逸超也想要自研基座,但很快發(fā)現(xiàn)這條路效率太低。哪怕不是LLM這樣規(guī)模的模型,每次微調(diào)和評(píng)估也需要好幾周,根本就顧不上市場(chǎng)需求,更別提驗(yàn)證PMF了。
另外,LLM橫空出世了。它揭示了一件事兒,很多公司押注某一套自研模型或者開(kāi)源架構(gòu),其實(shí)會(huì)帶來(lái)巨大的技術(shù)鎖定風(fēng)險(xiǎn)。一旦出現(xiàn)性能更強(qiáng)、價(jià)格更低的新模型,遷移成本會(huì)高的嚇人。
于是,季逸超團(tuán)隊(duì)認(rèn)清了自身邊界,在Manus項(xiàng)目一開(kāi)始就做出了一個(gè)關(guān)鍵決策:放棄自研模型,基于前沿模型的上下文學(xué)習(xí)能力構(gòu)建一個(gè)智能體,“讓Manus成為船”。
![]()
(季逸超技術(shù)博,截圖來(lái)自Manus官網(wǎng))
找到自己的戰(zhàn)略“單點(diǎn)”,其實(shí)是一個(gè)“失去”的故事。
創(chuàng)業(yè)的殘酷就在于,資源有限,欲望無(wú)限。所以混沌講單點(diǎn)擊穿,把戰(zhàn)略聚焦到一個(gè)點(diǎn)上,投入幾倍、幾十倍甚至上百倍的資源進(jìn)去,達(dá)到某個(gè)閾值后,別人才會(huì)看見(jiàn)你。
![]()
押注上下文工程
那么,Manus押注的上下文工程到底是什么東西?
在LLM應(yīng)用領(lǐng)域,上下文工程(Context Engineering)目前是一個(gè)相當(dāng)關(guān)鍵的概念,也可以說(shuō)它是繼“提示詞工程”(Prompt Engineering)后的又一個(gè)技術(shù)熱點(diǎn)。
LLM 的工作方式是這樣的:你給它一段文本(上下文),它會(huì)生成一段新的文本(輸出)。我們沒(méi)有辦法改變模型本身,那優(yōu)化輸出的關(guān)鍵,就在于如何構(gòu)建最有效的輸入文本,來(lái)引導(dǎo)模型生成我們期望的輸出。
OpenAI的創(chuàng)始科學(xué)家 Andrej Karpathy 有一句話很形象:“LLM 是一種新型操作系統(tǒng)。你的任務(wù)不是給它零散的命令,而是提供運(yùn)行所需的全部數(shù)據(jù)和環(huán)境。”
上下文工程,干的就是這個(gè)事兒。所謂的“上下文”,不僅是你發(fā)送給LLM的單一的提示。你可以把上下文想像成一個(gè)系統(tǒng),它能在恰當(dāng)?shù)臅r(shí)間,以恰當(dāng)?shù)母袷剑峁┙o模型在生成響應(yīng)之前看到的一切,讓LLM完成任務(wù)。讓它去推理、決策、執(zhí)行。
換成人類(lèi)工作場(chǎng)景,其實(shí)每個(gè)職業(yè)都有自己的上下文。對(duì)一個(gè)產(chǎn)品經(jīng)理來(lái)說(shuō),上下文可以是用戶調(diào)研報(bào)告、需求文檔、市場(chǎng)分析、項(xiàng)目進(jìn)度表……對(duì)記者來(lái)說(shuō),上下文可以是采訪錄音、新聞檔案、公開(kāi)數(shù)據(jù)集、消息來(lái)源的背景信息……
“上下文工程”,其實(shí)是在解決一個(gè)AI落地的終極問(wèn)題:像LLM這樣的大模型,到底怎么從“萬(wàn)能但松散”的通用助手,成為一個(gè)幫你解決麻煩問(wèn)題的專(zhuān)家。最后,加入到各行業(yè)的工作流當(dāng)中,實(shí)現(xiàn)從技術(shù)到生產(chǎn)力的躍遷。
![]()
(季逸超技術(shù)博,截圖來(lái)自Manus官網(wǎng))
![]()
技術(shù)上的核心優(yōu)化原則
在這篇技術(shù)文檔里,季逸超還分享了Manus的六個(gè)核心優(yōu)化原則:
1.圍繞KV-cache設(shè)計(jì)
? 保持提示前綴穩(wěn)定、上下文只追加、明確緩存斷點(diǎn),降低成本和延遲。
2.遮蔽而非移除工具
? 避免動(dòng)態(tài)修改工具列表導(dǎo)致緩存失效和模型混亂,通過(guò) logits 屏蔽控制模型能“看見(jiàn)”的工具。
3.文件系統(tǒng)作為上下文外部化內(nèi)存
? 讓模型把長(zhǎng)期記憶寫(xiě)入虛擬文件系統(tǒng),按需讀寫(xiě),實(shí)現(xiàn)外部記憶,規(guī)避信息丟失。
4.重寫(xiě)ToDo清單,通過(guò)復(fù)述操控模型注意力
? 動(dòng)態(tài)更新 todo.md文件,將全局目標(biāo)拉回到LLM 近期注意力范圍,防止任務(wù)跑偏。
5.保留錯(cuò)誤記錄
? 不隱藏失敗嘗試,讓模型從錯(cuò)誤中調(diào)整學(xué)習(xí),提升長(zhǎng)期表現(xiàn)。
6.打破少樣本模式陷阱
? 引入格式和措辭的變化,避免模型陷入模式化行為。
這一系列方法即是技術(shù)關(guān)鍵,其實(shí)也是Agent商業(yè)落地的生命線——穩(wěn)定性、效率、可擴(kuò)展性全在里面。
季逸超雖然在輿論層面看似“避開(kāi)了熱點(diǎn)”,只談技術(shù)。但這篇文章從頭到尾講述了一件事兒,那就是錨定“上下文”工程的Manus其實(shí)是非常務(wù)實(shí)的。
![]()
為什么“跑路”
所以,為什么它要“跑路”?或許是出于自身利益的綜合考量。
有業(yè)內(nèi)人士認(rèn)為,“跑路”直接原因是投資后的安排。另外,長(zhǎng)期來(lái)看作為中小型企業(yè),Manus無(wú)力承擔(dān)兩個(gè)市場(chǎng)的產(chǎn)品研發(fā)。
它在商業(yè)層面的增長(zhǎng)壓力也是不容忽視的。之前不少國(guó)內(nèi)用戶覺(jué)得Manus定價(jià)過(guò)高,功能上又沒(méi)有和國(guó)內(nèi)的其他Agent產(chǎn)品形成明顯的差異化優(yōu)勢(shì),付費(fèi)轉(zhuǎn)化率不佳。業(yè)內(nèi)人士指出,“國(guó)內(nèi)市場(chǎng)在C端應(yīng)用創(chuàng)新上領(lǐng)先,但在付費(fèi)習(xí)慣和成熟度上(尤其是B端企業(yè)軟件)與北美市場(chǎng)存在差異。”從商業(yè)發(fā)展的角度看,或許這次戰(zhàn)略側(cè)身,是為了把火力集中在更有商業(yè)回報(bào)的地方。
畢竟,在基礎(chǔ)模型廠商憑借底層模型發(fā)力Agent賽道的背景下,純Agent創(chuàng)業(yè)公司如何在激烈的競(jìng)爭(zhēng)中立足,已經(jīng)是不得不思考的問(wèn)題。
不論如何,Manus向行業(yè)釋放了一個(gè)信號(hào):在AI Agent 商業(yè)化的早期階段,技術(shù)上的核心壁壘,很可能不在模型本身。
這種判斷并不是孤立的。
近一年來(lái),無(wú)論是國(guó)內(nèi)的“垂直Agent”創(chuàng)業(yè)潮,還是海外新一代Agent 的出現(xiàn),都指向一個(gè)事實(shí):?jiǎn)慰看竽P偷耐ㄓ媚芰Γ瑹o(wú)法穩(wěn)定融入專(zhuān)業(yè)工作流,真正的競(jìng)爭(zhēng)力來(lái)自于如何為模型構(gòu)建一個(gè)“系統(tǒng)”——在正確的時(shí)間提供正確的信息,讓它的推理、決策和行動(dòng)有據(jù)可依。在“百模大戰(zhàn)”白熱化的階段,新生代AI公司要想站住腳,Manus的經(jīng)歷可以去琢磨和思考一下。
混沌·AI創(chuàng)新院,是面向企業(yè)創(chuàng)始人、業(yè)務(wù)負(fù)責(zé)人、創(chuàng)新項(xiàng)目操盤(pán)手的AI實(shí)戰(zhàn)共創(chuàng)平臺(tái)。
我們有六大系統(tǒng)學(xué)習(xí)+優(yōu)秀同伴社群+實(shí)戰(zhàn)輔導(dǎo),并聚焦AI工具掌握、場(chǎng)景應(yīng)用與原生產(chǎn)品打造,能助力您的公司突破增長(zhǎng)瓶頸,實(shí)現(xiàn)業(yè)務(wù)躍遷。
現(xiàn)在掃碼添加AI創(chuàng)新院班班,可以免費(fèi)領(lǐng)取“AI??商業(yè)實(shí)用工具箱”,各大智能體合集,快速解決您的問(wèn)題。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.