![]()
新智元報道
編輯:LRST
【新智元導讀】北京郵電大學團隊開源的MASFactory框架,用Vibe Graphing重構多智能體系統編排。它將自然語言指令轉化為結構化工作流,三步完成角色分配、拓撲設計與語義補全,API成本降為傳統方式的十分之一,代碼量暴減,開發效率飆升。系統以圖為核心,支持混合編排與全棧可視化,已通過多項權威測試,性能全面超越同類方案。
外網爆火,比Vibe Coding便宜10倍!北郵重構多智能體編排范式
近日,YouTube等外網平臺上一段名為《Vibe Graphing: 10x More Affordable than Vibe Coding (MAS-Factory)》的技術解析視頻在開發者圈層中引發了強烈的共鳴與熱議。
![]()
視頻中給出的數據令人咋舌:在同等任務復雜度下,傳統的Vibe Coding試錯成本高達數美元,而采用一種名為「Vibe Graphing」的全新范式,API成本直接驟降至原來的十分之一,且成功率大幅躍升。
這支視頻背后的主角,正是由北京郵電大學團隊最新開源的LLM多智能體編排框架——MASFactory。
![]()
項目官網: https://masfactory.dev
代碼倉庫: https://github.com/BUPT-GAMMA/MASFactory
原版論文: https://arxiv.org/abs/2603.06007
目前,該項目已在GitHub全面開源,學術論文也已同步發布。
Vibe Coding在多智能體編排水土不服
伴隨著基礎大模型能力的溢出,業界形成了一個明確的技術共識:通過角色特化、交叉驗證和迭代協作,多智能體系統(MAS)能夠解決單一 Agent 難以覆蓋的長周期復雜任務。
然而,構建一個健壯、可擴展的 MAS,依然是一場令人筋疲力盡的工程「泥沼戰」。
現有的編排框架主要分為兩個派別:
一是硬編碼派(Imperative/Declarative),要求開發者學習特定的 DSL,手動維護極其復雜的通信邏輯與狀態同步。這種方式靈活性高,但工程成本極其高昂。
二是端是可視化拖拽派,雖然大幅降低了門檻,但在面對需要深度定制的多層次復雜拓撲結構時,滿屏蜘蛛網般的連線會讓后續的維護和擴展形同災難。
即使是當下備受矚目的Vibe Coding范式,也難以彌補上述兩種開發范式的缺陷。
由于大多數大語言模型在訓練時缺乏對各類小眾DSL(特定領域語言)的充分學習,當Vibe Coding工具面對硬編碼框架時往往顯得水土不服。
這不僅意味著開發者需要付出額外的Token成本來讓模型預習DSL語法,還投入大量精力,去約束AI遵循DSL的拓撲規范與通信邏輯,導致開發體驗大打折扣。對于可視化拖拽派,Vibe Coding工具更是難以入手。
Vibe Graphing
多智能體編排的一等公民
Vibe Graphing工具本質上是一個「自然語言意圖 -> 結構化中間表示(IR) -> 可執行工作流」的編譯器。
與Vibe Coding簡單粗暴地讓AI直接吐出底層代碼不同,Vibe Graphing將MAS的構建抽象為一個極具秩序感的三階段設計過程。在引擎內部,這被封裝為由三個Agent驅動的Loop組件:
![]()
階段一:角色分配(Role Assignment)。
系統首先剝離所有的代碼實現細節,只關注「人」。當開發者輸入諸如「幫我構造一個文獻綜述工作流」的自然語言指令時,引擎會將任務意圖映射為一組候選智能體(如檢索員、閱讀員、寫作員、評審員),并劃定嚴格的責任邊界。
階段二:拓撲設計(Topology Design)。
確定角色后,系統開始構建一張有向圖拓撲骨架。這個骨架只定義節點間的消息依賴和執行順序(如串行、并行、循環),而不涉及任何具體的 Prompt 或工具調用。
階段三:語義補全(Semantic Completion)。
最后,系統對拓撲骨架進行參數化實例化,為每個節點精準配置指令、輸入輸出約束。
因為AI每次只需要生成或修改極其簡短的JSON拓撲配置,而不是幾千行的 Python 邏輯代碼,Token消耗呈指數級下降;從而達到了比Vibe Coding節省10倍token的效果。
MASFactory
以圖為中心的四層架構
Vibe Graphing 能夠如此優雅地運行,是因為 MASFactory 擁有一個底層圖引擎,它將多智能體工作流建模為有向計算圖。整個系統被科學地劃分為四個層次:
![]()
圖骨架
在最底層,系統完全由 Node(節點)和 Edge(邊)構成。MASFactory 極其硬核地對協作信號進行了物理隔離,拆分為三種流:
控制流(Control Flow):沿著有向邊傳播,嚴格推進調度與依賴,確保執行的因果時序。
消息流(Message Flow):橫向傳遞,將節點的輸出有效載荷精準投遞給下游節點。
狀態流(State Flow):在圖與子圖的樹狀層級結構間縱向傳播,實現自治域的上下文和運行時狀態同步。
組件層與可復用層
基礎的節點被進一步抽象為豐富的組件庫。除了遵循感知-推理-行動(Perception-Reasoning-Action)范式的基礎Agent外,系統還提供了:
Graph: 用于表達子圖嵌套結構,方便進行模塊化設計。
Loop:用于表達循環結構,用語實現反思(Reflection)、多輪辯論等博弈模式。
Switch:Switch 能夠根據運行時狀態動態選擇并激活特定分支,實現了復雜的動態路由控制。
無縫嵌套機制:任何一個 Graph 都可以作為子節點無限嵌套到更高維度的圖中。通過 NodeTemplate 和 ComposedGraph 機制,開發者可以輕松實現分支級別的拓撲復用,減少代碼冗余。
協議與上下文適配層
現代MAS應用不可避免地需要整合異構的外部組件(Memory、RAG、MCP等)。
MASFactory引入了兩種適配器:
Message Adapter:將底層圖結構與具體的通信協議解耦。開發者可以在不修改拓撲的前提下,自由切換 JSON Schema、Markdown 或定制化的通信協議。
Context Adapter:面對外部復雜的記憶系統、RAG、MCP,Context Adapter 提供了一個標準化的接口。它將異構上下文切片為標準單元,使得 MASFactory 能夠像插拔 U 盤一樣無縫對接到 LlamaIndex、Mem0 等前沿框架中。
混合編排與可視化交互層
在操作入口上,MASFactory 同時兼容代碼開發(聲明式、命令式)、可視化拖拽以及 Vibe Graphing。
值得注意的是,這三種方式不僅不沖突,反而可以在同一個大型項目中混合嵌套使用。你可以用代碼硬編碼一個底層極度嚴謹的工具子圖,再用 Vibe Graphing 生成一個靜態結構圖,最后用可視化拖拽方式將他們組合在為一個完整的Workflow。
此外,MASFactory也提供一款深度集成的 VS Code 擴展工具——MASFactory Visualizer。它可以在代碼編排階段、拖拽式編排階段、Vibe Graphing階段、調試運行階段提供全棧的可視化支持。
![]()
代碼編排預覽
![]()
拖拽式工作流設計
![]()
Vibe Graphing 交互
![]()
運行時監測與追蹤
性能評估
MASFactory在 HumanEval、MBPP、BigCodeBench、SRDD、GAIA、MMLU-Pro 等七大覆蓋代碼生成與復雜推理的主流 Benchmark 上給出了具有說服力的數據。
實驗表明,MASFactory 能夠極為穩定且高效地復現當前業界最具代表性的系統(包括 ChatDev、MetaGPT、Agent Verse、CAMEL、HuggingGPT 等),且在多項指標上表現優于原始硬編碼實現。
![]()
參考資料:
https://arxiv.org/abs/2603.06007
https://github.com/BUPT-GAMMA/MASFactory
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.