<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      基于文本AI的終結?Agent協作可直接「復制思維」,Token效率暴漲

      0
      分享至

      機器之心報道

      編輯:陳陳

      在 Agentic AI 時代,模型不再是獨來獨往的學霸,而是開始學會組隊、一起想問題。多智能體系統(MAS,multi-agent systems)的發展讓 AI 世界從一個人苦想變成了多人頭腦風暴。尤其是基于大語言模型的 MAS,如今已經被用在各種任務中。

      不過,在這個組合里,AI 基本靠文本交流,最近有人開始思考:LLM 在大腦里(也就是潛在空間)想事情時,其實比說出來要豐富得多。

      于是一些研究開始嘗試讓模型直接用隱藏層來表示想法,比如 (i) 用 Transformer 的隱藏表示來實現單模型的潛在鏈式思考推理, (ii) 使用 KV 緩存或層級嵌入在兩個模型之間交換信息。

      然而,一個能夠同時統一潛在推理與潛在通信的全面模型協作框架仍未被探索出來。

      為進一步推進這一方向,來自普林斯頓大學等機構的研究者提出:MAS 能否實現真正的純潛在空間協作?

      為回答這一問題,他們提出一種多智能體推理框架 LatentMAS,其將智能體之間的協作從傳統的 token 空間轉移到了模型的潛在空間。核心創新是:讓所有智能體不再通過文本交流,而是在潛在空間中直接協作。

      一直以來,傳統 MAS 依賴自然語言溝通,各個 LLM 之間用文本交流思路。這種方法雖然可解釋,但冗長、低效、信息易丟失。LatentMAS 則讓智能體直接交換內部的隱藏層表示與 KV-cache 工作記憶,做到了:

      • 高效的多步推理:在大幅減少 token 的情況下,實現更復雜的思考過程;
      • 無需訓練的潛在空間對齊機制,確保生成過程穩定可靠;
      • 通用性強:可兼容任意 HuggingFace 模型,并可選擇性地支持 vLLM 后端。

      總體而言,LatentMAS 在多智能體系統中實現了更高的性能、更低的 token 使用量,以及顯著的實際運行速度提升。

      為了實證評估 LatentMAS 的有效性,本文在九個基準任務上進行了全面實驗,這些任務涵蓋數學與科學推理、常識理解和代碼生成。

      結果顯示 LatentMAS 始終優于強大的單模型和基于文本的 MAS 基線:(i) 準確率最高提升 14.6%,(ii) 輸出 token 使用量減少 70.8%-83.7%,(iii) 端到端推理速度加快 4×-4.3×。這些結果表明,潛在協作不僅提升了系統級推理質量,還在無需額外訓練的情況下帶來了顯著的效率收益。



      • 論文標題:Latent Collaboration in Multi-Agent Systems
      • 論文地址:https://arxiv.org/pdf/2511.20639
      • GitHub 地址:https://github.com/Gen-Verse/LatentMAS

      這篇文章也得到了很多人轉發評論,可供大家參考。比如這位網友的觀點很好的概括論文:

      「在傳統的多智能體系統中,我們通常讓智能體 A 生成文本,再由智能體 B 讀取并處理。這種文本瓶頸既浪費算力,又嚴重稀釋語義信息。LatentMAS 帶來了一種近乎心靈感應式的替代方案:智能體通過交換潛在思維來協作。

      智能體 A 不再把推理結果解碼成文本,而是將它的工作記憶,也就是注意力層中的 KV 緩存直接傳給智能體 B。于是智能體 B 在啟動時,仿佛已經加載了 A 的全部推理過程。

      通過將第一個智能體生成的 KV 對直接注入第二個智能體的注意力機制中,第二個智能體會把前者的內部狀態當作自己的提示,從而完全繞過離散的 token 化層。這種方法比基于文本的協作快 4.3 倍,并減少 80% 以上的 token 使用量。更重要的是,它無需昂貴的訓練,只用簡單的線性對齊就能讓嵌入空間兼容。

      智能體 A 的潛在思維被直接復制進智能體 B 的記憶之中。」



      還有人認為這會終結基于文本的 AI:



      方法介紹

      LatentMAS 是一個端到端的潛在協作框架:當給定一個輸入問題時,所有智能體的推理與交流都完全在潛在空間中進行,只有最終答案才會被解碼為文本輸出。其核心設計結合了智能體的內部潛在思維生成與跨智能體潛在工作記憶傳遞。

      • 在每個智能體內部,推理通過自回歸地生成最后一層隱藏表示來展開,從而無需顯式解碼即可捕捉模型持續進行的內部思考;
      • 在智能體之間,信息通過存儲在各層 KV 緩存中的共享潛在工作記憶進行交換,其中包含輸入上下文以及新生成的潛在思維內容。

      基于這些設計,LatentMAS 建立在三個基本原則之上,這些原則也通過全面的理論與實驗分析得到了驗證:

      • 推理表達能力:隱藏表示天然地編碼模型的連續思維,使得每一步潛在推理都能傳遞遠比離散 token 更豐富的信息。
      • 通信保真度:潛在工作記憶完整保留了每個模型的輸入表示與潛在思維,從而實現跨智能體的無損信息傳遞。
      • 協作復雜度:與 TextMAS 相比,LatentMAS 在協作表達能力更強的同時,其推理復雜度卻顯著更低。

      前兩個原則共同強調了 LatentMAS 的核心優勢:它能夠支持更豐富的潛在推理,并實現無損的潛在交流。第三個原則則從整體復雜度角度進一步說明:LatentMAS 在保持高表達能力的前提下,其計算復雜度遠低于基于文本的 MAS。

      該方法使系統中的 LLM 智能體能夠:

      (i)在潛在空間中生成具有超強表達能力的潛在思維;

      (ii)在智能體交互過程中,以無損的方式保留并傳遞各自的潛在工作記憶;

      (iii)在保持與傳統 TextMAS 相同表達能力的同時,實現顯著更低的計算復雜度。



      實驗

      本文在九個基準上對 LatentMAS 進行了全面評估,這些基準覆蓋通用任務與高強度推理任務兩大類。

      在模型上,本文采用 Qwen3 系列的三個模型:4B、8B 和 14B,用于構建不同規模的 LatentMAS。所有實驗均在 8× NVIDIA A100-80G GPU 上完成。

      表 1、表 2 和表 3 展示了 LatentMAS 整體表現。他們從三個互補維度進行評估:(i) 任務準確率、(ii) 系統吞吐量(總輸出 token 數)、(iii) 端到端推理速度。

      結果顯示,在所有任務上,LatentMAS 相比單模型基線在順序式與層級式 MAS 設置下分別平均提升 14.6% 和 13.3% 的準確率;相比文本式 MAS,在兩種設置下分別額外提升 2.8% 與 4.6%。

      在相同 MAS 架構下,LatentMAS 相比順序式與層級式 TextMAS 平均分別實現 4× 與 4.3× 的推理加速。

      此外,由于整個協作過程完全發生在潛在空間中,LatentMAS 相比 TextMAS 在順序式與層級式設置下分別減少 70.8% 與 83.7% 的 token 使用量。







      高效率潛在協作

      LatentMAS 在理論上可實現遠高于 TextMAS 的效率。本文進一步通過實證對 LatentMAS 與 TextMAS 的效率進行了驗證。正如圖 1 和圖 4(左)所示,即使在 TextMAS 基線已經通過 vLLM 服務加速后,LatentMAS 依然能提供 2.6×–7× 的額外加速。

      這種顯著提升來源于:latent 推理只需較少的 latent steps,而文本推理則需要大量的 per-token 解碼步驟。例如:在不到 50 個 latent steps 的情況下,LatentMAS 就能在像 AIME 24/25 這樣高強度推理任務中達到甚至超過文本 MAS 的表現;而文本 MAS 通常需要超過 2 萬個輸出 token 來完成完整的文本 CoT 推理軌跡。





      此外,如圖 1 和圖 4(右)所示,LatentMAS 相比 TextMAS 可減少 59.4%–87.9% 的 token 使用量,因為 LatentMAS 中的智能體通過將潛在工作記憶直接注入其他智能體的內部層來交流,而非依賴文本中轉。

      值得注意的是,LatentMAS 相比單模型推理仍能減少 15.0%–60.3% 的 token 使用量。這是因為,在 LatentMAS 中,輸入問題由多個協作智能體分擔,使得最終的智能體只需匯總前序的潛在思維并生成最終答案,因此所需輸出文本顯著減少。

      最終,整個系統在使用更少 output tokens 的同時,反而獲得了更高的準確率。

      深入分析 LatentMAS

      在這一部分,本文首先驗證 LatentMAS 生成的潛在思維是否具有有意義且語義豐富的表達。為此,本文比較了 LatentMAS 新生成的最后一層隱藏向量與 TextMAS 逐 token 生成的響應嵌入分布。如圖 5 所示:

      • LatentMAS 的最后一層嵌入與 TextMAS 的 token 嵌入分布區域幾乎重疊,說明潛在思維編碼的語義與對應的文本響應一致。
      • LatentMAS 的隱藏嵌入分布覆蓋范圍比 TextMAS 更廣,表明潛在思維比離散 token 擁有更高的多樣性和表達能力。

      這些結果共同說明:潛在思維不僅能夠捕捉對應文本的有效語義,還蘊含更豐富、更具表現力的內部表示。



      為了確定 LatentMAS 的最佳 latent step 數量,本文在三個下游任務中逐步增加 latent step ,以觀察深度影響。如圖 8 所示,隨著 latent steps 增加,下游性能普遍提升,說明額外的潛在思維提高了 AI 協作表達能力。



      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      偷稅只是冰山一角!央視出手,陳震再迎噩耗,牽扯整個車評圈

      偷稅只是冰山一角!央視出手,陳震再迎噩耗,牽扯整個車評圈

      甜檸聊史
      2025-12-06 16:55:42
      張衛柱主教榮休,梵蒂岡同步發聲

      張衛柱主教榮休,梵蒂岡同步發聲

      意訊
      2025-12-07 19:32:23
      48歲男子因心梗猝死,生前堅持每天散步5公里,醫生:3個習慣致命

      48歲男子因心梗猝死,生前堅持每天散步5公里,醫生:3個習慣致命

      卡西莫多的故事
      2025-12-08 10:20:04
      與俱樂部隊友格格不入,朱婷被國外網友集體吐槽

      與俱樂部隊友格格不入,朱婷被國外網友集體吐槽

      體育快遞小哥哥
      2025-12-07 19:39:51
      普京梭哈了!俄軍此刻的瘋狂進攻,只能說明俄羅斯已經強弩之末

      普京梭哈了!俄軍此刻的瘋狂進攻,只能說明俄羅斯已經強弩之末

      娛宙觀
      2025-12-07 23:21:41
      一夜兩消息!莊宇珊首秀20分,球隊保級難,王媛媛2攔,隨隊取7勝

      一夜兩消息!莊宇珊首秀20分,球隊保級難,王媛媛2攔,隨隊取7勝

      跑者排球視角
      2025-12-08 07:14:11
      孫穎莎幫助國乒拿下冠軍 沒想到日本媒體這樣評價她!真的太全面了

      孫穎莎幫助國乒拿下冠軍 沒想到日本媒體這樣評價她!真的太全面了

      林子說事
      2025-12-08 09:56:05
      史詩級收割!美國10萬億“零元購”日本,用日本人的錢買日本公司

      史詩級收割!美國10萬億“零元購”日本,用日本人的錢買日本公司

      南宮一二
      2025-12-08 06:35:27
      孫繼海遭質疑?旅日小將:中國足球13歲后才被日本超越,因3死結

      孫繼海遭質疑?旅日小將:中國足球13歲后才被日本超越,因3死結

      念洲
      2025-12-08 11:57:26
      句句扎心,特魯姆普8-10塞爾比,賽后慚愧說出了輸球原因

      句句扎心,特魯姆普8-10塞爾比,賽后慚愧說出了輸球原因

      章蠞戶外
      2025-12-08 09:57:11
      三種姿勢過夫妻生活,更容易懷孕?頻次過高,精子質量差?

      三種姿勢過夫妻生活,更容易懷孕?頻次過高,精子質量差?

      資說
      2025-12-07 10:31:03
      就在今天!12月8日上午,男籃傳來徐杰、廣東宏遠和國家隊消息

      就在今天!12月8日上午,男籃傳來徐杰、廣東宏遠和國家隊消息

      皮皮觀天下
      2025-12-08 13:19:50
      廣東一夜3消息!杜鋒吃徐杰醋,張皓嘉被徹底放棄,麥考爾復出

      廣東一夜3消息!杜鋒吃徐杰醋,張皓嘉被徹底放棄,麥考爾復出

      多特體育說
      2025-12-08 12:12:18
      “書破了媽媽”引熱議,聊天記錄流出,開學第三天群被解散

      “書破了媽媽”引熱議,聊天記錄流出,開學第三天群被解散

      藍藍說教育
      2025-12-07 11:07:30
      【突發】美國擬對中國斷供所有先進芯片

      【突發】美國擬對中國斷供所有先進芯片

      芯事情報局
      2025-12-08 07:30:03
      《瘋狂動物城2》票房破30億,這是一個信號:情感消費已成趨勢!

      《瘋狂動物城2》票房破30億,這是一個信號:情感消費已成趨勢!

      老方
      2025-12-07 20:58:41
      史上最搶手皇后,6位帝王輪番霸占60年不停歇,48歲還被人爭著要

      史上最搶手皇后,6位帝王輪番霸占60年不停歇,48歲還被人爭著要

      小豫講故事
      2025-12-08 06:00:07
      柬泰沖突細節披露 洪森要求部隊“克制”

      柬泰沖突細節披露 洪森要求部隊“克制”

      新華社
      2025-12-08 12:54:11
      沒事就愛看點有意思的聊天記錄,莫名其妙能笑上半天!

      沒事就愛看點有意思的聊天記錄,莫名其妙能笑上半天!

      另子維愛讀史
      2025-12-05 21:07:18
      你見過沒有小三的億萬富翁嗎?網友:男人好色無關人品!

      你見過沒有小三的億萬富翁嗎?網友:男人好色無關人品!

      帶你感受人間冷暖
      2025-11-26 00:15:03
      2025-12-08 13:39:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11862文章數 142510關注度
      往期回顧 全部

      科技要聞

      外面有人挖,家里有人跑:蘋果亂成了一鍋粥

      頭條要聞

      牛彈琴:對日斗爭突發新情況 中國軍方回應火力全開

      頭條要聞

      牛彈琴:對日斗爭突發新情況 中國軍方回應火力全開

      體育要聞

      厲害的后衛何其多 想想還少了哪一個

      娛樂要聞

      郭麒麟也救不了的德云社了?

      財經要聞

      養牛場未見一頭牛 每天開采礦石倒賣

      汽車要聞

      挑戰深圳地獄級路況 魏牌藍山VLA上車會思考聽得懂人話

      態度原創

      數碼
      游戲
      本地
      公開課
      軍事航空

      數碼要聞

      英特爾將為蘋果代工芯片 初期僅用于標準版

      破次元壁的集結號!國內首款二次元RTS《無限幻想戰線》正式公開,戰略的浪漫由此啟程

      本地新聞

      云游安徽|七千年敘事,第一章寫在蚌埠

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      日本稱中方雷達照射日戰機 國防部回應

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 精品偷拍| 丁香花在线影院观看在线播放| 毛片tv网站无套内射tv网站| 少妇特黄a一区二区三区| 欧美日韩中文国产一区发布 | 顺平县| 真人抽搐一进一出视频| 亚洲人成无码区在线观看| 国产又色又爽又黄又免费| 亚洲精品一区国产精品| 中文字幕在线v| 亚洲国产乱| 国产午夜精品久久久久免费视| 国产精品成人va在线观看| 久久香蕉国产线看观看亚洲片| 久久精品熟妇丰满人妻99| 葫芦岛市| 激烈的性高湖波多野结衣| 欧美激情猛片xxxⅹ大3| 四虎影视一区二区精品 | 欧美啊v| 亚洲?欧美?人妻| 国产白丝无码免费视频| 亚洲成a人片在线视频| 羞羞成人一区| 固安县| 秋霞鲁丝片av无码少妇| 91视频在线免费观看| 亚洲AV自拍| 铁岭市| 97香蕉碰碰人妻国产欧美| 国产精品igao视频| 亚洲sm另类一区二区三区| 丁香婷婷社区| 高清精品一区二区三区| 99视频在线精品免费观看6| 在线观看美女网站大全免费| 国产福利导航在线| 国产麻豆精品一区二区三区v视界 久久99精品久久久久久 | 久久久久久亚洲精品成人| 国产午夜精品理论大片|