![]()
谷歌正秘密為其企業級產品Gemini Enterprise開發一項新功能:一個多智能體(multi-agent)系統,它能夠扮演聯席科學家或研究員的角色,幫助用戶提煉想法,實現研究自動化
具體來說,該系統的工作流程是:接收一個主題和一套評估標準,生成大量想法,然后啟動一個智能體團隊,以錦標賽(tournament-style)的形式對這些想法進行評估
值得注意的是,該系統能夠讓Gemini就單個問題持續運行約40分鐘,這對于一個面向用戶的產品而言,是一次非常長的連續運行
在運行結束后,用戶會收到一份根據所選標準從優到劣排序的想法列表,一次運行可產出約100個想法
![]()
對于每個想法,用戶會得到概述、詳細描述、評審摘要、完整評審報告以及專門的錦標賽表現報告。這份錦標賽表現報告會作為一項獨立輸出,可供單獨瀏覽。所有生成的想法都是可選的,方便用戶專注于特定選項并進行更深入的探索
![]()
兩款核心智能體:“想法生成”與“聯席科學家”
在目前的預覽版中,谷歌準備了三款預置智能體,其中兩款建立在這一多智能體錦標賽系統之上
![]()
一款名為“想法生成”(Idea Generation)。用戶提供一個主題,該智能體便會啟動多智能體工作流,通過錦標賽式評估來生成與該主題相關的想法并進行排序
另一款名為“聯席科學家”(Co-scientist),更側重于科學家和研究人員。它允許用戶指定一個研究課題,提供額外數據,然后由一個智能體團隊通過相同的錦標賽機制來生成和評估想法,但更聚焦于研究和科學用例
L3級AI的體現:強大的算力投入
這一設置最引人注目的方面之一,是其背后巨大的算力投入。
讓智能體就單個任務工作約40分鐘,與典型的智能體工具相比,算力消耗相當大。在整個運行期間,系統會持續對問題進行迭代
![]()
與現有的智能體實現相比,這似乎是一個重要的進步。即使是像ChatGPT中那些能夠使用瀏覽器模式的高級智能體,通常也受到有限的上下文窗口和時間預算的限制。相比之下,谷歌的這種方法被設計成一個面向用戶的產品,直接向企業客戶開放了非常高的算力
![]()
這也與“L3級AI”的理念相符,即智能體能夠持續較長時間處理一個問題。在這種背景下,單任務運行40分鐘是一個有力的例證
目前,所有這些功能都出現在開發中的Gemini Enterprise內部,尚未對普通用戶開放
不止于原始建議,輸出結構化研究方向
在實踐中,其主要輸出是一套經過提煉的想法
但這些不僅僅是原始建議,而是結構化的研究方向。考慮到輸入的數據和原始問題,這些方向可能帶來極具價值的洞見。這體現了谷歌正致力于為組織、企業和研究團隊提供極其強大的智能體
![]()
當該功能最終發布時,可能會是一次重大飛躍,特別是如果這些智能體最終由尚未發布的Gemini 3 Pro驅動。目前,Gemini 3 Pro尚未在Gemini Enterprise中可用,因此尚不清楚驅動這些實驗性智能體的具體模型。
此外,該系統還有一個工作流程細節:當用戶提交提示時,系統會首先展示一份計劃中的評估和想法維度的摘要。用戶在審查并批準該摘要后,才能啟動實際任務,以確保在投入大量算力之前,初始提示被正確理解
另一項新功能:與文檔對話
除了多智能體錦標賽流程外,還有另一款名為“與文檔對話”的智能體,它擁有一個獨立的UI
該智能體允許用戶上傳最大30MB的PDF文件,并與這些文檔進行明確的對話。其目標是讓模型能夠分析和整合多達30MB的PDF內容到上下文,以便用戶從現有文檔中提取更有意義的信息。
該功能同樣是Gemini Enterprise的一部分,尚未發布,且目前在生產環境中無法使用。
在Gemini Enterprise正在開發的多項功能中,多智能體錦標賽工作流和專注于文檔的智能體最為突出。
特別是基于錦標賽的多智能體設置,看起來是一個突破性的產品方向,其他LLM提供商尚未真正提供達到這種水平的服務。多智能體錦標賽在面向用戶的工具中仍然很少見
一旦這些智能體更加成熟,看到它們正式的評估和基準測試將非常有價值。僅從描述來看,“聯席科學家”智能體對于那些積極探索新科學方向的大型組織和研究團隊來說,已經像一個非常有吸引力的工具。
目前尚不清楚這些智能體將于何時發布,也不確定是否會向企業客戶之外的用戶提供,但這絕對是值得關注的動向
參考:
https://www.testingcatalog.com/google-to-enable-research-automation-on-gemini-enterprise/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.