AI Agent(人工智能代理)是一種能夠自主感知環境、分析信息、制定決策并執行動作的智能系統。它通過結合感知、推理、學習和行動能力,模擬人類或生物的智能行為,完成特定任務或持續目標。
![]()
AI Agent 和大模型的區別在于,大模型與人類之間的交互是基于prompt 實現的,用戶prompt 是否清晰明確會影響大模型回答的效果。而AI Agent的工作僅需給定一個目標,它就能夠針對目標獨立思考并做出行動。
來自加拿大的AI領域專家Rakesh Gohel給出了2025 AI Agents 幾個可能的發展方向:
![]()
- 自主檢索增強生成 (Agentic RAG)
基于推理的,用于實時數據檢索和生成的AI智能體工作流。
Agentic RAG的應用不局限于單一場景,同樣也被應用于醫療保健領域。
舉例:Perplexity, Harvey AI 和 Glean AI
- 語音智能體 (Voice Agents)
能夠通過自然口語與用戶互動的智能代理,利用廣泛的文本轉語音(TTS)和語音轉文本(STTS)的嵌入和檢索技術。
舉例:ElevenLabs, Cognigy, Vapi 和 Deepgram
- AI智能體協議 (AI Agent Protocols)
簡化多智能體之間的通信,支持不同框架下構建的智能體之間的交流。
舉例:Accenture,A2A, ACP, SLIM等
- 計算機使用智能體 (CUA - Computer Using Agents)
能像人類一樣與計算機交互的AI智能體,可利用瀏覽器、命令行界面(CLI)甚至鼠標光標等工具。
舉例:OpenAI的Operator, Claude的Computer Use, H-Company的Runner H以及Manus AI
- 編程智能體 (Coding Agents)
借助巧妙的工具使用和基于大語言模型(LLM)的代碼生成,使構建和調試應用程序的速度提高10倍的多智能體。
舉例:Windsurf, Cursor 和 GitHub Copilot
- 深度研究智能體 (DeepResearch Agents)
協作式多智能體系統,可從大量來源構建內容詳盡的研究報告。
舉例: Gemini DeepResearch, OpenAI DeepResearch 和 You(.)com DeepResearch
![]()
圖片來自:Rakesh Gohel
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.