網易首頁 > 網易號 > 正文申請入駐

年度專刊發布丨邁向AI Agent普及的未來

2026-02-06 08:11:56　來源: 哈佛商業評論

北京舉報

分享至

AI引發的創新浪潮正在重塑每一種客戶體驗、每一家公司乃至每一個行業。而且，變革才剛剛開始，技術迭代的速度遠超我們以往所見的一切。不久前，人們還在測試各類聊天機器人，如今幾乎每天都有新的應用場景與技術方案誕生。

然而，許多企業尚未看到AI承諾的價值真正兌現，其真正潛能也尚未完全釋放。不過，這一局面正在迅速改變：AI助手正逐步讓位于能代人執行任務、將工作流自動化的AI Agent。

這是AI發展軌跡的拐點，標志著AI正從技術奇觀變為創造真實價值的工具。AI Agent的到來，也是AI投資開始產生實質商業回報的起點。未來，數十億個Agents將遍布每家公司、每個可想象的領域。這場變革對各行業的影響，將不亞于互聯網與云計算的普及。

問題是，企業今天該如何出發？

普及AI Agent的美好前景與挑戰

目前，Agent已在加速醫療發現、優化客戶服務、提升薪酬處理效率等領域發揮作用；在某些場景中，Agent將個人效能提升了10倍，讓人們有更多時間投入創新。若人人都能獲得這般賦能，無疑是極具價值的愿景。

“在某些場景中，AI Agent將個人效能提升了10倍，讓人們有更多時間投入創新。”

—— Matt Garman

亞馬遜云科技CEO

然而，要邁向 AI Agent普及的未來，讓每個組織都能從AI中收獲實際價值與成果，說起來容易，做起來難。

每個Agent的核心都由三大關鍵組件構成：一、作為Agent大腦的模型，負責推理、規劃與執行；二、定義 Agent身份的代碼，明確Agent的能力并指引其決策流程；三、工具，為Agent注入生命力，如后端 API、知識庫與數據庫接口，執行現實操作的代碼解釋器或網絡瀏覽器等。

要讓Agent釋放真正的價值，就必須將這些組件高效協同起來。這一任務，面臨著 5 大挑戰：

第一，企業需具備大規模、快速部署Agents的能力。這要求企業擁有可支撐業務從零快速擴展至數千并發會話的基礎設施，通過完善的會話隔離機制支持Agents長時間穩定運行，并防止敏感數據在不同Agents間泄露；

第二，Agent必須具備處理海量數據、應對邊緣案例的能力。要讓Agent真正落地生產環境，需要為其配備精密的記憶管理系統，既能精準管理會話及交互過程中的上下文信息，又能跨會話記憶用戶偏好；

第三，身份與訪問管理的安全挑戰。若缺乏完善的安全管控機制，Agent可能無意中訪問或暴露不應接觸的敏感數據。在生產環境中，必須建立固若金湯的身份與訪問管理體系：既要精準驗證用戶身份，也要嚴格授權Agent訪問對應工具的權限；

第四，實現與生產環境的無縫連接。當Agent進入生產環境時，絕不可能孤立運行，而是會融入更龐大的業務系統。Agent需與業務應用所需的API、數據庫及各類服務安全集成；

第五，具備全鏈路可觀測與快速調試能力。畢竟，無法觀測的問題必然難以修復；一旦出現問題，必須快速定位并解決。

如何應對這些挑戰？關鍵在于融合四大核心要素：

一是AI基礎設施，能提供強大且具成本效益的算力支撐；二是推理系統，可提供豐富的模型選擇及高性價比的模型服務；三是數據能力，能將企業獨有數據高效轉化為新的核心競爭優勢；四是完整的系統化構建工具，讓AI Agent的構建過程簡單高效，且成果可信賴、高度可靠。

AI基礎設施的5大屬性

構建真正能創造價值的Agent，首要前提是擁有可擴展、強大的AI基礎設施，為所有環節提供動力。即通過高度可擴展且安全的云服務，為AI工作負載提供極致性能，以低成本完成模型訓練、定制與推理。

“AI會讓攻擊者也更高效，因此云提供商必須將安全作為最高優先級。”

—— Peter DeSantis

亞馬遜云科技公用計算高級副總裁

這要求突破基礎設施的可能性邊界，為Agent系統與應用打造全新的基礎構建模塊，并以全新視角重構所有工作流程，強化云計算的5大基礎屬性：

安全性：不僅是好人利用AI提升效率，壞人也在使用相同的工具。AI讓攻擊者也更高效，云提供商必須將安全作為最高優先級；

可用性：AI應用的部署規模空前，需要經過最嚴苛工作負載考驗的云基礎設施；

彈性：AI工作負載需求激增，客戶期望獲得與Amazon S3相同的彈性體驗；

成本：AI訓練和推理的成本極高，成本控制能力成為關鍵競爭力；

敏捷性：企業的AI轉型充滿不確定性，需要具備快速啟動、優化和調整的能力。

因此，亞馬遜云科技圍繞這5大屬性所做的持續投入，不僅是為了解決過往的技術痛點，更成為支撐Agent落地的硬核基座。

2010 年，Amazon EC2 曾面臨嚴重的虛擬化性能抖動問題。當時，業界普遍認為虛擬化永遠無法達到裸金屬性能，但亞馬遜云科技通過深入優化，最終開發出 Amazon Nitro 系統，將虛擬化從服務器轉移到專用硬件，完全消除了抖動問題，性能甚至超越裸金屬。Amazon Nitro 的成功，開啟了亞馬遜云科技的自研芯片之路，也證明了通過掌控芯片、硬件與系統架構，能夠實現商用硬件難以企及的性能與效率提升。這一理念也延續到了服務器處理器 Amazon Graviton與AI加速器Amazon Trainium的開發中。

最新一代服務器CPU Amazon Graviton5，實現了重大的架構突破。早期客戶已在生產環境中驗證了其卓越性能，多家企業的實踐數據顯示：Airbnb（愛彼迎）實現了25%的性能提升，軟件公司Atlassian 延遲降低20%，無人機公司Honeycomb 每核心性能提升36%，思愛普的SAP HANA OLTP查詢性能提升 60%；蘋果公司將核心服務用Swift重寫并遷移至Amazon Graviton服務器后，實現了40% 的性能提升和30%的成本降低。

“最新一代服務器CPU Amazon Graviton5，已實現重大架構突破。”

—— Dave Brown

亞馬遜云科技計算與機器學習服務副總裁

2013 年，亞馬遜云科技的一個小團隊提出了一個看似不可能的想法：讓開發者只需提交代碼，無需管理服務器（即 Serverless 架構）。這一創新想法，最終演變為 Amazon Lambda這一革命性的服務。它改變了應用開發模式，讓開發者從代碼而非服務器開始思考。十年后，Amazon Lambda仍是從概念到生產落地的最快路徑之一。而Amazon Lambda Managed Instances（托管實例）的突破，重新定義了Serverless 計算，為視頻處理、機器學習預處理、高吞吐量分析等傳統上不適合Amazon Lambda的工作負載打開了大門。

推理請求的處理包含四大階段：分詞、預填充、解碼、去分詞。每個階段對系統資源的需求完全不同：有的屬于CPU密集型，有的屬于GPU計算密集型，有的對內存帶寬要求極高，有的則對延遲極為敏感。在全球規模的應用場景下，數千家客戶、數百萬級請求、數十種模型同時運行，且每個請求的資源配置會在流程中動態變化。這帶來了前所未有的擴展挑戰。亞馬遜云科技從零開始研發，設計出Project Mantle推理引擎，為客戶帶來了更穩定的延遲表現、更高的吞吐量、更優的資源利用率以及更強的系統韌性。

在非結構化數據的整合與連接方面，Amazon Nova多模態嵌入模型，支持文本、文檔、圖像、視頻及音頻等多種數據類型，能將這些不同類型的數據轉換為共享向量空間，從而實現對數據的統一理解。此外，亞馬遜云科技已將向量能力集成至旗下所有數據服務中，使客戶無需學習全新的技術棧即可快速應用。

在自研芯片的協同創新方面，Amazon Trainium3 服務器首次在同一服務器板上集成了Amazon Trainium、Amazon Graviton與Amazon Nitro三款自研芯片。該服務器的所有組件均支持頂部維護，且可實現全機器人組裝，能夠大幅加快部署速度。人工智能公司Anthropic已在 Amazon Trainium上完成Claude最新一代模型的訓練與運行；Descartes AI（笛卡爾AI）通過使用 Amazon Trainium3與Nki優化實時視頻生成模型，實現了4倍的幀率提升，并達成80%的張量核心利用率，這一表現遠超傳統 GPU 系統。

推理：按需定制模型的開放平臺

在著手構建生成式AI應用時，企業首先需要明確的核心問題是：選擇哪一個模型？哪一個模型能帶來最優成本、最低時延以及最佳的回答質量？很多時候，問題的答案是組合使用多種模型——因為沒有任何一款模型可以“包攬所有場景”。因此，一個安全、可擴展、功能完備的推理平臺必不可少。

Amazon Bedrock正是這樣的平臺，可加速生成式AI應用的落地進程，助力企業從原型階段快速邁向生產環節。企業可按需定制模型，以匹配自身的業務場景和性能要求，獲得融合自有數據的工具，并按需添加各類安全防護機制。

如今，全球各行各業、不同規模的公司，包括BMW（寶馬）、GoDaddy（一家提供域名注冊和互聯網主機服務的公司）、Strava（美國健身運動和社交應用平臺）等超過 50 家企業，均在使用Amazon Bedrock。部分企業通過Amazon Bedrock處理的Token數量已突破萬億。

作為平臺，Amazon Bedrock一直在持續、快速地豐富模型陣容。這其中，既有開源權重模型，也有專有模型；既有通用模型，也有專用模型；既有超大模型，也有輕量模型。過去一年，Amazon Bedrock 提供的模型數量幾乎翻了一番，還將引入 Google（谷歌）的Gemma、MiniMax（上海稀宇科技）的M2、NVIDIA（英偉達）的Nemotron，以及Mistral AI（法國米斯特拉爾）的Mistral Large和Mistral 3等開源權重模型。

除了第三方模型，亞馬遜云科技自研的基礎模型家族Amazon Nova也在不斷擴展，支持更多使用場景，不僅贏得Dentsu（日本電通）這樣的營銷巨頭的認可，還受到Infosys（印孚瑟斯）、Blue Origin（藍色起源）、Robinhood （羅賓漢）等科技領軍企業，以及NinjaTech AI（忍者科技）這類創新型初創公司的青睞。最新版本的Amazon Nova 2，可提供兼具成本優化、低時延與前沿智能的模型。其中，Amazon Nova 2 Omni是業內首款同時支持文本、圖像、視頻和音頻輸入，并可生成文本和圖像的多模態推理模型。

Amazon Bedrock與Amazon Nova讓企業擁有充分的選擇自由：需要效率時調用高效模型，需要算力時啟用強大模型，需要復雜推理時則使用高推理能力模型。內容營銷公司 Gradial正借此打造極具實用價值的能力，破解創意落地執行的最大瓶頸。目前，營銷內容運營仍高度依賴人工，流程繁瑣——從創意簡報到最終上線，需要 4～6 周時間，涉及多達20個環節，需設計師、工程師、文案和網站策略師等多個角色協同完成。Gradial編排的AI Agents，不僅能無縫銜接不同系統和角色，大幅加速從創意到落地的全過程，還能提供精準的內容優化建議，助力企業高效觸達并轉化目標受眾。

數據：強化競爭優勢的關鍵

AI能否為企業和用戶創造巨大價值，關鍵在于能否讓AI深入理解企業的獨有數據。企業的獨有數據是構建差異化競爭優勢的核心資產。如果 Agent能更深入地理解業務、數據和工作流程，就能解鎖更多應用可能。

釋放Agent真正價值的核心要義，是將大模型與企業的獨有數據及知識產權深度融合。這首先需要將企業數據遷移至云端，在此基礎上，確保模型能夠安全、高效地訪問與使用這些數據。

第三方模型最初通常無法理解企業的專屬業務，也無法訪問企業專有數據。企業也不愿讓第三方模型接觸這些數據——畢竟沒有企業愿意將自身專有數據嵌入公共模型，進而被競爭對手或其他方利用。這正是Amazon Bedrock內部設立嚴格數據隔離機制的原因所在。

企業可以通過 RAG（檢索增強生成）或向量數據庫等技術，在推理階段為所選模型動態注入上下文信息，幫助模型在企業的海量數據中精準導航，返回高度相關的結果。然而，這類方法的效果終究存在局限，企業更期望通過某種方式，讓模型真正理解自身的業務數據，并深度掌握企業積淀的深厚領域知識與專業經驗。例如，某家硬件企業正致力于加速新產品研發進程，其理想的模型能力是：能夠理解企業過往的產品設計邏輯、制造工藝偏好、項目成功與失敗案例，以及現有流程的各類約束條件，并整合所有這些信息，為設計工程師提供智能、精準的決策指導。

既然如此，企業為何不直接訓練一個專屬的定制模型呢？可行的路徑主要有兩條。第一條路徑是從零開始構建企業專屬模型，將企業的專有數據深度融入模型訓練過程。然而，這種方式不僅成本極高，還很可能無法獲取構建模型通用智能所需的全部數據；即便數據儲備充足，企業也可能缺乏預訓練“前沿大模型”所需的技術能力與經驗。因此，對大多數企業而言，這條路徑并不具備可行性。

第二條路徑是從開源權重模型入手，再通過技術手段對模型進行定制化修改。這種方式的核心優勢是具備極高的靈活性，企業可通過微調、強化學習等技術手段調整模型權重，從而打造出高度聚焦于自身核心業務場景的專用模型。然而，實踐證明這種方法同樣存在顯著局限：想要讓模型掌握預訓練階段未曾接觸過的全新領域知識，難度極高；更關鍵的是，模型的定制化程度越高、注入的專有數據越多，就越容易出現“遺忘”現象，丟失早期預訓練獲得的核心能力，尤其是關鍵的核心推理能力。這一現象類似于人類學習新語言的過程：若在幼年時期學習，往往更容易掌握；若成年后才開始學習，難度則會顯著提升。模型的定制化訓練同樣面臨類似的挑戰。

Amazon Nova Forge則探索出了第三條創新路徑——開放訓練模型。通過這一平臺，企業可獨家訪問多個Amazon Nova模型的訓練檢查點，并在模型訓練的全流程中，將企業專有數據與亞馬遜云科技精心設計的訓練數據集進行深度融合，最終生成一款既能深刻理解企業業務數據，又不會遺忘原有核心能力的企業專屬模型。

大型社交新聞與內容分享平臺Reddit（紅迪網），在其聊天與搜索業務場景中，嘗試利用生成式 AI對平臺內容進行多維度安全審核，但審核效果始終未達預期。Reddit曾進行過多輪嘗試，例如微調現有模型，甚至嘗試為不同安全審核維度分別部署多個模型，但仍難以滿足其社區特有的內容審核需求。借助Amazon Nova Forge，Reddit在模型預訓練階段就將其專有的社區數據進行深度整合，使模型能夠形成獨特的“融合表征”能力，從而自然地將模型的通用語言理解能力，與Reddit社區特有的知識體系深度結合。Reddit也因此首次成功構建出一款同時滿足高準確性、高成本效益，且更易于部署與運維的專屬安全審核模型。

工具：圍繞四大支柱構建生產級Agent

AI Agent足以成為科技史上的關鍵轉折點。人們不再受限于代碼語法的熟悉度，也無需記住成百上千的API調用與參數，只需用自然語言描述想要實現的目標，Agent就會生成方案、編寫代碼、調用工具、執行完整解決方案。同時，有了Agent，以往需數年的工程開發，現在僅需數月；過去需數月的任務，如今可壓縮至數周甚至數日。因此，全球的構建者正借助Agent解決極其復雜的難題，構建前所未有的創新事物。

“大多數企業陷入了‘概念驗證監獄’的困境，使得無數精彩的Agent原型無法走向生產環境。”

—— Swami Sivasubramanian

亞馬遜云科技Agentic AI副總裁

然而，現實的核心難題在于，構建與擴展這些強大的Agent，往往比它們要解決的難題更為復雜。其結果是，大多數企業陷入了“概念驗證監獄”（POC Jail）的困境，無數精彩的Agents原型無法走向生產環境。這就要求有一套完備、系統的工具鏈，讓Agent易于構建、高效運行、可信可控、穩定可靠。

易于建構

第一步，構建Agent應該極為簡單，能讓開發者用最少代碼創建Agent。這正是 Amazon Strands Agents SDK的特點。對TypeScript的原生支持，使其能適配這一全球最流行的編程語言之一；而對邊緣設備的支持，則讓Strands解鎖了汽車、游戲、機器人等領域的全新應用場景。現在，幾乎每位開發者都能在筆記本電腦上試驗與構建Agent。

第二步，填補從概念驗證（POC）到生產落地的鴻溝，同樣應該簡單易行。一個真正智能且行為可控的托管系統，如Amazon Bedrock AgentCore正是為此而生。它能解決一系列核心問題：身份與訪問管理；管控 Agent的交互過程與行為邊界，同時保障Agent能夠自由推理、采取最佳行動并響應業務請求；能夠在數千個模擬場景中評估與測試Agent；不僅能通過“短期記憶”能力處理即時對話流，通過“長期記憶”能力捕捉跨會話的洞察，更具備情境記憶（Episodic Memory）能力，記住用戶行為背后的時間背景與觸發原因，從過往經驗中學習——將每一次交互存儲為獨立的情境片段，在新的對話時自動識別相似情境片段中的行為模式，并主動提供切實可行的解決方案。這就像人類記住生命中的特定事件那樣，經歷得越多，Agent就越聰明。例如，用戶獨自出差時，Agent會自動預訂航班起飛前 45 分鐘到達機場的專車；用戶拖家帶口旅行時，Agent會自動識別過往的相似經驗，將提前45分鐘的專車調整為提前兩小時。

高效運行

效率不僅關乎成本控制，還包含延遲（響應速度）、規模（流量峰值處理能力）、敏捷性（迭代速度）三大核心維度。大多數Agents將時間花在編寫代碼、分析搜索結果、創建內容、執行預定義工作流等常規性工作任務上。因此，如果能為這些高頻場景的任務定制專用模型，就能大幅提升Agent的運行效率。

具體而言，有幾項核心技術可顯著提升效率。第一，監督微調技術，可將Agent從 “通才”培養為垂直領域的“專家”，就像把全科醫生訓練成心臟病專家，使其精準聚焦于特定業務需求。第二，模型蒸餾技術。當面臨內存不足等硬件限制，或需部署更輕量、更快速的模型時，企業可選擇模型蒸餾技術。這一過程類似于行業大師培養聰慧學徒：“弟子”不僅會模仿導師輸出答案，更能學習其底層的思考邏輯與推理路徑，掌握導師的置信度水平、決策邏輯模式乃至核心識別策略。蒸餾模型往往能帶來10倍的推理速度提升，同時保留導師模型 95%~98% 的核心性能，可謂事半功倍。第三，強化學習技術，包括基于人類反饋的強化學習 (RLHF) 與基于 AI 反饋的強化學習 (RLAIF) 兩種核心范式。一般而言，傳統強化學習的研發投入大、周期長，并非普通企業能夠承受。因此，Amazon Bedrock設計出“強化微調功能”，以掃清所有技術難關、降低研發成本，幫助客戶提升模型的任務執行精度，使客戶無需深厚的機器學習專業知識，也不必準備海量標注數據，即使是普通開發者也能輕松上手。

可信可控

你的Agent會將資金轉到正確的賬戶嗎？當它們代表你操作時，會嚴格遵守當地的法律法規嗎？你是否愿意授予Agent訪問信用卡的權限？它會不會拿著你的資金去進行非必要的消費？這些問題的核心，都關乎大語言模型的“幻覺”問題——即模型在面對復雜規則或邏輯推理時，容易產生錯誤輸出。更糟糕的是，大語言模型還可能被惡意行為者誘導，產生有害行為。

這樣的Agent顯然無法在生產環境中長期部署，在涉及資金安全、人身安全等敏感事務時，更不能讓它們投入使用。然而，如果對Agent完全缺乏信任，企業就會采取過度保守的策略，在每個執行步驟都引入額外的人工審核監督，或通過硬編碼（hard code）的方式固定所有執行步驟。這兩種方式都會大幅削弱Agent的創造性與自主決策能力。

亞馬遜云科技用神經符號AI（Neuro-Symbolic AI）技術——即形式推理與大語言模型的深度融合，來破解這一難題。這一技術能夠在Agent的構建初期，就輕松為其設定清晰的約束條件，既給予Agent盡可能多的自主運作空間，同時又明確其安全運作的邊界范圍，并確保Agent會嚴格遵循這些約束條件，即便約束條件十分微妙或復雜。2025年夏天正式發布的全新Agentic IDE（集成開發環境）——Amazon Kiro，就可讓開發者通過自然語言描述來定義整個應用程序或功能特性的需求，自動分析應用需求、識別驗收標準并轉換為標準化規范，進而指導代碼生成、測試用例生成，甚至可形式化證明程序的正確性。

穩定可靠

部分Agents能夠準確完成單次任務，但當要求它們重復執行時，卻容易出現偏差，更無法保障持續、穩定的重復執行。

21世紀初期，企業流程自動化的核心挑戰，主要由機器人流程自動化（RPA）技術解決。大語言模型適應復雜業務場景的能力，遠勝于傳統 RPA 技術。它們能夠操控瀏覽器、通過邏輯推理解決復雜問題、實現端到端工作流自動化，甚至可跨不同系統界面協同運作。然而，編排這些大語言模型的運作流程極為復雜，因此，為其構建完善的錯誤處理與流程回溯機制至關重要。在傳統自動化腳本中，工程師能夠確切定位錯誤發生的節點；而大語言模型可能需要在錯誤路徑上執行多次操作后，才會意識到問題所在。因此，對許多企業而言，使用這些大語言模型開展大規模的企業流程自動化操作，不僅耗時耗力，還容易出錯，實用性較低。

那么，能否讓大語言模型的自動化能力，從一開始就兼具簡單易用性與高可靠性呢？答案并非僅僅是訓練更優秀的模型，更需要將優質模型整合為端到端自動化服務的核心組成部分。Amazon Nova Act便是專為構建與管理自動化生產級UI工作流的AI Agent團隊打造的平臺，在企業級復雜工作流場景中，已實現 90%的高可靠性表現。其獨特之處在于，并非“在罐子里培養大腦”（僅訓練模型能力），而是讓“大腦”（模型）與“手腳”（執行工具）協同訓練，實現“出廠即能穩定運作”。

傳統的模仿學習方式，僅能讓Agent觀察并模仿專家的操作行為，但Agent永遠無法理解這些行為背后的因果邏輯關系。因此，亞馬遜云科技轉向了強化學習技術，打造了數百個強化學習“健身房”——即模擬真實企業環境的訓練平臺，涵蓋 CRM、HR 系統、任務跟蹤器等各類業務系統的模擬環境。在這些“健身房”中，Agent可運行數千個典型工作流，通過數十萬次交互進行試錯學習。每次成功完成任務會獲得正向獎勵，每次失敗則會獲得負向懲罰。通過這種強化學習方式，Amazon Nova Act能夠可靠地解決真實世界中的各類企業級業務用例。在RealBench、ScreenSpot等關鍵行業基準測試中，Amazon Nova Act的表現與業界最佳模型相當，甚至更為出色。

我們正處于一個前所未有的變革時代，AI Agent技術將徹底重塑企業的核心運營方式。基于強大且具成本效益的AI基礎設施、豐富的模型選擇與高性價比的推理系統、能將企業數據轉化為核心競爭優勢的工具鏈，以及完整的AI Agent構建與管理系統這四大核心支柱，企業將真正收獲AI的全部價值。隨著數十億Agents在各行各業規模化落地運行，企業將實現全方位的 10 倍效率躍升，解鎖未來的無限創新可能。

掃碼獲取專刊內容

內容來源：《邁向AI Agent普及的未來》專刊

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.