![]()
文|白 鴿
編|王一粟
一年一度的“云計算春晚”亞馬遜云科技re:Invent 2025大會上,AI Agent(智能體)成為了當之無愧的主角。
從亞馬遜云科技首席執行官Matt Garman,到亞馬遜云科技Agentic AI副總裁Swami Sivasubramanian,都用了大量篇幅講述AI Agent。
這無疑也給世界傳遞出了一個明確的信號:Agentic AI時代,AI Agent已經從選擇題,成為了必答題。
當前,“Agentic AI已站在從‘技術奇跡’到‘實用價值工具’的關鍵轉折點,未來數十億Agent將滲透各行各業,助力企業實現10倍效率躍遷!”Matt Garman在開篇演講中說道。
![]()
可以看到,越來越多的 AI 技術正在走向產業端,但企業卻深陷 “ 搭建難、管理亂、落地貴 ” 的困境。 “ 為什么這些出色的 Agent 無法落地生產環境? ” 這是很多企業領導共同的疑問。
這背后問題的根源,就在于大多數AI技術的實驗性項目,從設計之初就并未考慮“生產就緒性”,“我們需要補足這一差距,真正走出AI技術的PoC(概念驗證)牢籠。”Swami說道。
那么,如何讓Agent真正成為生產力工具,而非技術噱頭?
作為全球云計算的領航者,亞馬遜云科技在此次發布會上給出了答案。
亞馬遜云科技re:Invent 2025大會上,亞馬遜云科技詳細地展示了其在Agentic AI領域的全棧能力:從底層芯片、計算網絡等算力基礎設施,到中間模型訓練、開發工具,再到上層的Agent應用。
主打一個,只要你想參與AI浪潮,這里就提供一套真正的“開箱即用”的工具。
“AI Agent的未來,不在于能做所有事,而在于能可靠地做好每件事。”Swami說道,“而亞馬遜云科技是構建與運行AI Agent的最佳平臺。”
從“能搭建”到“管理好”,企業Agent的落地革命
越來越多的企業,開始將AI Agent應用到實際的業務場景中。
如海洋清理組織(Ocean Cleanup),他們通過AI技術,來優化塑料檢測模型、預測垃圾移動軌跡、最大化清理效率,確保在全球最關鍵的區域開展工作。艾倫研究所(Allen Institute),開發神經網絡模型,用于分析單細胞多模態腦細胞數據,并希望借此解鎖突破性療法。
但現實問題往往在于,企業想要構建并規模化部署這些出色的Agent系統,比它們想用AI解決的問題更具有挑戰。
那么,企業到底如何才能夠輕松構建可靠、精準且可擴展的Agent系統?
一般來說,Agent主要由三大核心組件構成:
一是基礎模型,其是Agent的大腦,負責推理、規劃和執行;
二是代碼,其定義Agent的“身份”,明確其能力范圍并指導決策過程;
三是工具,其是Agent“落地生效的”關鍵,可以看作是Agent的“手腳”;
想要發揮Agent真正的效果,就需要將這些組件進行協同編排,但“過去整合這些AI組件是極其繁瑣且脆弱的過程。”Swami說道,“我們希望新的世界中,構建Agent將成為更簡單的事情,開發者只需要定義模型、代碼、工具三大組件即可。”
基于這一愿景,亞馬遜云科技開發并開源了模型驅動AI Agent框架Amazon Strands Agents SDK,并引入到了TypeScript(計算機編程語言)平臺,讓開發者能夠使用AmazonSDK在TypeScript中構建完整的Agent堆棧。同時,其還新增了對邊緣設備的支持,人們現在可以在小型設備上運行的AI Agent,覆蓋從汽車、游戲機到機器人等領域的大量應用場景。
在Swami看來,各行各業的開發者都被這一框架的簡潔性和可擴展性所吸引,“短短數月時間,Amazon Strands Agents SDK的下載量已經突破了500萬次。”
如果說Amazon Strands Agents SDK讓開發者構建Agent更方便快捷,那么Amazon Bedrock AgentCore則讓規模化部署Agent成為可能。
一般來說,很多在PoC階段的AI技術,往往功能單一、缺乏模塊化,這就導致開發者不得不自己編寫一個邏輯來拼接這些解決方案,最終讓優秀的模型變成了維護的噩夢。
那么,亞馬遜云科技的Amazon Bedrock AgentCore平臺,可支持企業在大規模環境中以安全的方式構建和部署Agent。
盡管Agent具備自主推理和行動的能力,極具價值,但企業必須建立健全的控制機制,以防止未授權的數據訪問、不當交互以及可能影響業務運營的系統級錯誤。即便經過謹慎設計的提示詞,Agent在實際應用中仍可能出現失誤,導致嚴重的后果。
![]()
因此,在亞馬遜云科技Amazon Bedrock AgentCore最新更新的功能中,Policy功能可幫助團隊為Agent的工具使用設定明確邊界;Evaluation功能,則可以讓團隊了解Agent在實際場景中的表現。
兩者相互配合,就能夠打造既具備自主能力又遵循行為邊界的企業級Agent。
此外,當下大多數AI Agent在“記憶”能力上依然存在明顯短板。如果想讓Agent更加實用化,邁過能執行復雜工作的門檻,一個必須要解決的問題在于長期的記憶能力。
AgentCore Memory填補了這一關鍵能力空白,使Agent能夠隨著時間推移形成對用戶的連貫認知。它引入了全新的情景式功能,能夠幫助Agent從過往經驗中(上下文、推理、操作和結果)學習,讓AI隨著時間的推移逐步構建對用戶的連貫理解,進而輸出更加智能化的決策。
這些Agent開發平臺,能夠支持企業自主搭建Agent,并快速實現規模化部署應用落地。除這些平臺外,亞馬遜云科技還推出三大獨立的Agent產品,能夠被直接應用在企業流程當中。
如亞馬遜云科技推出的Kiro Autonomous Agent,是專為軟件開發打造的Agent,被Swami定義為“開發者的AI同事”。Kiro Autonomous Agent核心突破了從“被動執行”到“主動規劃”的跨越,通過“規范驅動開發”理念和持久上下文記憶能力,它能在向人類學習后,獨立處理復雜編程任務數小時甚至數天。
“當企業部署上百個Agent后,安全與故障風險會呈指數級增長。”Swami在演講中警示道。
為此,亞馬遜云科技同步推出Amazon Security Agent與Amazon DevOps Agent,分別承擔“虛擬安全工程師”與“虛擬運維專家”角色,將傳統被動響應模式升級為主動管理體系。
可以看到,Kiro Autonomous Agent、Amazon Security Agent與Amazon DevOps Agent共同開啟了軟件開發的新紀元。這些前沿Agent不僅提升團隊效率,更從根本上重新定義了當AI作為團隊延伸力量時所能實現的可能:在軟件開發生命周期中,自動交付部分成果。
而從簡潔可擴展,到支持大規模安全部署Agent的平臺,再到能夠直接內置企業業務流程應用的Agent工具,亞馬遜云科技已經為企業級Agent的落地提供了全方位服務能力,長出了能干活“手腳”。
Agent“大腦”,模型既要選對又要能定制
企業級Agent,“手腳”是影響其運行的關鍵,“大腦”則是影響其決策的關鍵。
Agent的“大腦”來自于基礎大模型的能力,想要構建一個有用且高效的Agent,不僅僅要選擇一個好的基座大模型,于企業而言,能夠根據企業業務量身定制,也成為了關鍵。
相比于其他云計算廠商主推一款基座大模型,亞馬遜云科技一直非常開放,堅持“模型選擇大于一切”,讓全球主流大模型都能在這里跑起來。
也正因此,Amazon Bedrock集成了世界主流大模型產品,為用戶提供了豐富而多元的模型選擇,覆蓋開源模型、通用模型以及專用模型等多種類型。
此次,Amazon Bedrock還引入了多款最新開源模型,包括谷歌的Gemma、NVIDIA的Nemotron,以及來自中國的大模型廠商KIMI和Minimax的最新模型。
當然,除了外部模型外,亞馬遜云科技自研的大模型產品Amazon Nova家族也迎來了更新,推出了Amazon Nova 2系列四個版本。
而除模型選擇外,更為重要的是,Amazon Bedrock還能夠為企業提供模型微調服務。
如其最新更新的強化學習微調(RFT),經過微調后的模型與基礎模型相比,準確率可提升66%,大幅降低了模型定制化的門檻。針對特定任務的專業化訓練Model Distillation旨在創建更小更快的模型,能夠帶來10倍的速度提升,同時保留95%-98%的性能。
但Swami也坦言,盡管Amazon Bedrock已為企業提供了簡單強大的模型微調方式,但仍有許多企業需要對模型進行定制化,并希望利用自己的數據訓練大模型,從而構建企業競爭壁壘。
畢竟,“再好的通用模型,也無法替代企業的專有數據。”Swami說道。
這其中,主要面臨兩個問題:一個是如何基于技術對基座模型進行調優,一個是如何將自有數據充分且安全的融入到基座模型當中。
針對這兩個問題,亞馬遜云科技推出了兩個全新的產品:
首先是Amazon SageMaker,它能夠為企業提供“構建、訓練、部署專屬AI模型”所需的一切能力,可支持任意規模的大模型使用。
據介紹,Amazon SageMaker AI可以支持“模型蒸餾、監督微調、直接偏好優化(DPO)”等所有定制技術,可進行“全權重訓練”或“參數高效微調”,滿足企業任意業務場景需求。借助SageMaker AI的全面能力,企業能夠將“想法到生產”的周期從“數月縮短至數天”。
以印度Dunn公司為例:他們需要一個“深度理解印度金融市場復雜性”的大語言模型,其以Mistral-7B為基礎模型,構建了專屬模型“Arthur M”(70億參數)。整個過程中,其使用Amazon SageMaker AI進行模型構建與訓練,借助Bedrock獲取基礎模型支持。
“最終,這個定制模型只需要單個GPU,就能夠運行,且在88%的場景中,性能超過現有頂級模型,運營成本也僅為前者的一小部分。”Swami說道。
其次是Amazon Nova Forge,其向企業開放Nova模型的全階段訓練檢查點,即從預訓練到后期優化,企業可隨時注入自有數據與亞馬遜精選數據集混合訓練,打造專屬“Novellas”模型。
![]()
這就像在建造房子時,企業可以在打地基、架結構、做裝修的任何階段加入自己的設計,而非在現成房子里改造。
在功能層面,Amazon Nova Forge提供三大核心能力:
首先,自定義強化學習“gym”(訓練環境)。企業可以使用自身業務場景構建強化學習環境(即“gym”),讓模型在高度貼近真實應用的模擬場景中持續學習和優化。
其次,構建更小、更快的高性價比模型。客戶可通過合成數據蒸餾方式,利用更大模型生成的示例訓練更小、更高效的模型,從而在顯著降低成本與延遲的同時,盡可能保留智能水平。
第三,負責任AI工具套件。Nova Forge提供一套負責任AI工具,幫助客戶在模型訓練和應用部署中實施安全控制,滿足合規和治理要求。
據悉,目前包括Booking.com、Cosine AI、Nimbus Therapeutics、野村綜合研究所、OpenBabylon、Reddit和索尼等多家企業或機構,已經開始利用Nova Forge構建更契合自身需求的專屬模型。
當企業通過Amazon Nova Forge構建了自有前沿模型后,即可將其部署在Amazon Bedrock上,享受與其他Amazon Bedrock模型一致的企業級安全性、可擴展性和數據隱私保護。
通過這一端到端方案——從自建前沿模型,到生產環境部署——企業可以獲得針對自身業務量身定制的最佳AI性能,并在亞馬遜云科技上安全托管、獨享其模型資產。
“我們的目標是模型普及化。”
Swami強調,即使沒有深厚AI技術積累的企業,也能通過Amazon Bedrock的低代碼界面完成定制,訓練周期從數月縮短至數天,成本降低70%。
當前,面向AI Agent時代,越來越多的企業開始從“構建什么”向“如何快速構建”轉變,而在這一趨勢背景下,亞馬遜云科技通過全棧式一體化能力,為企業級Agent落地“保駕護航”。
AI算力基礎設施,是企業Agent的落地根基
如果說Agent是AI應用的最終產品形態,大模型是“大腦”,那么算力,就是支撐這一切的“心臟”。
作為全球云計算的一哥,亞馬遜云科技早已經構建了從芯片,到智算集群的底層算力基礎設施體系。而現在,亞馬遜云科技通過“自研芯片+生態合作”的雙引擎算力體系,以性能、能效、擴展性的三重突破,破解企業AI落地的算力瓶頸,同時強化自身在AI時代的算力基建優勢。
一方面,從底層芯片層面來看,本次大會上,Matt Garman宣布正式發布Amazon Trainium3 UltraServers,這是亞馬遜云科技首款搭載3納米工藝AI芯片的服務器。
相較Amazon Trainium2,不僅計算能力提升4.4倍、內存帶寬提升3.9倍,每兆瓦算力可處理的AI token數量更實現了5倍增長。服務器最高配置144個芯片,提供驚人的362 Petaflops FP8計算能力。在運行OpenAI的GPT-OSS-120B模型時,每兆瓦輸出token數是Amazon Trainium2的5倍以上,實現超高能耗比。
![]()
除了Amazon Trainium3 UltraServers外,Matt Garman還首次披露了Amazon Trainium4芯片,承諾將實現較Amazon Trainium3六倍的FP4計算性能、四倍內存帶寬和兩倍高內存容量,持續鞏固亞馬遜云科技在AI芯片領域的長期卓越地位。
目前,亞馬遜云科技已完成超100萬個AmazonTrainium2芯片的規模化部署,為Amazon Bedrock中大部分推理工作提供核心算力支持,包括Claude最新一代模型的高效運行。
而除了自研芯片產品外,亞馬遜云科技還與NVIDIA合作已達15年,是業界最早在云端提供NVIDIA GPU服務的廠商。這種深度綁定讓企業能獲得“經過頂級客戶驗證”的成熟算力方案。
綜上,通過復盤亞馬遜云科技re:Invent 2025大會不難看出,面向AI Agent時代,其核心競爭力并非單一產品,而是“垂直整合+開放生態”的雙重優勢:
底層通過自研芯片(Tranium)與全球基建,掌控算力定價權與交付能力;
中層以Bedrock為樞紐,用開放模型生態覆蓋多元需求,用定制工具(Nova Forge)深度綁定客戶;
上層通過AgentCore與行業Agent,打通從模型到應用的“最后一公里”。
這種布局回應了企業AI轉型的三大痛點:算力成本高、模型適配難、落地風險大。
當云計算進入“AI原生”時代,亞馬遜云科技正在用全棧能力證明:真正的AI領導者,不僅要提供技術,更要構建讓技術產生價值的生態系統。
從芯片到模型,從數據到Agent——亞馬遜云科技也正在構建完整的AI價值閉環,助力企業真正駕馭智能變革。
正如Matt Garman所公布的1320億美元年收入營收背后的20%增速所昭示的,在AI重構產業的浪潮中,亞馬遜云科技既是參與者,更是規則制定者。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.