![]()
智東西?
作者 李水青
編輯 漠影
2025年的大模型產業正在經歷一場靜默的分化。一邊,少數明星模型的參數競賽依然激烈;另一邊,一個更根本的轉變已在基礎設施層悄然發生:
AI的價值實現路徑,正從“模型能力展示”轉向“Agent實際部署”。
亞馬遜云科技CEO馬特·加曼(Matt Garman)在今日凌晨舉辦的2025 re:Invent主題演講中直言:“Agent的出現使我們在AI軌跡上發生了變化——從一個技術奇跡的時代,轉向真正獲得價值的時代。”
他的判斷基于一組反差強烈的數據:一方面,生成式AI引發全球狂歡,Amazon Bedrock已服務超過10萬家企業,其中50多家客戶處理了超1萬億tokens;另一方面,許多企業仍未看到AI投資帶來相匹配的業務回報。
![]()
▲Garman在講解Amazon Bedrock落地情況
“Agent是企業從AI投資中獲得實質性商業回報的地方。”Garman揭示了一個關鍵轉折點,“我相信,在未來每個公司內部和每個可以想象的領域都會有數十億的Agent。”
一場重新定義AI價值實現的競賽已經打響。在亞馬遜云科技2025 re:Invent的舞臺上,AI芯片性能飆漲600%,構建AI Agent的四大技術支柱同步升級,Agent部署的全棧戰爭已經升級……到底什么才是企業抓住這場變革紅利的抓手?
云計算一哥的一招一式,都給了我們解答Agent變革時代之問的絕佳參考。
![]()
▲Garman在講解Agent部署的所需要素
一、重新定義AI Infra:自研芯片與「AI工廠」的雙重革命
算力競爭已進入云巨頭自主可控、性能狂飆的階段。亞馬遜云科技在2025 re:Invent上亮出了其最尖端的武器:基于自研3nm芯片的Amazon EC2 Trainium 3 UltraServers服務器正式全面推出,而下一代Trainium 4芯片的性能參數更令人震撼。
“如果看看今天在Amazon Bedrock上運行的所有推理,大多數實際上已經由Trainium驅動了。”Garman透露。更令人印象深刻的是,亞馬遜云科技已部署超過100萬顆自研Trainium芯片,而上一代Trainium 2的量產速度是其此前芯片的4倍。
最新性能數據揭示了這場算力革命的緊迫程度:基于首款云端3nm AI芯片Trainium 3,亞馬遜云科技最新推出的Amazon EC2 Trainium 3 UltraServers服務器,最極致的配置將144顆Trainium 3芯片互連,提供362PFLOPS(FP8)算力和超過700TB/秒的總帶寬。
該服務器提供相比前代Trainium 2的4.4倍的計算性能、3.9倍的內存帶寬提升,而能效比指標——每兆瓦電力處理的AI token數量——提升了5倍。
![]()
▲Amazon EC2 Trainium 3 UltraServers服務器性能情況
更值得一提的是,對于下一代Trainium 4,亞馬遜云科技承諾了更大幅度的飛躍:預計提供6倍的FP4性能,4倍的內存帶寬,2倍的內存容量,并支持通過NVLink Fusion和UALink進行擴展,專為全球最大的模型訓練需求而生。
但芯片性能只是故事的一半。亞馬遜云科技同時推出了更具戰略意義的Amazon AI Factories(AI工廠)服務——允許企業在自己的數據中心部署專用AI基礎設施,同時享受亞馬遜云科技的全套服務和管理。
這一舉措直擊企業生成式AI出海和全球化部署中的核心痛點:數據主權、合規要求與性能需求的平衡。企業可以在本地維護數據控制權,充分利用既有空間與電力資源;同時獲得與公有云相同的先進AI能力,無縫接入從Trainium、英偉達GPU到SageMaker和Bedrock的全棧AI服務。
二、模型生態的多元主義:自研模型超GPT-5.1,中國模型占1/4席位
與追逐“萬能模型”的潮流相反,亞馬遜云科技選擇了多元化的模型戰略。“我們從不相信會有一個模型統治一切。”Garman明確表示,“相反,會出現很多偉大的模型。”
這一理念在Amazon Bedrock平臺上得到充分體現。過去一年,Amazon Bedrock平臺提供的模型數量翻倍,2025 re:Invent上新增的18款全托管開源模型也包含4款中國頂尖模型,中國模型占1/4席位,包括千問、DeepSeek、Kimi及MiniMax多家模型已上線Amazon Bedrock平臺。
對中國企業而言,這意味著在出海和全球化過程中,可以獲得更貼近本土技術特點的生成式AI支持。對全球用戶而言,這代表了更廣泛的技術選擇。
亞馬遜云科技最新推出的自研的Amazon Nova 2系列模型則展示了另一種可能。四款新型號覆蓋了從輕量推理到復雜多模態的全場景需求:
Amazon Nova 2 Lite:是一款快速且經濟高效的推理模型,擁有不錯的指令遵循、工具調用、信息提取、代碼生成等能力,在上述四大領域的能力基本全面超越了Claude Haiku 4.5、GPT-5 mini、Gemini 2.5 Flash等輕量級模型,僅在編程能力上略遜于GPT-5 mini。
Amazon Nova 2 Pro:是Nova系列中最智能的推理模型,支持文字、圖像、視頻、語音四種模態輸入和文本模態輸出,適用于高度復雜的工作負載,尤其是Agent場景。在兩項Agent基準測試中,其表現已經超過了GPT-5.1(high)、Gemini 3 Pro Preview(high)等前沿模型。
Amazon Nova 2 Sonic:下一代語音轉語音模型,能為AI應用提供實時、類人的對話式AI體驗。在語音理解和推理任務上,其性能已經超過了GPT Realtime、Gemini 2.5 Flash等。
Amazon Nova 2 Omni:是業界首個支持文本、圖像、視頻和音頻輸入,并支持文本和圖像生成輸出的推理模型。不過,亞馬遜云科技尚未公布其基準測試成績。
![]()
▲Amazon Nova 2 Omni發布現場
可以看到,特別是在Agent關鍵能力的基準測試中,Amazon Nova 2 Pro展現了令人印象深刻的性能,這直接回應了企業對于生成式AI在實際業務場景中可靠性的關切。
尤其是在企業出海的場景中,選擇至關重要(Choice Matters)。AI的未來不會僅由1個模型統治,過去一年Amazon Bedrock上提供的模型數量已經翻倍,DeepSeek、Qwen等中國模型也在支持范圍之內,這位中國企業的出海業務部署Agent提供了豐富選擇。
三、數據與模型深度融合:開放訓練模型打破“RAG局限”
“你的數據是獨一無二的,這就是你與競爭對手的區別。”Garman反復強調這一觀點。然而,傳統的數據與模型結合技術如RAG(檢索增強生成)只能幫助模型更有效地導航數據,無法讓模型真正“理解”企業的深層次領域知識,這也成為Agent價值釋放的“攔路虎”。
亞馬遜云科技的革命性的解決方案是:Amazon Nova Forge服務,該服務引入了“開放式訓練模型(Open Training Model)”的概念。
![]()
▲亞馬遜云科技推出Amazon Nova Forge服務
通過這項服務,企業可以在模型訓練的任意階段,將自己的專有數據與亞馬遜的訓練數據集混合,創建名為“Novellas”的定制模型。這一方法解決了傳統微調中的核心矛盾——在教授模型新領域知識的同時,避免其“遺忘”已掌握的核心推理能力。
Amazon Nova Forge還提供了使用遠程獎勵函數和強化學習微調的能力,以進一步改進模型,讓企業可以將真實環境集成到訓練循環中。由于基礎模型已經理解業務,這些后訓練技術實際上會變得更加有效。
索尼是這一服務的早期采用者。通過對Amazon Nova 2 Lite模型進行微調,索尼創建了深度理解自身業務和運營的定制模型,在引用一致性和文檔依據等任務上表現優于基準模型,目標是將合規審查和評估流程的效率提升100倍。
可以看到,對于尋求通過生成式AI實現差異化競爭優勢的企業而言,這一能力至關重要。它意味著企業可以構建真正理解自身業務邏輯、流程和知識的Agent,而非僅僅使用通用的AI工具。
四、回歸一件事:沒有魔法,只有可部署的Agent
2025 re:Invent上最引人注目的發布,或許是三類“前沿Agent”的推出。這些Agent代表了AI能力的一次階躍式提升:自主、大規模可擴展且能長期運行,也給廣大開發者打了個樣。
三類前沿Agent展示了AI重塑軟件開發和運營的潛力:
Kiro autonomous agent徹底改變了開發范式。它與市面上常見的代碼補全助手不同,而是能夠自主處理復雜任務,如升級關鍵庫時,自動識別所有受影響服務,分析使用模式,按規范更新代碼,運行完整測試,并一次性創建所有合并就緒的拉取請求。亞馬遜內部的一個案例顯示,原本需要30名開發者18個月完成的重架構項目,使用Kiro后僅需6人76天完成。
![]()
▲亞馬遜云科技推出Kiro autonomous agent
Amazon Security Agent是一個持續、主動、內置的AI安全專家。將安全實踐從“事后檢查”變為“持續嵌入”。它能在設計階段審查文檔,編碼過程中掃描漏洞,并將滲透測試從昂貴的一次性活動轉變為按需的持續驗證過程,從而確保安全性。
Amazon DevOps Agent重新定義了運維響應機制。當警報觸發時,它能立即診斷根本原因,提供修復方案,使工程師能夠專注于決策而非排查。這一能力對于保障全球化業務的連續性至關重要。
Agent開發的基礎設施同樣得到加強。Amazon Bedrock AgentCore自SDK預覽版發布以來,5個月內下載量超過200萬次。新增的兩項功能直接應對企業部署Agent的核心關切點:
Amazon AgentCore Policy(預覽版):為Agent與企業工具及數據的交互提供實時確定性控制。
它允許開發者在Amazon AgentCore Gateway工具調用運行前攔截,使用帶有細粒度權限的策略,為Agent行為定義明確的界限,如使用哪些工具、如何使用工具,開發者也可以通過自然語言創建標準,如“報銷金額大于1000美元時,就阻止退款”等。
![]()
▲亞馬遜云科技推出Amazon AgentCore Policy
Amazon AgentCore Evaluations(預覽版):根據實際行為持續檢查Agent質量。
這是一項全托管服務,開發者可以使用內置評估器來衡量常見的質量維度,如正確性、幫助性、工具選擇準確性、安全性、目標成功率和上下文相關性,還可以創建基于模型的定制評分系統,根據自己選擇的提示和模型進行業務定制評分。
![]()
▲亞馬遜云科技推出Amazon AgentCore Evaluations
除了上述更新,Garman還在最后10分鐘公布了25個新發布,包括搭載第五代AMD EPYC處理器的X8i Instances、搭載英特爾至強6的C8ine Instances、EC2 M3 Ultra Mac Instances等覆蓋計算、存儲、數據庫、大數據、安全等多個領域的新品,這些都為企業Agent部署提供了穩定堅實的支撐。
結語:AI進入Agent時間,價值落地之戰打響
當AI進入Agent時間,2025 re:Invent的舞臺展示了亞馬遜云科技對Agent時代的全面布局,這不再是一場單點技術的競賽,而是全棧能力的比拼,其正在構建一個支持Agent從實驗到落地生產的完整平臺。
當下,每個產業人士都在見證生成式AI從技術演示走向商業價值,價值落地之戰已打響。云巨頭的這種“全家桶”式的全棧能力,或許正是企業將AI投資轉化為實際業務回報所需要的基礎設施。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.