![]()
智東西
作者 駿達 程茜
編輯 心緣
全球最大云計算巨頭的AI武器庫,又迎來重磅更新!
智東西拉斯維加斯12月2日報道,今日,在年度云計算產業盛會AWS re:Invent上,亞馬遜云科技(AWS)連甩一系列重磅AI新品,包括最新AI芯片Trainium4、基于其首款3nm AI芯片的Amazon EC2 Trainium3 UltraServers、第二代自研大模型Amazon Nova 2系列,以及大量Agent開發利器。
![]()
從AI基礎設施、AI推理平臺、企業數據管理到智能體開發工具、前沿智能體,通通迎來一大波升級。智東西作為受邀現場參會的媒體,從大會前排帶來超全干貨報道。
Amazon Nova 2系列首發4款模型:經濟高效推理模型Lite,高智能推理模型Pro,語音轉語音的實時擬人對話式AI模型Sonic,以及面向多模態推理和圖像生成的統一模型Omni。
其中,Nova 2.0 Pro Preview在指令跟隨、智能體工具使用榜單中,性能超過了GPT-5 mini、GPT-5.1、Claude Opus 4.5、Gemini 3 Pro Preview等前沿模型。
![]()
值得一提的是,Amazon Bedrock新增18款全托管開源模型,其中包括4款國內頂尖模型:阿里Qwen3-NEXT和Qwen3-VL、月之暗面Kimi K2 Thinking、稀宇科技MiniMax M2。
![]()
其他新增的前沿模型還有谷歌Gemma 3、英偉達Nemotron、OpenAI gpt-oss-safeguard、Mistral AI的Mistral Large 3和Ministral 3等。
總體來看,今日十大重要發布包括:
1、P6e新實例:采用英偉達GB300 NVL72系統。
2、AWS AI Factories服務:專用客戶定制AI基礎設施,由AWS快速構建和管理。
3、AWS Trainium4自研AI芯片:第四代自研AI芯片,相比上一代帶來6倍的計算性能(FP4)、3倍的FP8性能、4倍的內存帶寬、2倍的內存容量,并可通過NVLink Fusion和UALink實現縱向擴展。
4、Amazon EC2 Trainium3 UltraServers:由AWS首款3nm AI芯片Trainium3提供支持,提供大規模AI訓練和推理的高性價比,單集群可連接144張Trainium3芯片,算力達362PFLOPS(FP8),帶寬為706TB/s,相較上一代帶來4.4倍計算性能、3.9倍高內存帶寬、5倍的每百萬瓦token數。
5、Amazon Bedrock平臺:新增18款開源模型,模型數量過去一年翻倍增長,已擁有超過10萬客戶,其中50多家客戶均使用了超過1萬億個token。
6、Amazon Nova 2系列自研模型:包括Lite、Pro、Sonic、Omni。
7、Amazon Nova Forge服務:支持企業訪問Nova模型在不同階段的訓練檢查點,并將自有數據與亞馬遜的訓練數據集混合,構建定制前沿模型。
8、AgentCore開發工具:Policy in AgentCore(預覽版),使用細粒度權限策略,給agent行動設置明確邊界;AgentCore Evaluations(預覽版),使用評估器,根據現實世界行為來持續檢查agent質量。
9、4款前沿智能體:AWS Transform Custom(專為企業開發工作流程設計),Kiro autonomous agent(自主開發復雜編程任務)、AWS Security Agent(預覽版,保護全開發生命周期安全)、AWS DevOps Agent(預覽版,加快事件響應速度并提高系統可靠性)。
10、7款新實例、6項Amazon S3存儲升級、5項Amazon RDS數據庫更新、3項計算與加速優化新功能、4項管理與治理新功能。
一、新基建:全新AI芯片Trainium4性能飆6倍,幫企業定制專屬AI基礎設施
加曼稱,亞馬遜云科技是第一家在云中提供英偉達GPU的公司,其與英偉達合作已超過15年,也是迄今為止運行GPU集群最多的公司。
1、基于英偉達GB300 NVL72打造P6e-GB300
今天,亞馬遜云科技新發布采用英偉達最新的GB300 NVL72系統的P6e-GB300,相比P6e-GB200,新實例GPU內存容量提升至1.5倍,FP4計算性能(無稀疏)提升至1.5倍。
![]()
英偉達在亞馬遜云科技上運行其生成式AI集群。OpenAI也在亞馬遜云科技上基于EC2 Ultra Servers集群支撐ChatGPT運行及訓練下一個模型,部署了數十萬張GB200。加曼透露這些處理器很快將會變為GB300。
本月初,亞馬遜云科技還與沙特阿拉伯AI創企Humain建立了合作伙伴關系,計劃在沙特的數據中心設施中提供、部署和管理至多15萬個AI加速器。
2、AWS AI Factories滿足企業私有化部署需求
為滿足企業的私有化部署需求,今天亞馬遜云科技宣布推出AWS AI Factories。基于這一平臺,客戶能在自己的數據中心部署專用AI基礎設施,然后使用亞馬遜云科技的基礎設施和服務。
![]()
3、Amazon EC2 Trainium3 UltraServers
目前,Amazon Bedrock上運行的所有推理工具都由Trainium提供支持,亞馬遜云科技已經部署了100萬顆Trainium芯片,Trainium2的量產速度是其曾經芯片量產速度的4倍。
加曼稱,亞馬遜云科技的Trainium系列芯片雖然以“訓練”命名,但這些芯片其實也適用于推理用途。目前,亞馬遜云科技上的許多AI推理服務都是在Trainium芯片上運行的,包括Claude的前沿模型。
亞馬遜云科技還圍繞Trainium打造了一個超大規模系統,名為Project Rainier,用于Anthropic下一代Claude模型的訓練。
![]()
這一項目的規模十分龐大,加曼稱,如果過去大家常說單個數據中心已經成了新的計算機,Project Rainier則更進一步,讓由多個數據中心組成的園區,構成了一個計算機。
Project Rainier將會不斷擴大規模,最終支持高達30個單體數據中心,用掉1.1GW的電力,托管超過50萬個Trainium2芯片。相關計算設備會使用超過100萬個的高速連接器件,通過AWS EFA網絡實現安全、可靠的連接。
亞馬遜云科技于去年發布了Trainium3芯片,今天,加曼宣布Amazon EC2 Trn3 UltraServers服務器已經廣泛可用。與上一代產品相比,該服務器可提供4.4倍的算力和3.9倍的內存帶寬。
值得注意的是,Amazon EC2 Trn3 UltraSevers在能效比上也有提升,每兆瓦所處理的token數量達前代產品的5倍。
![]()
4、下一代AI芯片Trainium 4
加曼還透露,亞馬遜云科技的下一代AI芯片Trainium 4已深入設計階段。Trainium4預計能提供6倍的FP4性能,4倍的內存帶寬,2倍的內存容量,并支持通過NVLink Fusion和UALink進行擴展。
![]()
二、新模型:阿里、Kimi、MiniMax模型上架,第二代自研模型Nova 2四彈齊發
亞馬遜云科技Amazon Bedrock推理平臺已經擁有超過10萬客戶,使用其處理超1萬億個token的企業客戶已超過50家。
![]()
亞馬遜云科技一直以來的信條就是“選擇至關重要(Choice Matters)”,這也適用于模型的選擇。加曼稱,亞馬遜云科技認為AI的未來不會僅由1個模型統治,過去1年,Amazon Bedrock上提供的模型數量已經翻倍,DeepSeek、Qwen等中國模型也在支持范圍之內。
Amazon Bedrock還在今天新增了18款全托管開源模型,包括Qwen3-Next-80B-A3B、Qwen3-VL-235B-A22B、Kimi K2 Thinking、MiniMax M2等中國模型。此外,谷歌Gemma、英偉達Nemotron以及全新的Mistral Large 3和Ministral 3(3B、8B和14B版本)等模型也登陸Amazon Bedrock平臺。
亞馬遜云科技還發布第二代自研模型家族Nova 2系列,推出了4款新模型:Lite、Pro、Sonic和Omni。
Nova 2 Lite是一款快速且經濟高效的推理模型,適用于各種類型的工作負載,擁有不錯的指令遵循、工具調用、信息提取、代碼生成等能力。Nova 2 Lite在上述四大領域的能力基本全面超越了Claude Haiku 4.5、GPT-5 mini、Gemini 2.5 Flash等輕量級模型,僅在編程能力上略遜于GPT-5 mini。
![]()
Nova 2 Pro是Nova系列中最智能的推理模型,支持文字、圖像、視頻、語音四種模態輸入和文本模態輸出,適用于高度復雜的工作負載,尤其是Agent場景。在兩項Agent基準測試中,其表現已經超過了GPT-5.1(high)、Gemini 3 Pro Preview(high)等前沿模型。
Nova 2 Sonic則是亞馬遜云科技的下一代語音轉語音模型,支持文本和語音兩個模態的輸入輸出,能為AI應用提供實時、類人的對話式AI體驗。在語音理解和推理任務上,其性能已經超過了GPT Realtime、Gemini 2.5 Flash等。
![]()
Nova 2 Omni是Nova系列的新物種,也是業界首個支持文本、圖像、視頻和音頻輸入,并支持文本和圖像生成輸出的推理模型。不過,亞馬遜云科技尚未公布其基準測試成績。
![]()
三、新服務:開放Nova模型訓練檢查點,幫企業訓出專屬前沿模型
加曼談道,AI需要擁有理解公司數據的能力,才能真正為公司和客戶帶來巨大價值。
由于數據具有獨特性,企業往往不希望自己的專有數據被嵌入到第三方模型中,供他人使用。過去,業內讓企業數據和模型結合最常用的技術是RAG或向量數據庫,但這無法讓模型真正理解數據。想要教會模型理解行業知識,還是需要定制模型。
然而,如果從零開始定制模型是極為昂貴的,企業沒有足夠數據、足夠算力打造出強大的通用智能。
如果在開源模型的基礎上,通過微調、強化學習等方式打造行業模型,則有可能出現其他領域性能下降的風險。
亞馬遜云科技的解決方案,是Amazon Nova Forge。Nova Forge引入了“開放式訓練模型(Open Training Model)”的概念。
![]()
通過Nova Forge,企業可以獨家訪問各種Nova模型的訓練檢查點,并在模型訓練的任意階段,將自己的專有數據與亞馬遜創建的訓練數據集混合。這使得企業能夠產出一個深度理解企業信息的模型,同時不會遺忘模型已訓練的核心信息。
![]()
Nova Forge還提供了使用遠程獎勵函數和強化學習微調的能力,以進一步改進模型,讓企業可以將真實環境集成到訓練循環中。由于基礎模型已經理解業務,這些后訓練技術實際上會變得更加有效。
亞馬遜云科技已經和不少企業試點了Nova Forge服務。索尼便通過Nova Forge,對Nova 2 Lite模型進行了微調,使其適用于索尼自身的業務和運營。模型在引用一致性和文檔依據等任務上表現優于基準模型,索尼的目標是借此將索尼合規審查和評估流程的效率提升100倍。
![]()
四、新工具:給Agent開發設限和打分
今天,亞馬遜云科技宣布Amazon Bedrock AgentCore新增兩項新功能,幫助開發者快速構建Agent。自AgentCore SDK預覽版發布以來,其在5個月內下載量已超過200萬次。
此前,亞馬遜推出了為Agent設計的核心工具集AgentCore,包含部署、代碼解釋器、托管環境等諸多能力。在此基礎上,亞馬遜推出Policy in AgentCore預覽版和AgentCore Evaluation預覽版。
![]()
Policy in AgentCore允許開發者在AgentCore Gateway工具調用運行前攔截,使用帶有細粒度權限的策略,為Agent行為定義明確的界限,如使用哪些工具、如何使用工具,開發者也可以通過自然語言創建標準,如“報銷金額大于1000美元時,就阻止退款”等。
![]()
AgentCore Evaluation是一項全托管服務,幫助開發者持續監控和分析基于真實行為的Agent表現。開發者可以使用內置評估器來衡量常見的質量維度,如正確性、幫助性、工具選擇準確性、安全性、目標成功率和上下文相關性,還可以創建基于模型的定制評分系統,根據自己選擇的提示和模型進行業務定制評分。
![]()
所有AgentCore的評估結果都會在亞馬遜統一監控平臺CloudWatch被呈現。開發者還可以設置評估分數的警報和警報,主動監控Agent質量,并在指標超出可接受閾值時作出響應。
亞馬遜此前構建了Amazon Quick和Amazon Connect兩個Agent方案。
首先是Amazon Quick,可以幫助員工在幾分鐘內將觀點轉換成行動,指導深度研究和獲得詳盡分析,其會從獲取信息整理出詳細的研究報告;員工還可以創建小型Agent,幫助自己處理日常重復性工作。幾周前,亞馬遜在公司內部發布了Amazon Quick,目前其已擁有數十萬用戶。
![]()
其次是Amazon Connect,加曼談到在亞馬遜內部稅務團隊中的一個案例,該團隊創建了一個Agent,幫助其匯聚所有稅務數據來源、深入研究稅法政策變化。該Agent的另一個應用場景是客戶服務,可以將AI引入企業的聯絡中心。Amazon Connect業務的年度經常性收入已經超過10億美元。
五、新Agent:加速開發、優化編程、保護安全、增強可靠
加曼認為,對于試圖快速現代化其應用程序的開發團隊來說,目前最大的痛點之一就是處理技術債。在美國,技術債務每年給企業造成總計2.4萬億美元的損失,如今70%的IT預算都被用于維護遺留系統。
此前,亞馬遜云科技已經推出了AWS Transform,通過AI實現轉換流程的降本增效。在此基礎上,AWS今日推出了AWS Transform Custom,這一智能體幫助用戶創建自定義代碼轉換智能體,以實現任何代碼、API、框架、運行時或編程語言的翻譯和現代化。
![]()
例如,全球知名ERP軟件公司QAD便是用AWS Transform,將原本需要至少需要兩周才能完成轉換的項目,壓縮至3天。
今年早些時候,亞馬遜云科技發布了面向專業開發者的AI IDE “Kiro”。加曼稱,已經有數十萬開發者在使用Kiro,有開發者感嘆,用了Kiro之后,自己在過去5個月內交付的代碼,比過去10年還要多。上周,亞馬遜已經把Kiro定為該公司的官方AI開發環境。
為了進一步加強開發流程的自動化程度,亞馬遜云科技發布了全新的三個前沿智能體,讓Kiro在自主性、大規模可擴展和長期運行等領域的表現進一步增強。
Kiro Autonomous Agent是一個與開發工作流并行運行的自主開發智能體。它就像團隊的一名額外成員,能獨立處理復雜任務,讓工程師專注于核心創意。開發者只需指派一個復雜的、目標導向的任務,它能自行規劃、分解并執行所有必要步驟,直到交付可用代碼。
![]()
這一Agent還會越用越聰明,能長期、深度地理解代碼庫、團隊規范和過往決策,從每一次互動中學習,形成“集體記憶”,并應用所學知識到后續任務中。
AWS Security Agent則是一個持續、主動、內置的AI安全專家。它能在設計階段主動審查文檔,確保安全性;在編程過程中掃描代碼漏洞,并直接集成到GitHub PR中,為開發者提供即時、可操作的修復建議。
![]()
這一Agent還可以將滲透測試自動化,將傳統的、昂貴且周期長的滲透測試,轉變為可按需啟動、快速完成的自動化、持續驗證過程。
AWS DevOps Agent則將運維工作自動化,能自動診斷并修復問題。當警報觸發時,DevOps Agent會立即自動響應,診斷問題的根本原因,提供修改意見和修改方案,并交由工程師審查和批準。
六、新實例、新存儲、新數據庫、新加速、管理與治理
加曼最后用10分鐘公布了25個新發布。
![]()
7款新實例:搭載第五代AMD EPYC處理器的X8i Instances,內存增加超50%;搭載第五代AMD EPYC處理器的X8aedz Instances,計算性能是前一代X2iezn實例的兩倍;搭載第五代AMD EPYC處理器的C8a Instances,性能提升30%,性價比提升19%;搭載英特爾至強6的C8ine Instances,實例配置每個vCPU的數據包性能可比上一代C6in實例提升2.5倍;搭載第五代AMD EPYC處理器的M8azn Instances,計算性能是上一代M5zn實例的2倍。
還有兩款采用最新蘋果硬件的新實例:EC2 M3 UltraMacInstances、EC2 M4 MaxMacInstances。
面向開發者,亞馬遜云科技推出Lambda durable functions(持久函數),開發者可以利用內置的自動恢復功能構建長期運行的工作負載。
存儲方面,包括將S3最大對象大小從5TB提高到50TB,增加10倍;亞馬遜S3的數據管理功能S3 Batch Operations更新,在200億個對象的規模下,完成作業的速度提升10倍;為S3 Tables提供智能分層,節省80%存儲成本;S3 Tables支持AWS區域和賬戶間自動復制;擴展Amazon S3接入點,支持Amazon FSx for NetApp ONTAP;用于存儲和查詢向量的對象存儲S3 Vectors全面上市;利用GPU提升向量索引構建效率,速度提升10倍,僅需1/4成本。
計算與加速優化新功能,Amazon EMR Serverless提供Amazon EMR on EKS,允許用戶在不預先配置或管理存儲的情況下運行大數據工作負載。
Amazon RDS數據庫的更新包括:RDS for Oracle和RDS for SQL Server擴展存儲容量、RDS for SQL Server的CPU優化選項、對SQL Server開發者版本的支持,以及數據庫節省計劃。
管理與治理相關的新發布包括:為ECS和EC2新增GuardDuty擴展威脅檢測功能、提供近乎實時分析及風險優先級排序功能的Security Hub安全中心、CloudWatch統一數據管理和分析功能。
結語:Agent開發已成加速創新的大勢所趨
在主題演講中,加曼多次強調了Agent的重要性:Agent是企業從AI投資中看到實質性商業回報的地方。而為Agent系統、應用開發構建新的模塊,需要性能更強的AI基礎設施、推理平臺、企業數據、構建和部署Agent的工具。
Agent可自主感知業務需求并依據需求智能適配業務流程、動態調整執行策略,高效匹配業務場景的核心訴求,其已經成為釋放AI價值的重要載體。亞馬遜云科技在擴展加速計算產品線的同時,亦在不斷優化Agent開發和部署工具,推出滿足開發者多元化工作負載需求的新平臺、新工具。
據加曼回顧,今年第三財季,亞馬遜云科技的年化收入已經達到1320億美元,同比增長超20%。
過去一年,亞馬遜云科技增加了3.8GW數據中心容量。如今,亞馬遜云科技擁有全球規模最大、部署最廣泛的AI云基礎設施,全球數據中心網絡覆蓋38個地區、120個可用性區域,還宣布再增加3個地區。
亞馬遜云科技已經與全球頂尖的大模型公司建立合作,在其平臺陸續上架全球主流開源模型,下一步的重點,顯然已經是如何幫助更多客戶將Agent落地到真實業務中,產生更廣泛的商業價值。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.