![]()
AWS 2025 re:Invent 網(wǎng)易科技現(xiàn)場報(bào)道
欄目|網(wǎng)易科技《態(tài)度》
作者|丁廣勝
美西時(shí)間12月2日早8點(diǎn),2025 re:Invent在拉斯維加斯開啟。現(xiàn)場火爆程度空前,很多人為了搶座甚至提起1個(gè)半小時(shí)排隊(duì)進(jìn)場。為了照顧到與會(huì)者的體驗(yàn),現(xiàn)場屏幕長達(dá)數(shù)十米,一眼望去人山人海。
這是2025 re:Invent的關(guān)注度。從全球各地趕到的6萬人,讓拉斯維加斯進(jìn)入“AWS時(shí)間”,身著AWS文化衫的人遍及城市的各個(gè)角落。不僅僅是當(dāng)?shù)刈钪耐崴谷司频辏瑩?jù)說整個(gè)拉斯維加斯大道的很多酒店都被AWS包下。人們開玩笑說,“賭城”上次這么熱鬧還是10天前F1拉斯維加斯大獎(jiǎng)賽。
亞馬遜云科技首席執(zhí)行官M(fèi)att Garman的keynote準(zhǔn)時(shí)開場。他一口氣講了倆小時(shí),發(fā)布了自研新模型Nova 2,推出了Agent工廠,展示了自研芯片,官宣和英偉達(dá)進(jìn)一步拓展合作。
這位2024年6月剛剛接棒的CEO極富激情,Matt Garman宣告了Agent時(shí)代的到來,他形容其為AI時(shí)代的拐點(diǎn)。
他也提醒,我們?nèi)匀惶幵?AI 所能帶來的未來的早期階段,但這項(xiàng)技術(shù)的迭代速度比我們?nèi)魏稳艘酝娺^的都要快。“AI的真正價(jià)值尚未完全釋放,不過這一切正在快速改變。”
Amazon Bedrock新增18款模型 kimi加入了
亞馬遜云服務(wù)在Amazon Bedrock平臺(tái)新增了18款開放權(quán)重模型。一句話理解Amazon Bedrock就是,這個(gè)平臺(tái)可以提供全托管服務(wù),使企業(yè)無需管理基礎(chǔ)設(shè)施即可構(gòu)建和部署生成式 AI 應(yīng)用,直接調(diào)用各種基礎(chǔ)模型。
![]()
網(wǎng)易科技現(xiàn)場了解到, Mistral AI推出的兩套新模型,首批將在亞馬遜云平臺(tái)發(fā)布。Mistral Large 3是 Mistral AI 最先進(jìn)的開放權(quán)重模型,專為長上下文、多模態(tài)和指令可靠性優(yōu)化。
![]()
而值得國內(nèi)市場關(guān)注的是,MiniMax的M2模型、KIMI的模型也新加入了Amazon Bedrock模型陣營,可以方便國內(nèi)開發(fā)者和企業(yè)使用。
Trn3 UltraServers芯片發(fā)布 搭載首款3納米AI芯片
AWS的EC2 Trn3 UltraServers正式發(fā)布,搭載AWS首款3納米AI芯片。據(jù)介紹,其計(jì)算性能較Trainium2 UltaServers提升4.4倍,能效提升4倍,內(nèi)存帶寬提升近4倍,從而以更低的運(yùn)營成本加速AI開發(fā)進(jìn)程。
Trn3 UltraServers最多可擴(kuò)展至144個(gè)Trainium3芯片,提供高達(dá)362個(gè)FP8 PFLOPs的計(jì)算能力,延遲降低4倍,從而可以更快地訓(xùn)練大型模型并實(shí)現(xiàn)大規(guī)模推理服務(wù)。
![]()
據(jù)了解,包括Anthropic、Karakuri、Metagenomics、Neto.ai、Ricoh和Splashmusic在內(nèi)的客戶通過Trainium將訓(xùn)練和推理成本降低了50%。
而在下一代Trainium4芯片方面,AWS方面表示,其設(shè)計(jì)目標(biāo)是實(shí)現(xiàn)全方位性能飛躍,AI模型訓(xùn)練速度至少提升三倍,推理請(qǐng)求量至少增加三倍。據(jù)透露,Trainium4還正在設(shè)計(jì)中支持 NVIDIA NVLink Fusion 高速芯片互連技術(shù)。
AWS AI工廠:和英偉達(dá)打通 一切為了AI部署加速
全新AWS AI工廠是外界廣為關(guān)注重點(diǎn)。AWS AI工廠提供專用基礎(chǔ)設(shè)施,并結(jié)合了最新的 NVIDIA 加速計(jì)算平臺(tái)、Trainium芯片、AWS高速低延遲網(wǎng)絡(luò)和AWS AI服務(wù)。
也就是說,此后AWS的用戶可以充分利用現(xiàn)有數(shù)據(jù)中心空間、網(wǎng)絡(luò)連接及電力資源,而AWS則負(fù)責(zé)集成基礎(chǔ)設(shè)施部署與管理的復(fù)雜工作。
![]()
目標(biāo)很明確。AWS方面表示,AWS AI工廠就是AI時(shí)代的基礎(chǔ)設(shè)施。其他人不需要再重復(fù)造輪子了。
值得一提的是,AWS和 NVIDIA 正在擴(kuò)大合作。此后AWS的客戶可以無縫訪問 NVIDIA 加速計(jì)算平臺(tái)、完整的 NVIDIA AI軟件棧以及數(shù)千個(gè)GPU加速應(yīng)用程序,以提供高性能、高效率和可擴(kuò)展性,用于構(gòu)建下一代AI解決方案。
![]()
與此同時(shí),AWS還推出了由 NVIDIA 圖形處理器驅(qū)動(dòng)的Amazon EC2實(shí)例(Amazon EC2是 AWS 的核心計(jì)算服務(wù),用來在云端快速啟動(dòng)并彈性擴(kuò)展虛擬服務(wù)器,運(yùn)行各種應(yīng)用和工作負(fù)載)。
換句話說,AWS 正在通過 P6e-GB300超級(jí)服務(wù)器擴(kuò)展其加速計(jì)算產(chǎn)品線,該服務(wù)器采用 NVIDIA GB300 NVL72,這是 Amazon EC2中最先進(jìn)的 NVIDIA GPU 架構(gòu)。非常適合大規(guī)模的人工智能推理,支持具有推理能力的萬億參數(shù)模型在生產(chǎn)環(huán)境中運(yùn)行。
發(fā)力自研模型 Nova 2系列也來了
在AWS自研模型方面,Amazon Nova 2 Lite是一個(gè)適用于日常工作負(fù)載的快速、具有成本效益的推理模型。現(xiàn)在已經(jīng)上架Amazon Bedrock。
Nova 2 Lite支持文本、圖像、視頻、文檔作為輸入,實(shí)現(xiàn)擴(kuò)展推理和更豐富的上下文學(xué)習(xí)。Nova 2 Lite還支持?jǐn)U展思維,擴(kuò)展思維可以進(jìn)行選擇,分為低、中、高,用戶可以控制速度、智能和成本。據(jù)介紹,Nova 2 Lite可以與Nova Forge一起使用來構(gòu)建開發(fā)者自己的最佳模型。
![]()
另外,AWS還發(fā)布了Amazon Nova 2 Sonic。這是一個(gè)語音轉(zhuǎn)語音基礎(chǔ)模型,可以為應(yīng)用程序帶來自然的實(shí)時(shí)語音對(duì)話。官方介紹,Nova 2 Sonic提供更直觀、更像人類一樣的語音交互服務(wù),是“富有表現(xiàn)力的男性和女性的聲音。”
整體來看,Amazon Nova是AWS發(fā)布的自研大模型家族,從輕量級(jí)(Micro)到旗艦級(jí)(Pro),覆蓋全場景并深度整合了云服務(wù),是AWS在全球模型競爭中的核心武器。
Agentic AI功能上新,覆蓋四大領(lǐng)域
AWS宣布Amazon Connect推出多項(xiàng)Agentic AI新功能。覆蓋四大領(lǐng)域:可在語音與數(shù)字渠道自主執(zhí)行操作的自動(dòng)化AI Agent;可與客服代表協(xié)同工作的實(shí)時(shí)AI輔助;支持主動(dòng)互動(dòng)的預(yù)測(cè)性客戶洞察;以及用于監(jiān)控、測(cè)試與評(píng)估AI性能的全方位可觀測(cè)性工具。
舉例來看,Amazon Connect一直提供AI驅(qū)動(dòng)的輔助功能,通過分析客戶交互,實(shí)時(shí)向客服代表提供所需信息與工具。如今,Amazon Connect進(jìn)一步推出Agentic輔助,讓人類與AI實(shí)現(xiàn)真正協(xié)同。當(dāng)客服與客戶對(duì)話時(shí),Amazon Connect會(huì)分析對(duì)話上下文與情緒,不僅提供后續(xù)動(dòng)作建議,還能主動(dòng)完成整理材料、處理常規(guī)流程等任務(wù)。
值得關(guān)注的是,Amazon Connect新增AI Agent可觀測(cè)性功能,這一功能可以為企業(yè)提供高度透明度,可以清晰呈現(xiàn) AI 的理解內(nèi)容、使用的工具以及決策過程。如此一來可以增強(qiáng)用戶對(duì)AI交互體驗(yàn)的信心,AWS方面稱,這將有利于大家放心地大規(guī)模部署AI Agent。
推出Amazon Transform全新Agent功能
AWS宣布為Amazon Transform推出全新的Agent功能。Amazon Transform的自定義功能使所有傳統(tǒng)系統(tǒng)在任意軟件、代碼、庫和框架上均可實(shí)現(xiàn)快速的大規(guī)模現(xiàn)代化。同時(shí),Amazon Transform可將全棧Windows現(xiàn)代化的速度提升至5倍,并消除客戶高達(dá)70%的維護(hù)和許可成本。
![]()
據(jù)介紹,加拿大航空、Experian、QAD、Teamfront、湯森路透和Verisk等企業(yè)正使用Amazon Transform以減少技術(shù)債務(wù)。
據(jù)披露,截至目前,客戶已使用Amazon Transform分析約11億行代碼,節(jié)省超過81萬小時(shí)的人工工作量。
結(jié)語
在AWS re:Invent 2025,這家云巨頭不是僅僅強(qiáng)調(diào)云服務(wù),更是要在AI基礎(chǔ)設(shè)施層面搶占領(lǐng)先。這次的發(fā)布節(jié)奏前所未有,屬于AWS的AI“全家桶”宣告來臨——全新 Trainium3 UltraServers、Amazon Bedrock 18款上新模型、自研 Nova 2模型家族、AI 工廠與 NVIDIA 深度合作,以及面向傳統(tǒng)系統(tǒng)的 Transform Agent,都意在構(gòu)建 AI 時(shí)代的“基礎(chǔ)設(shè)施底座”。
我們看到,AWS 正試圖用全棧產(chǎn)品打造一條通向AI未來的高速公路,做給大家“解放雙手”的那個(gè)人,而接下來,這一攬子新產(chǎn)品新計(jì)劃會(huì)有怎樣的市場表現(xiàn),值得持續(xù)觀察。
