網(wǎng)易首頁 > 網(wǎng)易科技 > 網(wǎng)易科技 > 正文

6 萬人涌入賭城圍觀AWS自研芯片、Nova 模型、AI 工廠全面開火

2025-12-03 08:01:30　來源: 態(tài)℃

北京舉報(bào)

分享至

AWS CEO Matt Garman：亞馬遜云科技的業(yè)務(wù)規(guī)模已達(dá)1320億美元。僅在過去一年，業(yè)務(wù)就新增了220億美元，增長超過《財(cái)富》500強(qiáng)企業(yè)中一半以上公司全年的收入規(guī)模。

AWS 2025 re:Invent 網(wǎng)易科技現(xiàn)場報(bào)道

欄目｜網(wǎng)易科技《態(tài)度》

作者｜丁廣勝

美西時(shí)間12月2日早8點(diǎn)，2025 re:Invent在拉斯維加斯開啟。現(xiàn)場火爆程度空前，很多人為了搶座甚至提起1個(gè)半小時(shí)排隊(duì)進(jìn)場。為了照顧到與會(huì)者的體驗(yàn)，現(xiàn)場屏幕長達(dá)數(shù)十米，一眼望去人山人海。

這是2025 re:Invent的關(guān)注度。從全球各地趕到的6萬人，讓拉斯維加斯進(jìn)入“AWS時(shí)間”，身著AWS文化衫的人遍及城市的各個(gè)角落。不僅僅是當(dāng)?shù)刈钪耐崴谷司频辏瑩?jù)說整個(gè)拉斯維加斯大道的很多酒店都被AWS包下。人們開玩笑說，“賭城”上次這么熱鬧還是10天前F1拉斯維加斯大獎(jiǎng)賽。

亞馬遜云科技首席執(zhí)行官M(fèi)att Garman的keynote準(zhǔn)時(shí)開場。他一口氣講了倆小時(shí)，發(fā)布了自研新模型Nova 2，推出了Agent工廠，展示了自研芯片，官宣和英偉達(dá)進(jìn)一步拓展合作。

這位2024年6月剛剛接棒的CEO極富激情，Matt Garman宣告了Agent時(shí)代的到來，他形容其為AI時(shí)代的拐點(diǎn)。

他也提醒，我們?nèi)匀惶幵?AI 所能帶來的未來的早期階段，但這項(xiàng)技術(shù)的迭代速度比我們?nèi)魏稳艘酝娺^的都要快。“AI的真正價(jià)值尚未完全釋放，不過這一切正在快速改變。”

Amazon Bedrock新增18款模型 kimi加入了

亞馬遜云服務(wù)在Amazon Bedrock平臺(tái)新增了18款開放權(quán)重模型。一句話理解Amazon Bedrock就是，這個(gè)平臺(tái)可以提供全托管服務(wù)，使企業(yè)無需管理基礎(chǔ)設(shè)施即可構(gòu)建和部署生成式 AI 應(yīng)用，直接調(diào)用各種基礎(chǔ)模型。

網(wǎng)易科技現(xiàn)場了解到， Mistral AI推出的兩套新模型，首批將在亞馬遜云平臺(tái)發(fā)布。Mistral Large 3是 Mistral AI 最先進(jìn)的開放權(quán)重模型，專為長上下文、多模態(tài)和指令可靠性優(yōu)化。

而值得國內(nèi)市場關(guān)注的是，MiniMax的M2模型、KIMI的模型也新加入了Amazon Bedrock模型陣營，可以方便國內(nèi)開發(fā)者和企業(yè)使用。

Trn3 UltraServers芯片發(fā)布搭載首款3納米AI芯片

AWS的EC2 Trn3 UltraServers正式發(fā)布，搭載AWS首款3納米AI芯片。據(jù)介紹，其計(jì)算性能較Trainium2 UltaServers提升4.4倍，能效提升4倍，內(nèi)存帶寬提升近4倍，從而以更低的運(yùn)營成本加速AI開發(fā)進(jìn)程。

Trn3 UltraServers最多可擴(kuò)展至144個(gè)Trainium3芯片，提供高達(dá)362個(gè)FP8 PFLOPs的計(jì)算能力，延遲降低4倍，從而可以更快地訓(xùn)練大型模型并實(shí)現(xiàn)大規(guī)模推理服務(wù)。

據(jù)了解，包括Anthropic、Karakuri、Metagenomics、Neto.ai、Ricoh和Splashmusic在內(nèi)的客戶通過Trainium將訓(xùn)練和推理成本降低了50%。

而在下一代Trainium4芯片方面，AWS方面表示，其設(shè)計(jì)目標(biāo)是實(shí)現(xiàn)全方位性能飛躍，AI模型訓(xùn)練速度至少提升三倍，推理請(qǐng)求量至少增加三倍。據(jù)透露，Trainium4還正在設(shè)計(jì)中支持 NVIDIA NVLink Fusion 高速芯片互連技術(shù)。

AWS AI工廠：和英偉達(dá)打通一切為了AI部署加速

全新AWS AI工廠是外界廣為關(guān)注重點(diǎn)。AWS AI工廠提供專用基礎(chǔ)設(shè)施，并結(jié)合了最新的 NVIDIA 加速計(jì)算平臺(tái)、Trainium芯片、AWS高速低延遲網(wǎng)絡(luò)和AWS AI服務(wù)。

也就是說，此后AWS的用戶可以充分利用現(xiàn)有數(shù)據(jù)中心空間、網(wǎng)絡(luò)連接及電力資源，而AWS則負(fù)責(zé)集成基礎(chǔ)設(shè)施部署與管理的復(fù)雜工作。

目標(biāo)很明確。AWS方面表示，AWS AI工廠就是AI時(shí)代的基礎(chǔ)設(shè)施。其他人不需要再重復(fù)造輪子了。

值得一提的是，AWS和 NVIDIA 正在擴(kuò)大合作。此后AWS的客戶可以無縫訪問 NVIDIA 加速計(jì)算平臺(tái)、完整的 NVIDIA AI軟件棧以及數(shù)千個(gè)GPU加速應(yīng)用程序，以提供高性能、高效率和可擴(kuò)展性，用于構(gòu)建下一代AI解決方案。

與此同時(shí)，AWS還推出了由 NVIDIA 圖形處理器驅(qū)動(dòng)的Amazon EC2實(shí)例（Amazon EC2是 AWS 的核心計(jì)算服務(wù)，用來在云端快速啟動(dòng)并彈性擴(kuò)展虛擬服務(wù)器，運(yùn)行各種應(yīng)用和工作負(fù)載）。

換句話說，AWS 正在通過 P6e-GB300超級(jí)服務(wù)器擴(kuò)展其加速計(jì)算產(chǎn)品線，該服務(wù)器采用 NVIDIA GB300 NVL72，這是 Amazon EC2中最先進(jìn)的 NVIDIA GPU 架構(gòu)。非常適合大規(guī)模的人工智能推理，支持具有推理能力的萬億參數(shù)模型在生產(chǎn)環(huán)境中運(yùn)行。

發(fā)力自研模型 Nova 2系列也來了

在AWS自研模型方面，Amazon Nova 2 Lite是一個(gè)適用于日常工作負(fù)載的快速、具有成本效益的推理模型。現(xiàn)在已經(jīng)上架Amazon Bedrock。

Nova 2 Lite支持文本、圖像、視頻、文檔作為輸入，實(shí)現(xiàn)擴(kuò)展推理和更豐富的上下文學(xué)習(xí)。Nova 2 Lite還支持?jǐn)U展思維，擴(kuò)展思維可以進(jìn)行選擇，分為低、中、高，用戶可以控制速度、智能和成本。據(jù)介紹，Nova 2 Lite可以與Nova Forge一起使用來構(gòu)建開發(fā)者自己的最佳模型。

另外，AWS還發(fā)布了Amazon Nova 2 Sonic。這是一個(gè)語音轉(zhuǎn)語音基礎(chǔ)模型，可以為應(yīng)用程序帶來自然的實(shí)時(shí)語音對(duì)話。官方介紹，Nova 2 Sonic提供更直觀、更像人類一樣的語音交互服務(wù)，是“富有表現(xiàn)力的男性和女性的聲音。”

整體來看，Amazon Nova是AWS發(fā)布的自研大模型家族，從輕量級(jí)（Micro）到旗艦級(jí)（Pro），覆蓋全場景并深度整合了云服務(wù)，是AWS在全球模型競爭中的核心武器。

Agentic AI功能上新，覆蓋四大領(lǐng)域

AWS宣布Amazon Connect推出多項(xiàng)Agentic AI新功能。覆蓋四大領(lǐng)域：可在語音與數(shù)字渠道自主執(zhí)行操作的自動(dòng)化AI Agent；可與客服代表協(xié)同工作的實(shí)時(shí)AI輔助；支持主動(dòng)互動(dòng)的預(yù)測(cè)性客戶洞察；以及用于監(jiān)控、測(cè)試與評(píng)估AI性能的全方位可觀測(cè)性工具。

舉例來看，Amazon Connect一直提供AI驅(qū)動(dòng)的輔助功能，通過分析客戶交互，實(shí)時(shí)向客服代表提供所需信息與工具。如今，Amazon Connect進(jìn)一步推出Agentic輔助，讓人類與AI實(shí)現(xiàn)真正協(xié)同。當(dāng)客服與客戶對(duì)話時(shí)，Amazon Connect會(huì)分析對(duì)話上下文與情緒，不僅提供后續(xù)動(dòng)作建議，還能主動(dòng)完成整理材料、處理常規(guī)流程等任務(wù)。

值得關(guān)注的是，Amazon Connect新增AI Agent可觀測(cè)性功能，這一功能可以為企業(yè)提供高度透明度，可以清晰呈現(xiàn) AI 的理解內(nèi)容、使用的工具以及決策過程。如此一來可以增強(qiáng)用戶對(duì)AI交互體驗(yàn)的信心，AWS方面稱，這將有利于大家放心地大規(guī)模部署AI Agent。

推出Amazon Transform全新Agent功能

AWS宣布為Amazon Transform推出全新的Agent功能。Amazon Transform的自定義功能使所有傳統(tǒng)系統(tǒng)在任意軟件、代碼、庫和框架上均可實(shí)現(xiàn)快速的大規(guī)模現(xiàn)代化。同時(shí)，Amazon Transform可將全棧Windows現(xiàn)代化的速度提升至5倍，并消除客戶高達(dá)70%的維護(hù)和許可成本。

據(jù)介紹，加拿大航空、Experian、QAD、Teamfront、湯森路透和Verisk等企業(yè)正使用Amazon Transform以減少技術(shù)債務(wù)。

據(jù)披露，截至目前，客戶已使用Amazon Transform分析約11億行代碼，節(jié)省超過81萬小時(shí)的人工工作量。

結(jié)語

在AWS re:Invent 2025，這家云巨頭不是僅僅強(qiáng)調(diào)云服務(wù)，更是要在AI基礎(chǔ)設(shè)施層面搶占領(lǐng)先。這次的發(fā)布節(jié)奏前所未有，屬于AWS的AI“全家桶”宣告來臨——全新 Trainium3 UltraServers、Amazon Bedrock 18款上新模型、自研 Nova 2模型家族、AI 工廠與 NVIDIA 深度合作，以及面向傳統(tǒng)系統(tǒng)的 Transform Agent，都意在構(gòu)建 AI 時(shí)代的“基礎(chǔ)設(shè)施底座”。

我們看到，AWS 正試圖用全棧產(chǎn)品打造一條通向AI未來的高速公路，做給大家“解放雙手”的那個(gè)人，而接下來，這一攬子新產(chǎn)品新計(jì)劃會(huì)有怎樣的市場表現(xiàn)，值得持續(xù)觀察。