![]()
![]()
(亞馬遜AWS CEO馬特·加曼在re:Invent 2025發布Trainium 3)
在單卡性能不足的情況下,亞馬遜AWS通過提升服務器集群算力、帶寬的方式縮小了和英偉達的差距
文|《財經》研究員 吳俊宇
編輯|劉以秦
作者按:re:Invent是全球最大云廠商亞馬遜AWS一年一度的戰略和技術大會。re:Invent 2025于12月1日-5日在美國拉斯維加斯召開。我們在現場,記錄美國云計算行業這一年最新的變化。
以下是正文:
美國西部時間12月3日,全球最大云計算廠商亞馬遜AWS在re:Invent 2025發布了新款AI芯片和新款自研模型。
亞馬遜AWS CEO(首席執行官)馬特·加曼(Matt Garman)宣布,亞馬遜AWS自研的AI芯片Trainium 3已經上線,這是一款3nm(納米)工藝制程的芯片。亞馬遜AWS下一代AI芯片Trainium 4也在研發設計階段。
亞馬遜AWS還發布了Amazon Nova 2系列的自研模型。其中包括Lite(輕量化版)、Pro(專業版)、Sonic(聲音模型)、Omni(多模態推理模型)這四款模型。目前Amazon Nova系列已有數萬企業客戶,包括海信、印孚瑟斯(印度第二大IT企業)等。
![]()
亞馬遜AWS已部署百萬枚自研AI芯片
馬特·加曼提到,目前亞馬遜已經部署了超過100萬枚Trainium系列AI芯片。Trainium芯片每年為亞馬遜AWS帶來了數十億美元的收入。
部署這些芯片需要龐大的電力資源。亞馬遜AWS過去12個月新增了3.8GW(GW,即吉瓦是功率單位。1GW算力集群可容納20萬枚英偉達GB200芯片)算力。亞馬遜AWS目前的算力電力容量是2022年的兩倍,2027年還將再次翻倍。
Trainium 3每兆瓦電力能產生的Token(詞元,大模型算力計量單位,一個Token可以是單詞、標點、數字、符號等)數量是上一代芯片的五倍。亞馬遜AWS公布的信息顯示,Trainium 3與其他產品相比,訓練成本最多可降低50%。
亞馬遜發布的路線圖顯示,亞馬遜AWS下一代AI芯片Trainium 4在FP4(一種數據精度,比FP8、FP16更節省算力)計算精度下的性能相比Trainium 3將提升6倍以上。
Trainium系列芯片不直接對外銷售,而是通過云服務的方式提供給企業客戶。目前使用Trainium系列芯片的企業包括大模型創業公司Anthropic、數據庫公司databricks等企業。其中Anthropic 2025年底將使用超過100萬個 Trainium 2的算力集群,來運行它的Claude系列模型。
![]()
亞馬遜AWS表示,搭載Trainium 3的Trn3 UltraServer服務器,集成了144枚芯片,總算力高達362PFlops(每秒浮點運算次數)。它的整機性能甚至超過了英偉達的旗艦芯片服務器Blackwell GB200 NVL72。但按單卡性能計算,Trainium 3僅為GB200的56%。
但這是亞馬遜用系統堆料彌補單卡差距。在單卡性能不足的情況下,亞馬遜AWS通過提升服務器集群算力、帶寬的方式縮小了和英偉達的差距。
![]()
(Trainium3 UltraServer服務器機柜)
一位亞馬遜AWS人士曾對《財經》表示,從2021年自研AI芯片至今,亞馬遜AWS已經堅持了五年。為了降低算力成本,減少對英偉達的替代,這個戰略不可能動搖。
亞馬遜AWS的自研芯片戰略可以追溯到2018年。當時在英特爾、AMD的CPU(中央處理器)占主流的階段,亞馬遜AWS就開始自研Graviton系列CPU芯片。目前Graviton系列芯片歷經7年,已發展至第四代。
近三年,Graviton系列芯片已經成功替代英特爾、AMD,在亞馬遜AWS新增CPU算力中占比超過50%(詳見。Graviton系列芯片的客戶甚至包括蘋果、全球最大的ERP(企業資源管理)軟件企業SAP等公司。
![]()
云廠自研芯片,替代英偉達
亞馬遜AWS等云廠商自研AI芯片的一個重要目的是,降低芯片的TCO(總擁有成本)。
截至2025年,英偉達在全球AI芯片市場占據超過60%的市場份額。2025年英偉達的綜合毛利率69%。這意味著,亞馬遜AWS、微軟Azure、谷歌GCP等云廠商每采購一枚英偉達的芯片,60%以上的成本都變成了英偉達的利潤。
一位資深算法工程師今年10月曾對《財經》表示,英偉達在AI芯片市場賺取了超額利潤。目前大部分科技公司都不想完全依賴英偉達的AI芯片。其中一些科技公司選擇了ASIC(專用集成電路)技術路線,這可以根據自己的業務特點高度定制AI芯片。這為替代英偉達提供了可能性。
云廠商的自研芯片一旦實現量產,它的邊際成本會逐漸降低,逐漸接近臺積電的代工成本。在理想情況下,甚至可以只用英偉達同等規格芯片三分之一的價格獲得自研芯片。這也是亞馬遜、谷歌、阿里巴巴、百度都在自研AI芯片的重要原因。
今年11月28日,全球半導體分析和研究機構SemiAnalysis在一份有關谷歌TPU v7(張量處理單元,即谷歌自研的AI芯片)芯片的成本分析報告中詳細計算了谷歌TPU v7的運行成本。
谷歌內部使用的TPU v7運行成本為1.28美元/小時,只有英偉達GB200(英偉達在銷旗艦芯片)2.28美元/小時的56%。谷歌在云上對外服務客戶時需要加上利潤空間,屆時TPU v7的運行成本僅為1.6美元/小時的成本,依舊只有英偉達GB200的51%。
![]()
目前,成功自研AI芯片并規模化替代英偉達的云廠商包括亞馬遜、谷歌。谷歌的TPU的出貨量甚至比亞馬遜的Trainium系列還要高。
摩根士丹利2025年11月一份名為《全球AI供應鏈更新》的研報稱,谷歌TPU系列芯片在2023年—2025年的出貨量分別是50萬枚、240萬枚、175萬枚。該報告預測,谷歌在2026年TPU出貨量將達到300萬枚。
亞馬遜Trainium系列超過100萬枚的部署量,谷歌TPU系列超過200萬枚/年的部署量,意味著這兩家云廠商已經在英偉達占據主導的市場中,撕開了一道口子。
2025年,英偉達AI芯片年出貨量超過600萬枚。今年10月29日,英偉達創始人黃仁勛曾在GTC華盛頓特區峰會披露英偉達的芯片銷量情況。
上一代Hopper系列(H100、H200、H20系列),2023年-2025年整個生命周期(約為2023年初-2025年10月)共交付了400萬枚GPU(圖形處理器)。
英偉達目前主力旗艦芯片Blackwell系列(GB200、GB300)量產的三個半—四個季度(約為2024年10月中旬-2025年10月),共交付了600萬枚。接下來的五個季度,英偉達還有2000萬枚Blackwell和Rubin(英偉達下一代旗艦芯片)系列芯片需要交付。
2025年9月,高盛曾在研報中預估,2025年-2027年全球AI芯片需求量分別為1000萬顆、1400萬顆、1700萬顆。其中,英偉達的GPU芯片市場占比將從62%降至55%。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.