一家還沒大規模出貨芯片的公司,正在試圖改寫 AI 算力的性價比公式。
近日,由哈佛大學輟學生創立的 AI 芯片公司 Etched 拿到了近 5 億美元的新一輪融資。這家初創公司估值據稱達 50 億美元,總融資接近 10 億美元。
該輪融資由 Stripes 領投,Peter Thiel、Positive Sum 和 Ribbit Capital 也參與了投資。此前的支持者還包括 Primary Venture Partners,以及前 GitHub 的 CEO 托馬斯·多姆克(Thomas Dohmke)和前 Coinbase 高管巴拉吉·斯里尼瓦桑(Balaji Srinivasan)等知名天使投資人。
有意思的是,這家公司既不做通用 GPU,也不是要完全取代英偉達。而是想把一件事做到極致:讓 Transformer 跑得更便宜。
![]()
圖丨Sohu 芯片(來源:Etched)
從 GPU 市場來看,英偉達占主導地位。據市場預測,到 2026 年底,英偉達數據中心累計銷售額將超過 5,000 億美元。 Etched 對市場的判斷是:過去幾年,計算密度(TFLOPS/mm2)僅提升了約 15%。新一代 GPU(NVIDIA B200、AMD MI300X、Intel Gaudi 3、AWS Trainium2 等)現在將兩個芯片視為一張卡,使性能“翻倍”。
現在,隨著大模型訓練放緩和推理暴漲,模型對推理時間的計算和搜索能力利用率嚴重不足,算力的需求已經不再只拼 FLOPS,而是成本、延遲和能耗的綜合比拼。借助更優秀的算法和更快的硬件,有望改善這一局面。
Etched 打造的是為 Transformer 架構的 AI 模型設計的專用定制芯片(ASIC)。Etched稱,這款名為 Sohu 的芯片是“史上速度最快的 AI 芯片”。在特定測試配置下,Sohu 在運行 Llama 70B 模型時,可實現每秒處理超過 50 萬個 token 的吞吐量,能夠構建僅靠 GPU 無法實現的產品。
“在運行文本、圖像和視頻 Transformer 時,Sohu 的速度比英偉達 Blackwell GB200 GPU 快 1 個數量級,價格也更低。”Etched 公司聯合創始人兼 CEO 加文·烏貝蒂(Gavin Uberti)在接受媒體采訪時表示,“在 Etched 給定的特定推理配置下,一臺由 8 顆 Sohu 芯片組成的服務器可以替代 160 塊 H100 GPU。對于需要專用芯片的企業來說,Sohu 將是一個更經濟、更高效、更環保的選擇。”
![]()
(來源:Etched)
盡管這對英偉達技術是一種挑戰,但該公司的目標并不是全面取代英偉達,而是“繞過”后者的技術路線。與通用型 GPU 不同的是, Sohu 采取了一種高度專業化的策略:旨在降低能耗的同時,比通用 GPU 更高效地運行 Transformer 模型。
如今,AI 模型的訓練成本超過 10 億美元,而其推理應用規模可能會超過 100 億美元。在如此龐大的規模下,1% 的性能提升足以支撐一個耗資 5,000 萬至 1 億美元的定制芯片項目。
![]()
(來源:Etched)
據 Etched 官網,這款芯片用于生產級推理,在密集模型、稀疏模態、擴散等場景下,每美元(以及瓦)的計算效率都提高 1 個數量級。如果成功,這意味著在推動規模之外,也能夠推動 AI 硬件的發展。
![]()
(來源:Etched)
公開資料顯示,Sohu 采用臺積電 4nm 工藝制造,并從上游供應商取得 HBM 內存和服務器硬件供應,來支持芯片與服務器集成的生產能力。
實際上,很多初創公司和科技巨頭都在開發專門運行 AI 模型的芯片,即推理芯片。例如,Meta 的 MTIA,亞馬遜的 Graviton 和 Inferentia 等。
但 Etched 芯片的獨特之處在于“做減法”:它僅專注于運行 Transformer 模型,而無法運行包括 CNN、LSTM、SSM 在內的其他 AI 模型。也正因為這樣,它可以避免與此無關的硬件組件以及其他類型工作負載的芯片所帶來的軟件開銷。
![]()
圖丨 Sohu 芯片(來源:Etched)
此外,Etched 還與 Decart 公司合作推出了 AI 生成游戲 Oasis,可以將其理解為非官方的《我的世界》,游戲畫面在玩家交互過程中由生成模型實時合成,而非傳統的預制資產渲染。Etched 稱,這款模型在 Sohu 上的運行速度提升了 10 倍以上。

(來源:Etched)
2022 年,加文·烏貝蒂(Gavin Uberti)和 Chris Zhu 從哈佛大學輟學,創立了 Etched,公司總部位于美國加州圣何塞。之后,聯合創始人兼總裁羅伯特·瓦亨(Robert Wachen)和 CFO 馬克·羅斯(Mark Ross)也加入了他們。
![]()
圖丨左至右依次為:羅伯特·瓦亨、加文·烏貝蒂與 Chris Zhu
公司聯合創始人兼 CEO 加文·烏貝蒂(Gavin Uberti)曾在哈佛大學擔任數學研究員兼人工智能編譯器專家,為 Apache TVM 編寫了 Cortex-M 后端。聯合創始人 Chris Zhu 曾擔任哈佛數學與高性能計算研究員、蒂爾學者(Thiel Fellow),發表過組合數學領域的相關研究。
二人是哈佛大學校友,他們分別攻讀數學和計算機科學課程。2022 年年底,他們在進行研究時,意識到在運行生成式 AI 模型時,每美元的性能可以達到傳統圖形處理器的 140 倍。正是看到了窗口期極短的工程機會,他們決定利用這一發現做更大的事情——從哈佛退學成立公司。
聯合創始人兼總裁羅伯特·瓦亨(Robert Wachen)曾擔任創業孵化器 Prod 的聯合創始人,旗下孵化企業估值超過 500 億美元。CTO 馬克·羅斯(Mark Ross)曾任 Cypress 公司 CTO(該公司以 90 億美元被收購)。
加文·烏貝蒂和 Chris Zhu 此前在接受媒體采訪時曾表示,雖然現在只生產能夠運行生成文本的人工智能語言模型的芯片,但整個公司不應該僅僅依賴于單一產品。公司有很多新技術,包括圖像和視頻生成以及蛋白質折疊模擬等。Etched 更長遠的愿景是,為不同類型的 AI 模型制造其他芯片。
![]()
圖丨Etched 核心成員(來源:Etched)
目前,也有相關公司展示了與 Etched 類似的思路。例如,AI 芯片初創公司 Perceive 展示了一款具備 Transformer 硬件加速功能的處理器 Ergo 2,可在對參數超過 1 億的 Transformer 模型進行邊緣推理、以更高幀速率處理視頻,以及同時推理多個大型神經網絡。
智能芯片公司 Groq 的 LPU(Language Processing Unit)是專為推理場景量身定制的 AI ASIC,目標是高效率、低延遲地運行大模型(Transformer 推理)。
此外,AI 芯片公司 Tenstorrent 基于 RISC-V 架構開發高度可擴展的 AI 處理器(如 Grayskull/Wormhole/Blackhole),也在積極尋找 AI 推理或訓練中 GPU 之外的替代方案。
盡管前景美好,但也需要看到的是,Etched 的成功是押注在 Transformer 模型繼續扮演主流架構的角色。未來如果這個假設發生變化,那所有一切可能要再次來過。可以說,Etched 賭的不是一顆芯片,而是一種時代判斷:AI 的未來,或許并不需要那么多“全能”,而只要“剛剛好”就足夠了。
參考資料:
https://x.com/Etched/status/1805625693113663834
https://techfundingnews.com/nvidia-rival-ai-chip-maker-etched-founded-by-harvard-dropouts-lands-500m-at-5b-valuation/
https://www.canopy.space/members/member-profile-etched/
https://www.embedded.com/ai-chip-features-hardware-support-for-transformer-models/
https://techcrunch.com/2024/06/25/etched-is-building-an-ai-chip-that-only-runs-transformer-models/
https://siliconangle.com/2024/06/25/transformer-model-chipmaker-etched-ai-raises-120m-challenge-nvidias-market-dominance/
https://www.cnbc.com/2024/06/25/etched-raises-120-million-to-build-chip-to-take-on-nvidia-in-ai.html
運營/排版:何晨龍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.