網易首頁 > 網易號 > 正文申請入駐

AWS S3 Vectors來了：便宜90%，向量數據庫顛覆還是協作？

2026-01-05 16:03:46　來源: 數據Wave

北京舉報

分享至

向量數據庫迎勁敵？AWS S3 Vectors成本降90%

向量數據庫在人工智能發展初期成為核心技術基礎，而隨著大型自然語言模型（LLM）的普及，向量作為其數據的數值表示，已逐漸成為數據庫中的常規數據類型，并發展出一種類型的數據庫——向量數據庫。

如今，亞馬遜云服務（AWS）推出Amazon S3 Vectors，為云對象存儲注入原生向量存儲與相似性搜索能力，再度改寫行業格局。

Amazon S3作為AWS旗下廣泛應用的云對象存儲服務，是數據湖與湖屋部署的核心組件。此次新增的S3 Vectors功能，允許用戶直接在S3中存儲向量嵌入，無需遷移至專用基礎設施向量數據庫，即可支持語義搜索、檢索增強生成（RAG）及AI代理工作流。

AWS宣稱，該服務相比專業向量數據庫解決方案，可將存儲與查詢的總成本降低高達90%。

那么，S3 Vectors能否真正替代專業向量數據庫呢？

1. 從預覽到通用，S3 Vectors為何受青睞？

Amazon S3 Vectors于今年7月首次推出預覽版，初始單一索引容量為5000萬個向量；在通用可用版本（GA）發布后，這一容量大幅提升至20億個，單個S3存儲桶最高可支持20萬億個向量。

預覽版發布后的4個月內，客戶已創建超25萬個向量索引，導入向量總量突破400億個。

通用版的規模升級，讓企業得以將全量向量數據集整合至單一索引，無需分散部署。同時，AWS根據預覽期收集的客戶反饋，優化了核心性能：頻繁查詢延遲降至100毫秒以內，稀有查詢1秒內可完成；最大搜索結果數從30個提升至100個，單向量更新支持每秒最多1000次PUT交易。

目前，S3 Vectors的核心用例包括混合搜索、代理內存擴展及現有數據語義層創建。例如預覽客戶March Networks借助該服務，實現大規模視頻與照片的智能處理，既經濟存儲了數十億向量嵌入數據，又通過與亞馬遜Bedrock的內置集成，輕松融入生成式AI工作流。

2. S3 Vectors能取代專業向量數據庫嗎？

首先AWS S3 Vectors的定位是互補而非替代。

盡管S3 Vectors具備強大的向量處理能力，但AWS明確將其定位為互補存儲層，而非專業向量數據庫的直接替代品。兩者的選擇核心取決于應用對延遲的需求，可通過“性能分級”明確邊界：

若應用需超快響應（如實時交互場景），Amazon OpenSearch等專業向量數據庫仍是最優選擇；

若用于語義層創建、代理內存擴展等對延遲容忍度較高的場景，S3 Vectors憑借成本優勢更具適配性。

這一邏輯與數據湖的應用模式相似：企業會繼續使用Amazon Aurora等事務數據庫處理核心業務負載，同時借助S3的耐用性、可擴展性與成本經濟性，承擔存儲與分析任務，向量存儲的發展也將遵循這一“分層協作”路徑。

其次，向量數據庫廠商認為兩者性能差距顯著。

專業向量數據庫提供商如Pinecone、Weaviate、Qdrant、Chroma等指出，其專業的向量數據庫產品與S3 Vectors的“存儲為中心”模式存在本質性能差距。這些廠商通過先進索引算法、實時更新及延遲敏感優化，已形成成熟的生產級部署能力。

Pinecone產品副總裁Jeff Zhu表示，該公司早在S3 Vectors推出前便已知曉相關項目，并不認為其在大規模場景下具備直接成本效益。例如某大型電商客戶使用Pinecone處理14億向量的推薦場景，實現了p50=26毫秒、p99=60毫秒的低延遲，且每秒查詢量（QPS）達5700萬，這是S3 Vectors當前難以企及的。

3. 分析師分歧：向量存儲的未來是功能還是產品？

S3 Vectors的發布重新引發行業爭論：向量搜索究竟是獨立產品類別，還是將被云平臺整合為標準化功能？

Constellation Research分析師Holger Mueller認為，S3 Vectors已對獨立向量數據庫供應商構成競爭威脅，向量本質上是一種“功能”而非“產品”。AWS的核心優勢在于消除數據流動成本——S3已存儲大量企業數據，原生向量支持無需額外數據遷移，這一特性深受CxO群體青睞。

而Gartner杰出副總裁分析師Ed Anderson則持折中觀點：AWS將通過S3 Vectors實現業務增長，提升客戶對S3的依賴度，甚至可能讓部分企業放棄專用向量數據庫，但這并不意味著向量數據庫的終結。對于低延遲、高性能需求場景，專業向量數據庫仍不可或缺。

AWS自身也認可這種互補關系，并表示將持續優化S3 Vectors的規模與性能。正如AWS相關負責人所言：“我們對S3 Vectors的開發才剛剛起步，就像優化視頻和Parquet文件的讀寫性能一樣，我們也會持續提升向量數據的處理能力。”

4. 企業如何選擇？基于性能分級的向量存儲部署

面對兩種技術路徑，企業架構師的核心決策依據是工作負載的性能需求，可采用“分層部署”或“混合模式”：

S3 Vectors適用場景：容忍100毫秒延遲的工作負載，包括大型文檔語義搜索、代理內存系統、向量嵌入批處理分析、后臺RAG上下文檢索等。對于已深度應用AWS基礎設施的企業，其大規模場景下的成本優勢極具吸引力。

專業向量數據庫適用場景：延遲敏感型應用，包括實時推薦引擎、高吞吐量并發查詢（每秒數千條）、用戶交互式應用（需同步等待結果）、性能優先級高于成本的核心業務負載。

混合模式：對于同時存在兩種工作負載的企業，可參考數據湖的應用邏輯——用專業向量數據庫處理性能關鍵型查詢，用S3 Vectors承擔大規模存儲與非實時任務。

核心結論并非“是否替換現有基礎設施”，而是“如何根據工作負載需求，跨性能層級設計向量存儲架構”，實現成本與性能的最優平衡。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.