向量數據庫迎勁敵?AWS S3 Vectors成本降90%
向量數據庫在人工智能發展初期成為核心技術基礎,而隨著大型自然語言模型(LLM)的普及,向量作為其數據的數值表示,已逐漸成為數據庫中的常規數據類型,并發展出一種類型的數據庫——向量數據庫。
如今,亞馬遜云服務(AWS)推出Amazon S3 Vectors,為云對象存儲注入原生向量存儲與相似性搜索能力,再度改寫行業格局。
Amazon S3作為AWS旗下廣泛應用的云對象存儲服務,是數據湖與湖屋部署的核心組件。此次新增的S3 Vectors功能,允許用戶直接在S3中存儲向量嵌入,無需遷移至專用基礎設施向量數據庫,即可支持語義搜索、檢索增強生成(RAG)及AI代理工作流。
AWS宣稱,該服務相比專業向量數據庫解決方案,可將存儲與查詢的總成本降低高達90%。
那么,S3 Vectors能否真正替代專業向量數據庫呢?
![]()
1. 從預覽到通用,S3 Vectors為何受青睞?
Amazon S3 Vectors于今年7月首次推出預覽版,初始單一索引容量為5000萬個向量;在通用可用版本(GA)發布后,這一容量大幅提升至20億個,單個S3存儲桶最高可支持20萬億個向量。
預覽版發布后的4個月內,客戶已創建超25萬個向量索引,導入向量總量突破400億個。
通用版的規模升級,讓企業得以將全量向量數據集整合至單一索引,無需分散部署。同時,AWS根據預覽期收集的客戶反饋,優化了核心性能:頻繁查詢延遲降至100毫秒以內,稀有查詢1秒內可完成;最大搜索結果數從30個提升至100個,單向量更新支持每秒最多1000次PUT交易。
目前,S3 Vectors的核心用例包括混合搜索、代理內存擴展及現有數據語義層創建。例如預覽客戶March Networks借助該服務,實現大規模視頻與照片的智能處理,既經濟存儲了數十億向量嵌入數據,又通過與亞馬遜Bedrock的內置集成,輕松融入生成式AI工作流。
2. S3 Vectors能取代專業向量數據庫嗎?
首先AWS S3 Vectors的定位是互補而非替代。
盡管S3 Vectors具備強大的向量處理能力,但AWS明確將其定位為互補存儲層,而非專業向量數據庫的直接替代品。兩者的選擇核心取決于應用對延遲的需求,可通過“性能分級”明確邊界:
若應用需超快響應(如實時交互場景),Amazon OpenSearch等專業向量數據庫仍是最優選擇;
若用于語義層創建、代理內存擴展等對延遲容忍度較高的場景,S3 Vectors憑借成本優勢更具適配性。
這一邏輯與數據湖的應用模式相似:企業會繼續使用Amazon Aurora等事務數據庫處理核心業務負載,同時借助S3的耐用性、可擴展性與成本經濟性,承擔存儲與分析任務,向量存儲的發展也將遵循這一“分層協作”路徑。
其次,向量數據庫廠商認為兩者性能差距顯著。
專業向量數據庫提供商如Pinecone、Weaviate、Qdrant、Chroma等指出,其專業的向量數據庫產品與S3 Vectors的“存儲為中心”模式存在本質性能差距。這些廠商通過先進索引算法、實時更新及延遲敏感優化,已形成成熟的生產級部署能力。
Pinecone產品副總裁Jeff Zhu表示,該公司早在S3 Vectors推出前便已知曉相關項目,并不認為其在大規模場景下具備直接成本效益。例如某大型電商客戶使用Pinecone處理14億向量的推薦場景,實現了p50=26毫秒、p99=60毫秒的低延遲,且每秒查詢量(QPS)達5700萬,這是S3 Vectors當前難以企及的。
3. 分析師分歧:向量存儲的未來是功能還是產品?
S3 Vectors的發布重新引發行業爭論:向量搜索究竟是獨立產品類別,還是將被云平臺整合為標準化功能?
Constellation Research分析師Holger Mueller認為,S3 Vectors已對獨立向量數據庫供應商構成競爭威脅,向量本質上是一種“功能”而非“產品”。AWS的核心優勢在于消除數據流動成本——S3已存儲大量企業數據,原生向量支持無需額外數據遷移,這一特性深受CxO群體青睞。
而Gartner杰出副總裁分析師Ed Anderson則持折中觀點:AWS將通過S3 Vectors實現業務增長,提升客戶對S3的依賴度,甚至可能讓部分企業放棄專用向量數據庫,但這并不意味著向量數據庫的終結。對于低延遲、高性能需求場景,專業向量數據庫仍不可或缺。
AWS自身也認可這種互補關系,并表示將持續優化S3 Vectors的規模與性能。正如AWS相關負責人所言:“我們對S3 Vectors的開發才剛剛起步,就像優化視頻和Parquet文件的讀寫性能一樣,我們也會持續提升向量數據的處理能力。”
4. 企業如何選擇?基于性能分級的向量存儲部署
面對兩種技術路徑,企業架構師的核心決策依據是工作負載的性能需求,可采用“分層部署”或“混合模式”:
S3 Vectors適用場景:容忍100毫秒延遲的工作負載,包括大型文檔語義搜索、代理內存系統、向量嵌入批處理分析、后臺RAG上下文檢索等。對于已深度應用AWS基礎設施的企業,其大規模場景下的成本優勢極具吸引力。
專業向量數據庫適用場景:延遲敏感型應用,包括實時推薦引擎、高吞吐量并發查詢(每秒數千條)、用戶交互式應用(需同步等待結果)、性能優先級高于成本的核心業務負載。
混合模式:對于同時存在兩種工作負載的企業,可參考數據湖的應用邏輯——用專業向量數據庫處理性能關鍵型查詢,用S3 Vectors承擔大規模存儲與非實時任務。
核心結論并非“是否替換現有基礎設施”,而是“如何根據工作負載需求,跨性能層級設計向量存儲架構”,實現成本與性能的最優平衡。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.