從ChatGPT問世,到Agentic AI(代理式AI)逐步“照進現實”,新一輪AI技術快速發展的背后,對底層基礎設施建設也提出了新的要求。
當OpenAI的GPT-4開始展現出自主任務分解能力,當AutoGPT、Devin等智能體能夠獨立完成復雜工作流程,一個根本性問題擺在整個AI產業面前:這些有記憶、會反思、能行動的Agent,究竟該把它們的“海馬體”存放在哪里?傳統數據庫的磁盤I/O、精確匹配與靜態架構,在高頻讀寫、語義模糊、成本敏感的Agentic AI時代顯得格格不入。向量數據庫,這個曾被視為AI“錦上添花”的技術,正迅速從幕后走向臺前,成為支撐下一代智能體系統的關鍵基礎設施。
Agentic AI對數據庫提出了新要求
生成式AI以內容創造為核心,Agentic AI以自主決策交互為特征,二者的快速演進推動向量數據庫從基礎存儲檢索工具向AI能力基座升級,催生出在數據處理、性能表現、功能適配等多維度的全新需求,據Gartner預測,2025年Agentic AI市場規模將突破千億美元,年復合增長率超65%。這一爆發式增長背后,是向量數據庫技術的持續突破。
2023年初,當ChatGPT掀起第一波大模型熱潮時,市場對向量數據庫的認知還停留在外掛知識庫層面。并且此后很長一段時間里,AI的核心價值體現在內容生成——無論是撰寫報告還是生成代碼,本質上都是對用戶指令的被動響應。
彼時,企業將向量數據庫視為解決大模型幻覺、擴展私有知識的“補丁工具”,典型的應用場景是RAG(檢索增強生成)——將企業文檔向量化后存入數據庫,用戶提問時檢索相關片段喂給LLM生成答案。這是一個被動、靜態、低頻的調用模式。
但Agentic AI的出現徹底改變了這一邏輯,其核心特征是自主目標驅動:能夠理解復雜需求、拆分任務流程、調用外部工具、實時調整策略,最終完成端到端的復雜任務。
據Gartner預測,到2028年,支持生成式AI的數據庫支出將達2180億美元,占市場74%。但MIT研究顯示,超95%的企業AI項目因多模態數據割裂、系統鏈路冗長、權限管理復雜難以落地。
“Agentic AI的爆發,正在顛覆數據庫行業的底層邏輯。”Zilliz解決方案總監沈亮直言,“當AI從‘被動響應工具’進化為‘主動決策主體’,傳統數據庫的短板被無限放大,而向量數據庫正成為這場變革中不可或缺的核心基礎設施。”作為全球首個向量數據庫企業、開源向量數據庫Milvus的創造者,Zilliz見證并推動了向量數據庫從技術概念走向商業規模的全過程。
![]()
Zilliz解決方案總監沈亮
“在AI從被動到主動轉變的過程中,也將數據庫推向了AI決策的核心一環。”沈亮表示。
Agentic AI所需要具備的自主規劃、工具調用、持續學習、多輪記憶的核心特征,對底層數據庫提出了四類剛性需求:
首先是對讀寫性能的要求進一步提升。傳統RAG場景以讀為主,知識庫更新周期可能是天甚至周。但Agent在單次任務中就可能產生數十次讀寫操作:檢索經驗記憶(讀)、寫入行動日志(寫)、更新用戶畫像(寫)、查詢工具鏈(讀)。沈亮指出:“Agent調用記憶模塊的頻次、數據更新速度,不光要讀,很多時候還要去寫,這對數據庫的讀寫性能要求比傳統RAG高很多。”所以長期以來,Milvus針對高性能讀寫做了大量優化。
第二是,與傳統數據庫的“千人一面”(數據信息是固定的,每次查詢得到的信息也是固定的)相比,Agent為每個用戶生成的記憶是“千人千面”:行為軌跡、偏好向量、反饋記錄都需要獨立存儲。“千萬用戶乘以個性化數據,向量數據動輒就是百億量級。業界能比較好處理這么大體量數據的向量數據庫非常少。”沈亮測算道,“而Milvus以及其商業版的Zilliz Cloud是為數不多能解決這個問題的產品。”
第三是,成本與性能之間要實現平衡。Agent應用商業化早期ROI低,企業對價格極度敏感,如果將全部向量數據全部采用內存存儲,帶來高昂的成本,令企業無法接受。這就要求數據庫具備智能化的數據生命周期管理——熱數據高性能訪問,冷數據低成本存檔。針對這一背景Milvus推出了內存-磁盤-對象存儲的多層存儲方案來解決這個問題。
第四是,從單一模態到多模態融合處理能力的提升。對于Agentic AI而言,多模態交互已經是必選項,Agent需同時理解文本、圖像、地理位置、用戶行為等多種信號。這就對數據庫提出了能夠同時處理語音向量、圖像向量,并實現跨模態的關聯檢索的要求。傳統數據庫的單模態精確匹配,無法支撐多向量列聯合召回的復雜場景。而Milvus自2.4版本開始,就已經開始了對多向量列+各種標量數據的探索,迄今為止,已經積累了稠密向量、稀疏向量、二值型向量等向量類型數據(可廣泛表示各種多模態數據),以及地理位置、標簽、時間日期等標量類型數據的支持。
落到具體場景中,以電商智能客服為例,傳統AI客服僅能根據關鍵詞匹配預設答案,而Agentic AI客服則能自主查詢用戶歷史訂單、當前商品庫存、物流信息,甚至結合促銷規則為用戶制定個性化購買方案,甚至還需要具備一些圖片識別、語音/語義識別的能力。這個過程中,AI需要在毫秒級內完成海量非結構化數據的檢索與關聯,傳統數據庫根本無法承載。
向量數據庫是“決策中樞”的底層邏輯
在應對這些挑戰的過程中,向量數據庫正轉變為企業應用Agentic AI的必選項。
向量數據庫的核心價值不在于存儲,而在于高效檢索“語義相似性”。眾所周知,傳統數據庫(如MySQL、PostgreSQL)主要面向結構化數據需求,擅長處理結構化數據的精確匹配,但卻無法滿足生成式AI對海量非結構化數據的存儲、管理以及語義檢索需求。
而向量數據庫處理的是非結構化或半結構化數據(文本、圖像、音頻)經過深度學習模型編碼后生成的高維向量(通常數百到數千維)。其核心查詢是:找出和這個向量最相似的Top-K個向量。
與此同時,作為LLM的記憶體,向量數據庫以極具性價比的形式為其提供存儲功能,在減少大模型開發成本的同時,也能極大提高LLM的性能。另外,對于那些對數據隱私有需求,不希望將本地數據上傳大模型的企業來說,向量數據庫也是它們存儲和管理企業知識的不二選擇。
對此,沈亮表示:“Agent需要記錄短期歷史、長期經驗、工具調用效果,這些數據與傳統知識庫差別非常大。向量數據庫從被動工具變成了主動、靈活、高頻訪問的核心組件。”
具體而言,向量數據庫為Agentic AI提供四大不可替代的價值:
價值一,構建可擴展的認知記憶。 通過向量化存儲,Agent的每次交互、每個決策都被編碼為高維空間中的點。Milvus的分布式架構支持百億級向量存儲,配合冷熱分層,讓“記憶”既有容量又有速度。這相當于給Agent構建了一個可無限擴展的“數字海馬體”。
價值二,實現低延遲的經驗檢索。當Agent遇到新問題,需在毫秒級從海量記憶中找到最相關經驗。Zilliz Cloud的AutoIndex技術使查詢性能提升3-5倍,某電商客戶圖搜場景實現<30毫秒響應。這種速度是Agent保持"思維流暢性"的前提。
價值三,支撐多Agent的集體協作。復雜任務需多Agent協同,向量數據庫作為中央知識樞紐,存儲各Agent的中間結果與共識知識。
價值四,降低AI落地的信任門檻。通過BYOC方案,企業可將數據保存在自有VPC中,滿足GDPR、HIPAA等合規要求。這是金融、醫療、自動駕駛等領域采用Agentic AI的前提。
沈亮指出Agentic AI與傳統RAG不同,對向量數據庫底層數據庫特性有要求。“性能上,讀寫頻次和數據更新速度要求高,公司采用讀寫分離架構,避免讀寫相互影響,而部分友商產品存在讀寫相互折損問題。”
Zilliz一直把自己定位在AI Infra層,將向量數據庫作為連接大模型與垂直場景的關鍵齒輪。而且與其他數據庫服務商專注于做閉源產品不同的是,Zilliz選擇了開源Milvus與閉源Zilliz Cloud“雙管齊下”的商業模式,而且開源產品Milvus作為起家產品,其能力已經在多個行業應用中得到了認可。
比如,在HR領域,智聯招聘與Milvus合作,采用向量召回技術提升招聘匹配效率。通過雙塔模型結構處理JD和CV文本信息,映射為低維向量,利用對比學習優化匹配精度。使用Milvus進行向量數據庫管理,通過體感評估和量化指標評估模型表現,解決人力線索評估的難題;在傳媒領域,搜狐新聞利用Milvus分布式向量檢索引擎,提升了個性化新聞推薦系統的性能,包括向量檢索速度提升10倍,新聞分類準確率提高至95%,并減少了內存占用。這使得搜狐新聞能夠更快響應用戶需求,降低成本,并提升用戶體驗。
沈亮介紹道,一方面,Zilliz通過開源的Milvus向量數據庫搭建起了開源開放的數據庫社區,吸納更多的用戶和企業,讓他們對向量數據庫有了更為深刻的了解,通過開源的產品,Zilliz也可以從用戶那里及時獲得新需求,從而“反哺”商業化產品Zilliz Cloud,讓更多人了解Zilliz。
另一方面,當使用Milvus產品的用戶在業務上有進一步需求的時候,因為對Zilliz的能力已經有了初步的了解,在尋求進一步服務的過程中,選擇Zilliz商業化產品——Zilliz Cloud的可能性也會更大,沈亮指出,“Milvus與Zilliz Cloud完全接口兼容,企業可以根據自身需求靈活選擇,很多客戶先通過開源版驗證技術可行性,再平滑遷移至商業版,遷移成本幾乎為零,分鐘級即可完成切換。”
當開源用戶規模達到臨界點,運維復雜度、性能瓶頸、成本壓力會促使它們轉向商業版。“我們有相當多的商業化用戶是從開源轉來的,”沈亮舉例,“某頭部電商早期用Milvus搭建向量檢索平臺,支撐圖搜、推薦、風控等場景。但到了雙十一,他們意識到自建方案在穩定性、性能調優上存在瓶頸,最終整個集群切換到Zilliz Cloud。”
與云協同,鋪設通往通用智能的“記憶高速路”
向量數據庫的性能發揮高度依賴底層基礎設施的彈性與擴展性,而云原生架構恰好提供了這樣的能力。有報告顯示,2024年全球云DBMS收入占比已達64%(766億美元),貢獻了89%的市場增量,包含亞馬遜云科技等在內的頭部服務商壟斷了76%的云數據庫市場份額。這一數據表明,云已成為數據庫的主流部署環境。
正是看到了云原生的巨大優勢,Zilliz自2021年起便與亞馬遜云科技展開合作,目前已成為亞馬遜云科技最高等級的第三方合作伙伴,雙方的合作從技術適配、產品集成延伸至市場推廣、客戶服務等多個層面,形成了深度綁定的戰略關系。“與亞馬遜云科技的合作不是簡單的產品集成,而是從底層技術到上層生態的全方位協同。”沈亮如是說。
在資源配置方面,基于Amazon Elastic Compute Cloud(Amazon EC2)豐富的實例類型,Zilliz Cloud提供了包括性能型、容量型、存儲擴展型等多套深度優化的解決方案,滿足用戶不同的負載需求。
在彈性架構方面,Zilliz基于Amazon Elastic Kubernetes Service(EKS)的容器化自動擴縮容能力,可動態應對流量高峰,確保用戶業務量激增時AI應用的穩定高效運行。
在成本優化方面,Zilliz Cloud還適配了支持Amazon Graviton處理器的實例,可將成本優化提升20%以上,并顯著提升性能。
具體來看,選擇Zilliz Cloud向量數據庫解決方案構建各種AI應用的客戶,也利用亞馬遜云科技在模型服務層的優勢,通過靈活的API接口,在Amazon Bedrock上調用領先的大語言模型和嵌入模型,做快速選擇、切換和調用,并進一步大幅簡化數據處理流程,釋放數據深層價值。
此外,Zilliz應用生成式AI助手Amazon Q幫助技術團隊更快熟悉亞馬遜云科技的服務,簡化信息訪問、加強信息檢索與優化配置,相比直接閱讀產品文檔,可為技術人員節省50%以上的檢索時間。
商業層面,亞馬遜云科技 Marketplace為Zilliz導入大量用戶,更重要的是,這些用戶中相當一部分是國內AI出海企業。“他們在美國、日本、新加坡做創新應用,最關心應用開發周期,試錯成本要低。”沈亮分析,“我們的向量數據庫+亞馬遜云科技的AI生態,讓他們創新周期大大縮短。”
Zilliz與亞馬遜云科技的合作不僅是“單方面的勝利”,而是雙方相互成就。除了亞馬遜云科技為Zilliz的向量數據庫提供了穩定的云環境、模型服務層優勢,以及出海的支撐之外,Zilliz Cloud的高性能向量搜索能力也為亞馬遜云科技企業客戶帶來了顯著的商業影響。憑借在數十億向量中進行低于10毫秒延遲的搜索以及嚴格的合規性,組織可以以前所未有的規模實施AI應用。“很多用戶最初只用Milvus開源版,我們引導他們使用亞馬遜云科技的服務后,他們會更多使用SageMaker、Bedrock等AI產品,為亞馬遜云科技帶來新用戶。”沈亮如是說。這種共生關系,使雙方從“供應商-客戶”升級為“生態伙伴”。
“通過選擇在亞馬遜云科技上使用Zilliz Cloud,組織可以自信地擴展其向量搜索操作,并專注于創新,而非基礎設施管理。”沈亮指出。例如,美國頂級的法律AI SaaS公司Filevine使用Zilliz Cloud使海量法律文檔可快速搜索,將研究時間從數小時縮短至數分鐘。這一改進得益于Zilliz Cloud對其自研向量數據庫內核Cardinal的 10倍的性能提升(相較開源Milvus)以及自動索引AutoIndex優化等功能。
當前,對于企業而言,選擇合適的向量數據庫與云平臺,構建AI原生的數據架構,已成為把握Agentic AI機遇的關鍵。回看Ziiliz的來時之路,在數據庫的“戰場”上,Zilliz抓住了AI帶來的機遇,實現了“長期主義者”的突圍。Zilliz用7年時間證明,在AI時代,數據庫不再是幕后存儲,而是智能體認知的“第一性原理”。
從十億向量到千億向量,從單模態到萬模態,從靜態知識到動態認知,向量數據庫的演進,本質上是在為AI鋪設一條條通往通用智能的“記憶高速路”。而Zilliz已成為這條公路上最堅定的筑路者。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.