文/章程
編輯/陳默
來源/萬點(diǎn)研究
AI加速賦能千行百業(yè),大語言模型正在迅速滲透并改變世界。
LLM生態(tài)正以前所未有的速度改變著各行各業(yè)的發(fā)展格局。從金融服務(wù)到醫(yī)療健康,從制造業(yè)到教育培訓(xùn),從零售電商到法律服務(wù),AI技術(shù)正在深度模擬傳統(tǒng)業(yè)務(wù)流程,帶來顛覆性的變革。
盡管大模型表現(xiàn)出強(qiáng)大的能力,但在縱向垂直領(lǐng)域的實(shí)際應(yīng)用中卻常常不理想。基于互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)訓(xùn)練的通用大模型,雖然具備廣泛的知識(shí)基礎(chǔ)和強(qiáng)大的推理能力,但在面向特定行業(yè)和專業(yè)領(lǐng)域時(shí),常常暴露出明顯的局限性。根據(jù)最新的HHEM基準(zhǔn)測(cè)試,即使是最主流的大模型,其幻覺率仍然高達(dá)14.3%。“胡編亂造”、“一問三不知”等幻覺問題深受用戶詬病。
![]()
由于缺乏領(lǐng)域的深度專業(yè)知識(shí),大模型在回答專業(yè)問題時(shí)可能生成合理但實(shí)際錯(cuò)誤的信息,這在金融、醫(yī)療等對(duì)準(zhǔn)確性要求極高的領(lǐng)域極為危險(xiǎn)。性能不理想也是一個(gè)普遍問題。通用模型在處理特定行業(yè)術(shù)語、專業(yè)化需求時(shí),往往無法達(dá)到預(yù)期效果,影響用戶體驗(yàn)和業(yè)務(wù)應(yīng)用價(jià)值。
在以“領(lǐng)域預(yù)訓(xùn)練(成本高、周期長)”、“提示工程(提示設(shè)計(jì)領(lǐng)域?qū)<抑R(shí)要求高)”等為代表的大模型適配領(lǐng)域場(chǎng)景應(yīng)用的各類解決方案中,“RAG”技術(shù)路線正成為市場(chǎng)主流選擇。RAG(檢索增強(qiáng)生成)將外部知識(shí)庫與大模型結(jié)合,既保留了大模型的基礎(chǔ)能力,又注入了領(lǐng)域?qū)I(yè)知識(shí),既發(fā)揮了大模型的強(qiáng)大理解和生成能力,又通過領(lǐng)域知識(shí)搜索解決了專業(yè)知識(shí)匱乏問題,從而減少幻覺、提高輸出準(zhǔn)確性與可靠性。
在RAG架構(gòu)中,向量數(shù)據(jù)庫發(fā)揮著至關(guān)重要的作用,它用于高效存儲(chǔ)和檢索非結(jié)構(gòu)化數(shù)據(jù)(如文本、圖像等)的向量化表示,而更為重要且不可忽視的一點(diǎn)是:這些數(shù)據(jù)往往是本地化、非公開或私有領(lǐng)域知識(shí)(如企業(yè)內(nèi)部的文檔、專業(yè)數(shù)據(jù)庫等)。
![]()
當(dāng)下,從開源、到商用、再到云廠商都推出了向量數(shù)據(jù)庫,各家都在這個(gè)賽道上激烈競(jìng)爭。盡管向量數(shù)據(jù)庫在RAG中表現(xiàn)出巨大價(jià)值,但檢索精度與效率平衡(精度不夠、面對(duì)億級(jí)數(shù)據(jù)查詢響應(yīng)緩慢等并存問題)、數(shù)據(jù)更新易出現(xiàn)不一致性、如何支持復(fù)雜查詢等問題仍舊突出,加之國際科技脫鉤對(duì)“自主可控、安全合規(guī)”的急迫需求,于國產(chǎn)向量數(shù)據(jù)庫而言,市場(chǎng)更加期待迎來新的參與者和積極變化。
如此情形下,每個(gè)企業(yè)都在思考一個(gè)問題:如何讓AI真正理解企業(yè)機(jī)構(gòu)的數(shù)據(jù)和業(yè)務(wù),如何高效、安全地駕馭大模型與私域數(shù)據(jù)?這成為當(dāng)下智能化轉(zhuǎn)型的核心業(yè)務(wù)需求。
作為AI基礎(chǔ)設(shè)施的核心組件,如何基于向量數(shù)據(jù)庫構(gòu)建更高效、更緊密的“數(shù)據(jù)+大模型”協(xié)同方式,充分釋放出企業(yè)領(lǐng)域數(shù)據(jù)的巨大潛能,以驅(qū)動(dòng)業(yè)務(wù)實(shí)現(xiàn)高質(zhì)量躍遷,正成為AI時(shí)代各行各業(yè)面臨的核心關(guān)切。
9月25日,源于清華大學(xué)研發(fā)團(tuán)隊(duì)的北京數(shù)智引航科技有限公司,重磅發(fā)布高性能向量數(shù)據(jù)庫產(chǎn)品VexDB。
VexDB幫助企業(yè)一站式解決AI應(yīng)用落地過程中的知識(shí)管理、語義檢索、多模態(tài)分析等復(fù)雜場(chǎng)景需求,為企業(yè)構(gòu)建高可信、低延遲的AI應(yīng)用提供數(shù)據(jù)管理能力,重新定義AI時(shí)代的數(shù)據(jù)基座新范式。
![]()
據(jù)了解,VexDB是一款融合關(guān)系數(shù)據(jù)、多路語義檢索能力的向量數(shù)據(jù)庫,具備大容量、高精度、高性能、高安全、高可用、實(shí)時(shí)性、易用性的特點(diǎn),能夠支持百億千維向量數(shù)據(jù)毫秒級(jí)結(jié)果查詢,召回準(zhǔn)確度達(dá)99%以上。從創(chuàng)新性、可靠性層面觀察,VexDB數(shù)據(jù)代理系統(tǒng)AgenticData在國際權(quán)威的DABstep Benchmark和Spider-2.0-Lite的近期測(cè)試中獲得了最高分。
![]()
向量數(shù)據(jù)庫:AI時(shí)代的數(shù)據(jù)基座
什么是向量數(shù)據(jù)庫?向量數(shù)據(jù)庫是專為高效存儲(chǔ)、索引和查詢海量向量數(shù)據(jù)而設(shè)計(jì)的數(shù)據(jù)庫。它的核心價(jià)值在于解決了“從海量非結(jié)構(gòu)化數(shù)據(jù)中快速進(jìn)行語義搜索”的難題。它是一座橋梁,將人類能理解的語義世界與計(jì)算機(jī)能處理的數(shù)字世界高效地連接起來。用戶將文字、圖像、音頻等非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換成高維向量,這可以理解為給每段內(nèi)容打上一個(gè)獨(dú)特的“語義指紋”。當(dāng)你提出問題時(shí),系統(tǒng)會(huì)將問題也轉(zhuǎn)換成向量,然后在海量的向量空間中尋找最相似的“指紋”,從而找到最為精準(zhǔn)的答案。
在數(shù)據(jù)爆炸式增長、非結(jié)構(gòu)化數(shù)據(jù)占主導(dǎo)、以及AI應(yīng)用蓬勃發(fā)展的今天,向量數(shù)據(jù)庫作為底層基礎(chǔ)設(shè)施,是釋放數(shù)據(jù)價(jià)值、構(gòu)建智能應(yīng)用(尤其是基于大模型的應(yīng)用)的關(guān)鍵引擎和核心組件。沒有它,很多AI應(yīng)用將無法實(shí)現(xiàn)或體驗(yàn)會(huì)大打折扣。
VexDB 提供全面的向量計(jì)算能力,可高效支撐搜索業(yè)務(wù)與大模型業(yè)務(wù)場(chǎng)景。
那么,VexDB都是如何做到的?
向標(biāo)混合查詢與多路召回:讓AI更懂你的意圖
當(dāng)人們使用傳統(tǒng)向量數(shù)據(jù)庫進(jìn)行向量檢索時(shí),如果要同時(shí)進(jìn)行標(biāo)量過濾(比如篩選特定時(shí)間段或特定類別的數(shù)據(jù)),性能往往會(huì)大幅下降。而VexDB創(chuàng)新性地提出了向量標(biāo)量混合索引技術(shù),能夠根據(jù)不同的查詢條件動(dòng)態(tài)選擇最優(yōu)的執(zhí)行路徑。與業(yè)界流行產(chǎn)品相比,VexDB在高并發(fā)向標(biāo)混合查詢上,展現(xiàn)出了1.3倍-8倍的吞吐性能優(yōu)勢(shì)。且VexDB使用自適應(yīng)算法來決定是否可以提前終止檢索,從而將檢索速度提升了40%。
另外,在實(shí)際應(yīng)用中,用戶的查詢意圖也往往是多維度的。
比如,搜索“最近一周關(guān)于貨幣政策的研究報(bào)告”,這里既有時(shí)間維度(最近一周),又有主題維度(貨幣政策),還有文檔類型維度(研究報(bào)告)。
傳統(tǒng)的向量數(shù)據(jù)庫往往只能處理單一維度的語義相似性,而VexDB創(chuàng)新性地實(shí)現(xiàn)了稠密向量、稀疏向量和全文檢索的多路召回機(jī)制。多路召回是大模型檢索增強(qiáng)業(yè)務(wù)提高端到端召回率的關(guān)鍵手段,VexDB是業(yè)界少數(shù)能在稠密向量查詢和全文檢索查詢?nèi)蝿?wù)上,同時(shí)達(dá)到性能最優(yōu)的向量數(shù)據(jù)庫產(chǎn)品之一。
![]()
這個(gè)技術(shù)聽起來很復(fù)雜,但原理其實(shí)很好理解:第一支隊(duì)伍(稠密向量)負(fù)責(zé)理解深層語義,比如“貨幣政策”和“財(cái)稅政策”是相似的概念;第二支隊(duì)伍(稀疏向量)負(fù)責(zé)精確匹配關(guān)鍵詞,確保不遺漏重要的專業(yè)術(shù)語;第三支隊(duì)伍(條件過濾)負(fù)責(zé)進(jìn)行標(biāo)量屬性的過濾篩選,比如價(jià)格范圍、商品類型等。三支隊(duì)伍協(xié)同工作,最終匯總出最相關(guān)的結(jié)果。
![]()
通過多路召回技術(shù),VexDB讓AI更懂你的意圖。
VexDB能夠讓檢索召回率提高30%,這意味著用戶更容易找到真正需要的信息、獲得的回答也會(huì)更加準(zhǔn)確和全面。而且,這一切只需要一條SQL語句就能實(shí)現(xiàn),大大降低了開發(fā)門檻。
![]()
百億向量毫秒響應(yīng):高效支撐搜索、大模型業(yè)務(wù)場(chǎng)景
革新性的向標(biāo)混合索引與多路召回技術(shù),為用戶帶來高效精準(zhǔn)的便捷應(yīng)用場(chǎng)景,而這背后,更離不開“百億數(shù)據(jù)毫秒級(jí)響應(yīng)”的夯實(shí)基礎(chǔ)。
為此,在解決方案上、VexDB團(tuán)隊(duì)創(chuàng)新性地實(shí)現(xiàn)了GraphIndex向量圖索引技術(shù)。該索引結(jié)合了HNSW(分層導(dǎo)航小世界網(wǎng)絡(luò))的層次化管理優(yōu)勢(shì)和DiskANN的磁盤存儲(chǔ)能力。這就像給倉庫建立了一個(gè)多層的導(dǎo)航系統(tǒng),最上層粗略區(qū)域劃分,越往下、越精細(xì)。查詢時(shí),系統(tǒng)先在上層快速定位相關(guān)區(qū)域,然后逐層深入、最終精準(zhǔn)找到目標(biāo)。
同時(shí),VexDB應(yīng)用量化壓縮技術(shù),單節(jié)點(diǎn)支持超過10億條向量數(shù)據(jù)的檢索,而通過分布式查詢優(yōu)化、增量數(shù)據(jù)重分布等技術(shù),即可輕松擴(kuò)展到百億規(guī)模。
值得一提的是,在強(qiáng)一致上,VexDB利用多版本并發(fā)控制算法進(jìn)行事務(wù)管理,支持?jǐn)?shù)據(jù)原地更新以及動(dòng)態(tài)實(shí)時(shí)更新。保持?jǐn)?shù)據(jù)新鮮度的同時(shí),提高了高頻更新場(chǎng)景下的性能、穩(wěn)定性、以及存儲(chǔ)空間利用率。也就是說,VexDB在高性能的前提下,確保數(shù)據(jù)的強(qiáng)一致,實(shí)現(xiàn)0延遲的數(shù)據(jù)新鮮度。
在金融、醫(yī)療、交通、電信等事關(guān)社會(huì)民生基礎(chǔ)的行業(yè)數(shù)據(jù)應(yīng)用場(chǎng)景,安全性是繞不開的話題。對(duì)此,VexDB團(tuán)隊(duì)在數(shù)據(jù)安全與合規(guī)方面下足功夫,讓機(jī)構(gòu)數(shù)據(jù)固若金湯!
真實(shí)場(chǎng)景的驗(yàn)證,AI時(shí)代的純國產(chǎn)向量優(yōu)選
真金,需火煉;利器,在實(shí)戰(zhàn)。 VexDB的核心能力,在金融風(fēng)控、智慧醫(yī)療、智慧交通、公共安全等關(guān)鍵領(lǐng)域深度實(shí)踐,經(jīng)歷了嚴(yán)苛場(chǎng)景的打磨,并且得到良好的驗(yàn)證和應(yīng)用。
比如,海量公安技偵數(shù)據(jù)的閃電入庫與毫秒級(jí)精準(zhǔn)檢索;
醫(yī)療電子病歷中多模態(tài)非結(jié)構(gòu)化數(shù)據(jù)的智能解析與精準(zhǔn)問答;
出行服務(wù)場(chǎng)景下,高并發(fā)個(gè)性化推薦的極致性能保障……
目前, VexDB已在金融、通信、制造、醫(yī)療等行業(yè)扎根落地;與301醫(yī)院、創(chuàng)業(yè)慧康、彩訊、MedGO、東方通、飛致云Max KB等十余家伙伴的深度合作。
在醫(yī)療領(lǐng)域,VexDB 助力中國人民解放軍總醫(yī)院(301醫(yī)院)搭建了一整套R(shí)AG應(yīng)用- “康復(fù)理療知識(shí)庫。借助VexDB高效的向量檢索能力,基于患者病情等信息,結(jié)合大模型生成貼合實(shí)際的理療建議與設(shè)備推薦,有效降低大模型幻覺風(fēng)險(xiǎn)。
在發(fā)布會(huì)現(xiàn)場(chǎng),301醫(yī)院提及“針對(duì)于訓(xùn)練傷康復(fù),這套AI應(yīng)用已經(jīng)能給出精準(zhǔn)的設(shè)備推薦和理療建議;在實(shí)際應(yīng)用舉例中,對(duì)比大模型在搭載VexDB前后的回答效果,對(duì)于“肩袖損傷”這一病癥的康復(fù)方案,VexDB向量庫和AI大模型結(jié)合,能夠給出更加專業(yè)的理療建議——有具體的用藥劑量、有準(zhǔn)確的知識(shí)溯源。相比之下,通用大模型的回答比較模糊,無法確認(rèn)信息來源。”
在輔助診斷場(chǎng)景中,該方案可實(shí)現(xiàn)相似病例匹配、診療方案關(guān)聯(lián),進(jìn)而完成方案推薦、風(fēng)險(xiǎn)預(yù)警與通俗說明,既提升醫(yī)生工作效率,又保障醫(yī)療服務(wù)質(zhì)量,減少漏診、誤診情況發(fā)生。
![]()
由于醫(yī)療領(lǐng)域?qū)I(yè)性強(qiáng)、AI應(yīng)用門檻高,而通用大模型,缺乏醫(yī)院私域知識(shí),容易產(chǎn)生“模型幻覺”;其次,要訓(xùn)練一個(gè)本地化的模型,往往需要上傳高敏感的醫(yī)患數(shù)據(jù),從更深層次的保護(hù)用戶數(shù)據(jù)隱私,創(chuàng)業(yè)慧康聯(lián)合數(shù)智引航VexDB共同打造了國產(chǎn)醫(yī)療大模型解決方案,將VexDB作為BsoftGPT的本地知識(shí)庫,搭建了一整套完整的RAG應(yīng)用,從模型輸出的質(zhì)量把控、數(shù)據(jù)安全的全流程防護(hù),到算力成本的優(yōu)化,系統(tǒng)性的消除了用戶的顧慮。
VexDB向量數(shù)據(jù)庫通過“離線預(yù)存 + 熱門緩存”機(jī)制減少了模型的調(diào)用,能大幅降低算力消耗;而本地知識(shí)庫則實(shí)現(xiàn)了 “私域數(shù)據(jù)不出院”,從根源杜絕隱私泄露風(fēng)險(xiǎn),打消了用戶顧慮;還能及時(shí)更新數(shù)據(jù),保證數(shù)據(jù)的時(shí)效性和結(jié)果質(zhì)量。
現(xiàn)如今,這套端到端的 AI 應(yīng)用已經(jīng)覆蓋智能導(dǎo)診、電子病歷生成、APTS、AI 管理決策60%的時(shí)間。
比如,這套聯(lián)合方案已應(yīng)用在某大型三甲醫(yī)院的智能電子病歷系統(tǒng)。這套應(yīng)用具備病歷對(duì)比、自動(dòng)總結(jié)、智能分析、病歷續(xù)寫等功能。在病歷生成場(chǎng)景上,這套系統(tǒng)在數(shù)秒之內(nèi)就能生成一份完整的出院小結(jié),醫(yī)生只需進(jìn)行少量修改、審核,就能簽名確認(rèn),整個(gè)過程從原來的二十多分鐘縮短到八分鐘以內(nèi),節(jié)省了超過60%的時(shí)間。
在電信行業(yè),VexDB 聯(lián)合彩訊科技,打造企業(yè)級(jí) AI 中樞彩訊Rich AIBox,解決企業(yè)知識(shí)資產(chǎn)分散、數(shù)據(jù)價(jià)值釋放難的痛點(diǎn)。在運(yùn)營商領(lǐng)域,通過 VexDB 實(shí)現(xiàn)云盤跨模態(tài)秒級(jí)檢索、營銷精準(zhǔn)推薦、售前方案高效生成;在展會(huì)行業(yè),支撐全鏈路 AI 服務(wù),大幅降低人工成本,推動(dòng)企業(yè)知識(shí)管理與業(yè)務(wù)效能升級(jí)。
![]()
實(shí)際上,如何充分利用硬件資源是行業(yè)用戶頗為關(guān)注的重點(diǎn)。為此,VexDB針對(duì)不同的CPU架構(gòu)進(jìn)行了深度優(yōu)化,適配了包括x86、ARM在內(nèi)的多種處理器的SIMD(單指令多數(shù)據(jù))指令集,讓同樣的硬件能夠發(fā)揮出3倍以上的性能。
通過并行優(yōu)化技術(shù),VexDB能夠?qū)⒉樵儠r(shí)延降低兩倍以上。這種性能提升、對(duì)于需要實(shí)時(shí)響應(yīng)的在線業(yè)務(wù)來說,直接關(guān)系到用戶體驗(yàn)的好壞。
開發(fā)者友好:讓AI應(yīng)用開發(fā)變簡單
對(duì)于開發(fā)者來說,VexDB也提供了極其友好的使用體驗(yàn)。它支持標(biāo)準(zhǔn)的SQL語法,這意味著熟悉傳統(tǒng)數(shù)據(jù)庫的開發(fā)者幾乎可以零學(xué)習(xí)成本上手。同時(shí),它提供了多種語言SDK,高度兼容LangChain、LlamaIndex等主流AI生態(tài)組件。
更貼心的是,VexDB推出了免費(fèi)的開發(fā)版,為期一年的使用期限內(nèi),開發(fā)者可以獲得完整的向量檢索能力、詳細(xì)的技術(shù)文檔和活躍的社區(qū)支持。這對(duì)于想要嘗試向量數(shù)據(jù)庫但預(yù)算有限的個(gè)人開發(fā)者和初創(chuàng)企業(yè)來說,無疑是個(gè)福音。
商業(yè)版則面向有更高要求的企業(yè)用戶,提供更完整的關(guān)系型數(shù)據(jù)庫特性、SLA服務(wù)保障和專業(yè)技術(shù)支持。這種差異化的版本策略,讓不同規(guī)模和需求的用戶都能找到適合自己的選擇。
![]()
未來展望:AI基礎(chǔ)設(shè)施的新基石
隨著大模型技術(shù)的快速發(fā)展,向量數(shù)據(jù)庫正在成為AI基礎(chǔ)設(shè)施的核心組件。就像關(guān)系型數(shù)據(jù)庫之于互聯(lián)網(wǎng)時(shí)代,向量數(shù)據(jù)庫將成為AI時(shí)代不可或缺的基礎(chǔ)設(shè)施。
Gartner預(yù)測(cè),到2026年,超過70%的企業(yè)將在生產(chǎn)環(huán)境中部署向量數(shù)據(jù)庫。這個(gè)巨大的市場(chǎng)機(jī)會(huì)吸引了眾多玩家入場(chǎng),競(jìng)爭也日趨激烈。而市場(chǎng)更需要的,是真正理解用戶需求、持續(xù)創(chuàng)新技術(shù)、提供完善服務(wù)的產(chǎn)品。VexDB的推出,不僅代表著中國在向量數(shù)據(jù)庫領(lǐng)域的創(chuàng)新探索,更重要的是為企業(yè)提供了一個(gè)高效且安全可靠的AI基礎(chǔ)設(shè)施選擇。VexDB的發(fā)布,為這個(gè)快速發(fā)展的市場(chǎng)帶來了新的選擇和可能。
無論你是正在探索AI應(yīng)用的企業(yè)決策者,還是致力于構(gòu)建智能系統(tǒng)的開發(fā)者,亦或是對(duì)技術(shù)趨勢(shì)保持關(guān)注的行業(yè)觀察者,VexDB都值得你深入了解。VexDB正在用實(shí)際行動(dòng)證明,中國企業(yè)能夠在AI應(yīng)用層面快速跟進(jìn)、實(shí)現(xiàn)創(chuàng)新突破。
![]()
![]()
![]()
本文由萬點(diǎn)原創(chuàng),如需轉(zhuǎn)載、商務(wù)合作請(qǐng)+V
zzdmw5728(微信號(hào))
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.