![]()
“一場關于Data與AI的融合革命正在數據庫領域悄然上演。
當大模型掀起全球智能浪潮,當企業數據量以指數級攀升,一個問題愈發緊迫:AI時代,我們需要什么樣的數據庫?
是繼續沿用“一個業務多個庫”的碎片化架構?還是尋求一種更統一、更智能、更融合的數據底座?
2025年11月18日,OceanBase用實力給出了答案。在年度發布會上,OceanBase發布并開源了其首款AI數據庫OceanBase seekdb(簡稱seekdb)。開發者僅需三行代碼,即可快速構建知識庫、智能體等AI應用,輕松應對百億級多模數據檢索,真正實現“開箱即用”的AI數據基座。
據介紹,該產品支持向量、全文、標量及空間地理數據的統一混合搜索,深度融合AI推理與數據處理,并兼容Hugging Face、LangChain等30余種主流AI框架。這一產品實現了數據庫從傳統“業務支撐系統”邁向“AI原生數據入口”的新功能,也是OceanBase自啟動“Data×AI”戰略以來的一份答卷。
數據庫的"變"與"不變":
AI時代的技術挑戰與核心價值堅守
毫無疑問,我們正站在AI技術重塑產業格局的十字路口。數據庫的角色正在被徹底重構——它不再僅僅是存儲數據的倉庫、記錄交易的賬本或進行分析的引擎,而是正在成為智能系統中真正可信的“數據中樞”。
長期以來默默居于幕后的數據庫基礎設施,正在被AI浪潮推向舞臺中央,經歷著從被動“存儲數據”到主動“理解數據”的戰略躍遷,這不僅要求數據庫具備數據管理能力,更需要深度融合模型能力,實現數據與智能的有機結合。
在技術快速迭代的背景下,數據庫領域呈現出三個“變”與“不變”。
三個變化:數據處理量級正在從傳統的GB/TB級躍升至PB/EB級,這對數據庫的擴展性提出了前所未有的挑戰;多模混合搜索成為剛需,企業需要同時處理結構化、半結構化和非結構化數據;技術平權趨勢明顯,數據庫用戶從專業的開發者擴展到普通的業務人員。
三個不變:數據庫的核心價值保持不變,仍然需要處理事務和分析問題,這是企業運營的基礎;優秀的查詢優化器在處理復雜查詢時依然不可或缺;豐富的生態兼容功能仍然是數據庫成功的關鍵因素。
這三個“變”與“不變”,構成了OceanBase把握AI時代機遇的重要坐標。
“AI的真正瓶頸不在模型,而在數據。”OceanBase CEO楊冰指出,“尤其在金融、政務等高敏感場景,傳統多系統架構不僅復雜低效,更易引發權限與延遲風險。”
一體化:
三大維度構建AI時代的數據基石
面對時代的挑戰,OceanBase提出了獨具特色的“一體化”解決方案。
為什么是一體化?
符合技術發展規律:從早期的大型機集中式,到互聯網時代的分布式架構,再到AI時代的一體化融合,技術發展呈現出"合久必分,分久必合"的螺旋式上升規律。一體化架構正是這種規律在當前階段的體現。
響應企業核心訴求:維護多套系統的成本、復雜度以及數據一致性問題,已經成為很多企業的"不能承受之重"。一體化架構通過簡化技術棧,顯著降低了企業的總擁有成本(TCO)。
為AI應用提供最優數據通路:當智能成為業務的核心競爭力時,數據的處理效率直接決定了企業的創新速度。一體化架構為AI應用提供了最簡化的數據通路,加速了從數據到價值的轉化過程。
OceanBase一體化涵蓋架構、負載和多云三個維度:
架構一體化:單機與分布式的統一
讓用戶無需在“性能”與“擴展性”之間做選擇題。同一套引擎既能在單機環境下穩定運行,也能在分布式環境中彈性擴展。
負載一體化:TP、AP與AI的融合
更突破性的是,OceanBase實現了TP(事務處理)、AP(分析處理)與AI工作負載在單一引擎內的融合。
多云一體化:一套架構,全球運行
在云原生層面,OceanBase已穩定運行于阿里云、華為云、騰訊云、AWS、Azure等七大主流云平臺。這種多云原生能力讓企業真正實現“一套架構,全球運行”,為出海企業提供了關鍵的技術支點。
混合搜索:讓數據庫從"存儲"到"理解"
如果說一體化架構是骨骼,那么混合搜索就是OceanBase在AI時代的"智能大腦"。
為什么混合搜索如此關鍵?
我們來看一個場景。當用戶提出"找一下去年華東區銷量最好的幾款新能源汽車的相關技術文檔"這樣的需求時,傳統的單一搜索方式就顯得力不從心。
這個看似簡單的查詢實際上涉及多個維度的數據處理:需要向量搜索來理解"銷量最好"的語義含義;需要關系查詢來過濾"去年""華東區""新能源汽車"這些條件;需要全文檢索在技術文檔中匹配關鍵內容;還需要圖索引來關聯車型與技術文檔的關系。
OceanBase的混合搜索技術將稠密向量、稀疏向量、全文搜索、關系過濾等進行深度融合,通過智能的全局重排序輸出最優結果。這種能力使得數據庫不再是被動的數據存儲容器,而是能夠"理解"用戶意圖的智能助手。
在OceanBase技術團隊的思考中,向量搜索只是AI數據庫的初級階段,最終都將演進為混合搜索。
seekdb:AI原生數據庫的開源實踐
基于對AI時代,數據庫的戰略思考,以及一體化架構的技術突破,OceanBase推出了AI原生數據庫——seekdb。
![]()
“seekdb不是傳統數據庫的功能疊加,而是專為AI時代重構的AI原生數據庫。”楊冰表示,“它繼承OceanBase的代碼和設計理念,更輕量、更敏捷,目標是成為大模型與私有數據融合計算的‘實時入口層’。我們希望與開發者一起,在混合搜索、多模融合等方向加速迭代、大膽創新。”
據Gartner預測,到2028年,支持生成式AI的數據庫支出將達2180億美元,占市場74%。但MIT研究顯示,超95%的企業AI項目因多模態數據割裂、系統鏈路冗長、權限管理復雜難以落地。seekdb帶來三大核心突破:
一是AI原生混合搜索能力。seekdb支持在一個查詢中融合向量檢索、全文搜索與標量過濾,采用“粗排+精排”多階段檢索機制,在低延遲的同時提升精度。依托成熟的事務引擎,它支持實時寫入與ACID一致性,并兼容MySQL生態。此外,seekdb支持標量、向量、文本、JSON和GIS等多模數據的統一存儲與檢索。例如,在反欺詐場景中,可直接查詢“近7天交易超5萬元、位置異常且行為類似歷史欺詐樣本”,無需跨系統調用,兼顧性能與安全。
二是極簡部署,開箱即用。seekdb最低僅需1核CPU、2GB內存,支持pip install一鍵安裝、秒級啟動,兼容嵌入式與客戶端/服務器雙部署模式,可輕松集成至智能Agent、開發工具鏈或本地應用,大幅降低AI應用的工程門檻。
三是更開發者友好。seekdb以Apache 2.0協議全球開源,開發者可自由使用、修改和擴展。產品全面兼容HuggingFace、Dify、LangChain等30余種AI框架及MCP大模型協議,無縫融入AI生態;并提供SQL及PythonSDK,適配不同開發習慣。同期開源的PowerRAG智能文檔解析框架與PowerMem分層記憶架構,后者在LOCOMO Benchmark上以73.70分登頂SOTA,Token消耗降低96%,大幅節省推理成本。
作為OceanBase“Data×AI”戰略的關鍵一環,seekdb既可獨立使用,也可平滑融入新發布的OceanBase 4.4一體化融合版本。該版本首次將TP、AP與AI能力集成于單一內核,兼具分布式擴展、多云部署與金融級高可用,幫助企業避免后期架構重構風險。商用LTS版本將于2026年2月2日推出。
目前,OceanBase的混合搜索能力已在多個行業成功落地,充分驗證了其技術價值:中國聯通基于混合搜索構建統一AI知識庫,有效解決了私有文檔的權限管理與高效檢索難題;螞蟻百寶箱則基于混合搜索實現智能體的實時在線搜索,顯著提升了信息獲取的精準性與響應效率。
“這不僅是技術產品,更是開發范式的躍遷。”楊冰表示,“傳統數據庫只‘存’數據,而seekdb能‘理解’數據語義,混合搜索正是AI原生數據庫的關鍵分水嶺。”過去十五年,OceanBase在“雙11”等極限場景錘煉出的工程化能力,正轉化為AI時代的底層優勢,在AI原生混合搜索、多模融合、TP/AP/AI一體化、多云原生等方向持續突破。
4000家客戶驗證的技術實力
OceanBase CEO楊冰在發布會上透露了一組令人振奮的數字:自2020年商業化以來,OceanBase全球客戶數已突破4000家,連續五年年均增速超過100%。目前,其技術已深入金融、政務、通信、零售、制造、互聯網等十余個領域,服務覆蓋16個國家和地區、60多個地域、240多個可用區。
這一成績的背后是OceanBase"專有云+公有云"的雙輪驅動戰略,更根植于15年技術深耕與工程化能力實踐。
專有云:核心系統的信任之選
![]()
OceanBase專有云憑借卓越的穩定性和一致性,成為高要求領域的核心系統首選。過去一年客戶數增長50%,在金融領域實現全面突破,正加速拓展至政務、電信、交通、能源、醫療等政企領域:
?覆蓋全部政策性銀行、5/6國有大行,覆蓋超100家資產規模千億級以上銀行
?在非銀領域,75%頭部保險、80%頭部券商、60%頭部基金公司已部署OceanBase
政企領域拓展全面提速:
?人社系統:江西率先完成養老保險全國統籌系統升級,獲人社部認可;海南、重慶、浙江等十余省份相繼跟進;目前服務全國1/3省級人社系統
?通信領域:深度覆蓋三大運營商,中國移動1/3省級公司、中國聯通超300套核心系統、中國電信翼支付全鏈路完成部署;廣東移動六大區域核心CRM/計費系統實現從集中式向分布式架構升級,打造“廣東樣板”
公有云:第二增長曲線加速成長
作為“第二增長曲線”,OB Cloud近三年客戶數年均增長115%,營收占比達30%。其多云原生能力支持七大云平臺無縫運行,助力高德實現性能提升25%、成本降低50%,支撐安踏并購后業務高速增長。
全球化布局與生態建設
OceanBase已建立覆蓋全球的服務網絡,在馬來西亞、歐洲、北美設立三大服務中心,構建“Follow-the-sun”支持體系。生態建設成效顯著,合作伙伴貢獻專有云超70%收入,公有云生態收入年增速達300%。
未來展望:從“Data+AI”到“Data×AI”的范式革命
站在十五年新起點,OceanBase正式開啟“Data×AI”新范式。
“十五年磨一劍,OceanBase將持續深化‘Data×AI’戰略。”楊冰表示,“以‘一體化’理念推進架構、存儲與負載的全面融合,打造面向未來的一體化數據底座;同時加大全球開源投入,加速全球化進程,堅定邁向世界級數據庫。”
OceanBase用4000家客戶的實踐表明,在AI時代,一體化不是選擇題,而是必答題。當數據與智能的邊界日益模糊,當實時與融合成為剛需,誰能更好地打通數據與AI的任督二脈,誰就能在未來的競爭中占據先機。
這條路并不好走,但正如OceanBase十五年來的堅持——做基礎設施,是良心活。世界級數據庫的夢想,正在一步步照進現實。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.