《鳳凰WEEKLY財經》獲悉,11月18日,OceanBase發布并開源了其首款AI數據庫OceanBase seekdb(簡稱seekdb)。
據悉,該產品支持向量、全文、標量及空間地理數據的統一混合搜索,深度融合AI推理與數據處理,并兼容Hugging Face、LangChain等30余種主流AI框架。CEO楊冰表示:“希望OceanBase能夠探索出一條數據庫在AI時代的范式躍遷。”
楊冰認為,AI的真正瓶頸不在模型,而在數據。尤其在金融、政務等高敏場景,AI需在毫秒級完成實時推理,并安全融合私有數據。而傳統架構依賴多系統拼接數據鏈路,不僅復雜低效,還易引發權限混亂與延遲風險。
“seekdb不是傳統數據庫的功能疊加,而是專為AI時代重構的AI原生數據庫。”楊冰表示,“它繼承OceanBase的代碼和設計理念,更輕量、更敏捷,目標是成為大模型與私有數據融合計算的‘實時入口層’。我們希望與開發者一起,在混合搜索、多模融合等方向加速迭代、大膽創新。”
據Gartner預測,到2028年,支持生成式AI的數據庫支出將達2180億美元,占市場74%。但MIT研究顯示,超95%的企業AI項目因多模態數據割裂、系統鏈路冗長、權限管理復雜難以落地。
而seekdb帶來了三大核心突破。一是AI原生混合搜索能力。seekdb支持在一個查詢中融合向量檢索、全文搜索與標量過濾,采用“粗排+精排”多階段檢索機制,在低延遲的同時提升精度。依托成熟的事務引擎,它支持實時寫入與ACID 一致性,并兼容MySQL生態。此外,seekdb支持標量、向量、文本、JSON和GIS等多模數據的統一存儲與檢索。例如,在反欺詐場景中,可直接查詢“近7天交易超5萬元、位置異常且行為類似歷史欺詐樣本”,無需跨系統調用,兼顧性能與安全。
二是極簡部署,開箱即用。seekdb最低僅需1核CPU、2GB內存,支持pip install一鍵安裝、秒級啟動,兼容嵌入式與客戶端/服務器雙部署模式,可輕松集成至智能Agent、開發工具鏈或本地應用,大幅降低AI應用的工程門檻。
三是更開發者友好。seekdb以Apache 2.0協議全球開源,開發者可自由使用、修改和擴展。產品全面兼容HuggingFace、Dify、LangChain等30余種AI框架及MCP大模型協議,無縫融入AI生態;并提供SQL及PythonSDK,適配不同開發習慣。同期開源的PowerRAG智能文檔解析框架與PowerMem分層記憶架構,后者在LOCOMO Benchmark上以73.70分登頂SOTA,Token消耗降低96%,大幅節省推理成本。
“這不僅是技術產品,更是開發范式的躍遷。”楊冰表示,“傳統數據庫只‘存’數據,而seekdb能‘理解’數據語義,混合搜索正是AI原生數據庫的關鍵分水嶺。”過去十五年,OceanBase在“雙11”等極限場景錘煉出的工程化能力,正轉化為AI時代的底層優勢,在AI原生混合搜索、多模融合、TP/AP/AI一體化、多云原生等方向持續突破。
自2010年由螞蟻集團自主研發以來,OceanBase已服務全球4000余家企業,覆蓋金融、政企、能源、通信、零售、制造、互聯網等關鍵領域。其云服務OB Cloud業務遍及全球16個國家和地區、60多個地域、240多個可用區。
楊冰強調:“未來數據庫必須同時服務‘人’與‘智能體’。在一個數據庫中支撐事務、分析與AI混合搜索,在數據源頭驅動實時、可信的智能。”seekdb現已在GitHub開源,新域名oceanbase.ai同步啟用,全球開發者可免費下載使用。此舉是OceanBase踐行AI戰略的關鍵一步,旨在推動行業加速邁向“智能原生”架構,為全球智能化轉型提供更普惠、更可落地的數據底座。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.