近日,在2025 OceanBase年度發布會上,OceanBase發布並開源了其首款AI數據庫OceanBase seekdb(簡稱“seekdb”)。開發者僅需三行代碼,即可快速構建知識庫、智能體等AI應用,輕鬆應對百億級多模數據檢索,真正實現“開箱即用”的AI數據基座。
該産品支持向量、全文、標量及空間地理數據的統一混合搜索,深度融合AI推理與數據處理,並兼容Hugging Face、LangChain等30余種主流AI框架。這一産品實現了數據庫從傳統“業務支撐系統”邁向“AI原生數據入口”的新功能,也是OceanBase自啟動“Data×AI”戰略以來的一份答卷。CEO楊冰&&,希望OceanBase能夠探索出一條數據庫在AI時代的範式躍遷。
楊冰認為,AI的真正瓶頸不在模型,而在數據。尤其在金融、政務等高敏場景,AI需在毫秒級完成實時推理,並安全融合私有數據。而傳統架構依賴多系統拼接數據鏈路,不僅複雜低效,還易引發權限混亂與延遲風險。
“seekdb不是傳統數據庫的功能疊加,而是專為AI時代重構的AI原生數據庫。”楊冰&&,“它繼承OceanBase的代碼和設計理念,更輕量、更敏捷,目標是成為大模型與私有數據融合計算的‘實時入口層’。我們希望與開發者一起,在混合搜索、多模融合等方向加速迭代、大膽創新。”
據介紹,seekdb帶來三大核心突破。一是AI原生混合搜索能力。seekdb支持在一個查詢中融合向量檢索、全文搜索與標量過濾,採用“粗排+精排”多階段檢索機制,在低延遲的同時提升精度。依託成熟的事務引擎,它支持實時寫入與ACID一致性,並兼容MySQL生態。二是極簡部署,開箱即用。seekdb最低僅需1核CPU、2GB內存,支持pip install一鍵安裝、秒級啟動,兼容嵌入式與客戶端/服務器雙部署模式,可輕鬆集成至智能Agent、開發工具鏈或本地應用,大幅降低AI應用的工程門檻。三是更開發者友好。seekdb以Apache 2.0協議全球開源,開發者可自由使用、修改和擴展。産品全面兼容30余種AI框架及MCP大模型協議,無縫融入AI生態;並提供SQL及PythonSDK,適配不同開發習慣。
目前,OceanBase的混合搜索能力已在多個行業成功落地,充分驗證了其技術價值:中國聯通基於混合搜索構建統一AI知識庫,有效解決了私有文檔的權限管理與高效檢索難題;螞蟻百寶箱則基於混合搜索實現智能體的實時在線搜索,顯著提升了信息獲取的精準性與響應效率。
“這不僅是技術産品,更是開發範式的躍遷。”楊冰&&,“傳統數據庫只‘存’數據,而seekdb能‘理解’數據語義,混合搜索正是AI原生數據庫的關鍵分水嶺。”過去十五年,OceanBase在“雙11”等極限場景錘煉出的工程化能力,正轉化為AI時代的底層優勢,在AI原生混合搜索、多模融合、TP/AP/AI一體化、多雲原生等方向持續突破。
自2010年由螞蟻集團自主研發以來,OceanBase已服務全球4000余家企業,覆蓋金融、政企、能源、通信、零售、製造、互聯網等關鍵領域。其雲服務OB Cloud是全球唯一同時支持阿里雲、華為雲、騰訊雲、百度智能雲、AWS、GCP、Azure七大主流雲廠商的數據庫産品,業務遍及全球16個國家和地區、60多個地域、240多個可用區。

