12月13日,第二屆CCF中國數據大會上,螞蟻數科宣布開源旗下數據智能體關鍵技術Agentar SQL全套論文、代碼、模型和使用指南。該智能體技術可讓非專業人員通過日常語言進行商業數據查詢和分析,為企業數智化提供更精準可用的智能數據分析基座。
螞蟻數科首期開源實時文本轉化結構化查詢語言(Text-to-SQL)框架,為開發者提供一套開箱即用的數據查詢方案,提升文本與數據庫查詢交互效率。2026年,螞蟻數科將陸續開源數據庫理解與挖掘、行業知識挖掘、實時多輪交互技術框架,覆蓋意圖理解、業務理解到數據理解的全鏈路數據能力。
記者了解到,在某頭部城商行試運營期間,螞蟻數科Agentar SQL多個工具的平均查詢準確率超92%,較傳統查詢方案提升超3倍。
![]()
今年9月25日,由該技術支持的螞蟻數科數據分析智能體Agentar-Scale-SQL登頂全球最具權威性的自然語言轉結構化查詢語言(NL2SQL)評測基準BIRD-SQL,超越Google等諸多國內外廠商。目前,該智能體仍在執行準確率排行榜以及執行效率榜保持雙榜第一,已持續領跑超兩月。
BIRD-SQL要求AI模型將自然語言查詢轉換為SQL,并且在真實復雜的大規模生產級數據庫中穩定執行。其數據集覆蓋金融、電力、醫療等37個真實行業場景,總量33GB,包含超過1萬條高復雜度查詢任務,被認為是全球最難的NL2SQL測試。
![]()
研究機構預測,全球商業智能市場規模2025年達474.8億。中國商業智能與分析軟件市場規模2025年達12億。預計到2028年,中國商業智能軟件市場規模將達到17.9億美元,未來5年市場年復合增長率(CAGR)為12.7%,成為未來構建企業智能技術的重要且必要的投資領域。
目前,中國企業對商業智能與分析產品的使用深度差異較大,大部分集中在報表、駕駛艙、儀表板、數據大屏等數據可視化和簡單分析需求。而如何在保持準確性的前提下,提升在真實生產環境中的可用性被認為是NL2SQL在產業中規模化落地的普遍挑戰。
螞蟻數科AI技術負責人章鵬在會上指出,NL2SQL在實際落地中面臨四大嚴峻挑戰:理解模糊多義的人類口語、注入龐大的行業專業知識、解析復雜的數據庫結構與關聯,以及生成準確無誤的復雜SQL語句。這些挑戰意味著,簡單的模型“套殼”遠不足以滿足企業級應用的可靠性與準確性要求。
例如金融領域從業者往往需要結合復雜業務規則與多條件組合進行數據查詢才能有效地進行產品數據分析;業務管理中,非專業數據分析人員口語化提問,則需要背后的產品保證行業術語、詢問意圖的正確理解,再與數據庫字段精準匹配,才能產出真實準確的結果。
章鵬強調,BIRD-SQL主要評測SQL的復雜度生成能力(在線擴展Online Scaling),但要真正實現產業可用的NL2SQL乃至數據智能體技術,必須構建更完整的能力棧。除了在線擴展,還需包含:
1. 離線擴展(Offline Scaling):對數據庫的深度理解與知識結構化。
2. 人機交互(Human Interaction):智能體識別自身不確定性,主動與用戶澄清意圖,實現白盒化、可糾錯的協作。
3. 自我進化(Self Evolution):通過“記憶”優化、工具(如UDF)創建與復用等“免調優”技術,使智能體能夠從錯誤中學習,持續提升,降低對大量標注數據和專家調優的依賴。
螞蟻數科計劃逐步將這些更全面的能力模塊持續開源,如理解數據庫的Agentar Profiling-SQL、實現免調優進化的Agentar TuningFree-SQL等。首期在線擴展框架Agentar-Scale-SQL開源內容已發布在arXiv、GitHub、ModelScope及Hugging Face等平臺,并迅速獲得了開發者的關注。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.