- 金磊 發自 凹非寺
- 量子位 | 公眾號 QbitAI
不鳴則已,一鳴驚人。
沒想到一個低調霸榜了全球最權威SQL榜單超過兩個月的國產AI,這一次選擇了高調開源
![]()
如此反差劇情的主角正是螞蟻數科,在第二屆CCF中國數據大會上,它正式宣布:
- 開源旗下數據智能體關鍵技術——Agentar-SQL系列。
此次開源不僅包含實時文本轉SQL(Text-to-SQL)框架的全套論文、代碼、模型和使用指南,后期還將陸續開源數據庫理解與挖掘、行業知識挖掘、實時多輪交互技術框架,覆蓋意圖理解、業務理解到數據理解的全鏈路數據能力。
如果你關注AI數據分析領域,大概率聽說過BIRD-Bench。這是目前全球公認最具權威性的NL2SQL評測基準。
就在今年9月,螞蟻數科的Agentar-Scale-SQL在BIRD榜單上以執行準確率(81.67%)和執行效率(77%),雙料第一的成績登頂一舉超越了谷歌、亞馬遜等國際科技巨頭。
![]()
自然語言轉SQL(NL2SQL)在實際落地中面臨四大嚴峻挑戰:理解模糊多義的人類口語、注入龐大的行業專業知識、解析復雜的數據庫結構與關聯,以及生成準確無誤的復雜SQL語句。這些挑戰意味著,簡單的模型“套殼”遠不足以滿足企業級應用的可靠性與準確性要求。
螞蟻數科的Agentar-SQL核心思想在于,不是追求單一“完美”的SQL生成,而是通過系統化工程方法,真正讓AI賦能生產,讓數據結果懂需求、懂業務。在某頭部城商行試運營期間,螞蟻數科Agentar SQL多個工具的平均查詢準確率超92%,較傳統查詢方案提升超3倍。
但這樣的成績,還不足以形容螞蟻數科。
一直以來,螞蟻數科的AI發展可謂非常“低調”。如果深挖今年的動作會發現,螞蟻數科的AI版圖已經非常成熟與豐富,走出了一條中國AI“非常識”但又價值巨大的新路徑。
螞蟻數科CEO趙聞飆近日在生態伙伴大會上的一番話,道出了螞蟻數科AI布局上的真實“野心”:
- AI的真正價值不僅在于技術的先進性,更在于能否深入產業一線、解決實際問題。
![]()
△螞蟻數科CEO趙聞飆
之所以會有這番言論,是因為這個AI誕生的地方,正是在金融行業這個最復雜、數據門檻最高的業務場景,它經受住了比任何公開榜單都嚴酷的考驗——
從登榜到開源,從金融到各行各業,螞蟻數科正在用一套務實的方法論,回答產業AI如何真正用起來。
從一場非共識的死磕說起
讓我們先把時間撥回到2024年初。
那是百模大戰打得最兇的時候,市面上的AI公司大多在做兩件事:要么在刷各種通用榜單,證明自己的模型智商有多高;要么在做Chatbot,試圖讓AI變得更像一個陪聊伙伴。
但螞蟻數科的CEO趙聞飆和他的團隊的做法,卻顯得有些“格格不入”——
一頭扎數據門檻最高、合規要求最嚴的金融領域,這個被普遍認為是AI落地的“深水區”。
這個戰略從表面上來看是一點也不性感的,它意味著團隊必須要與“兩高一長”相伴:高風險、高投入、長回報周期。
因為這里沒有“差不多”,只有“百分百”。一個錯誤的回答不僅僅是用戶體驗下降這么簡單,更可能意味著巨額資金的損失,甚至是監管的紅牌罰下。
金融場景的極端復雜性,體現在三個維度:
- 數據高度敏感且孤島化:客戶資產、交易流水、風控規則等關鍵數據分散在多個系統,互不打通;
- 業務邏輯極其嚴謹:如“重點客戶”不是模糊標簽,而是“本季度活躍度大于80分”的明確定義;
- 合規要求近乎苛刻:所有AI推理必須可解釋、可審計、可回溯,不允許“黑箱決策”。
每一項對AI來說都是老大難的問題。
換言之,一個AI若是能精準地搞定最難領域的問題,那它再身處別的領域時就會變得從從容容游刃有余。
但螞蟻數科偏偏選擇了死磕,事實證明,這場豪賭,他們贏了。
因為最新的成績單顯示:螞蟻數科的服務已經覆蓋了100%的國有股份制銀行,以及超過60%的地方性商業銀行。
可以說中國金融體系的毛細血管里,已經流淌著螞蟻數科的代碼。
不僅如此,他們還悄然躋身了IDC《中國智能體開發平臺2025年廠商評估》的領導者象限,意味著在市場份額和技術實力上,他們已經站到了第一梯隊。
但光有戰略定力是不夠的,AI發展到現在的階段,更看重的好不好用。
在寧波銀行,雙方合作打造的智能化決策系統,便徹底打破了傳統金融服務的知識孤島。
過去,客戶經理面對一個復雜的投資咨詢,需要在多個系統間來回切換,答案常常是模糊的、滯后的。
新系統通過“規劃-檢索-推理”的智能機制,實現了從模糊匹配到精準推理的跨越。復雜問題回答準確率從68%躍升至91%,響應速度進入百毫秒級。
更關鍵的是,系統能清晰呈現推理過程與數據來源,在強監管的金融場景中實現AI黑箱白化。
上海銀行推出的AI手機銀行,則是另一種維度的革新。
它以對話即服務為核心,用戶通過自然語言交互即可辦理轉賬、理財咨詢、養老金查詢等業務。這不再是簡單的功能堆砌,而是體驗的重構,從“人找服務”到“服務找人”。
配合千人千面的個性化推薦與適老化設計,它已經成為了行業數智化轉型的典型樣本。
已經從金融級外溢到了產業級
金融領域的成功實踐,為螞蟻數科積累了可遷移的產業AI方法論,也推動其能力向更多民生領域延伸。
在南京,螞蟻數科與南京公交聯合打造的公交智能體小藍鯨,便是這一能力外溢的典型案例。
![]()
它將金融領域驗證過的“規劃-檢索-推理”邏輯,應用到了城市交通的復雜系統中。
從分析客流到生成線路,再到輸出經濟可行性報告,小藍鯨展現的是一種通用的、可遷移的產業AI能力。
210路公交車的開通,可謂是一下子把之前這片區域的公交線網空白給填上了,單日最高客流達2168人次,老年卡使用占比近50%。
不僅如此,類似210路這樣在AI建議下開通的公交,在南京已經有30多個,還新增了84個招呼站!
![]()
據悉,這是國內首次將AI智能體技術深度應用于公共交通調度系統,根據站點、客流、線路等多維數據分析,實現從經驗決策到智能規劃的全面升級。
能源領域,這種能力同樣鋒利。
螞蟻數科的 EnergyTS 能源電力時序大模型,能夠精準預測發電量和市場供需變化。
在投前決策環節,它能將原本需要2–3天的人工投資測算,縮短為十余分鐘,決策效率提升超60倍,已助力協鑫能科、霍普等企業實現數智化升級。
由此可見,從最難的場景切入,延伸到更廣的場景,用最硬的指標說話,這就是螞蟻數科在過去一年里上演的非共識劇本。
還敢按效果付費
技術再牛,如果賣不出去,也是白搭。
在To B的軟件市場,傳統的收費模式無非兩種:要么按項目制收費,要么是按訂閱制收費。
但這兩種模式都有痛點:甲方覺得我花了錢,萬一效果不好怎么辦?乙方覺得我投入了這么多人力,利潤薄如刀片。
螞蟻數科在付費模式上采取的做法也是一種非共識的打法——按效果付費。
這種模式,極大地降低了中小機構應用AI的門檻和風險。客戶不再需要為不確定的技術前景買單,而是為確定的業務結果付費。
這就倒逼了技術提供商必須真正深入業務一線,理解客戶的痛點,將技術能力轉化為可量化的商業價值。這是一種對自身能力的極度自信,也是一種對產業伙伴的真誠負責。
要規模化地實現這種模式,單打獨斗是行不通的,螞蟻數科深諳這一道理,因此,生態共榮,成為它必然選擇。
據了解,截至今年,螞蟻數科已與300家合作伙伴建立深度合作,共同服務超13000家終端客戶。
在這次的大會上,螞蟻數科正式升級了“星瀾計劃”,從技術賦能、運營支持、商機共享、資金扶持四個維度,全面提升伙伴能力,推動整個生態的全域升級。
![]()
一位合作伙伴在現場分享,今年其30%的營收來自與螞蟻數科的合作業務。這不僅僅是數字,更是市場對這套“技術+生態+商業化”組合拳的有力投票。伙伴們通過合作,沉淀出了一套AI賦能垂直場景的方法論,共同推動產業AI的規模化落地。
這種生態的視野,甚至延伸到了全球。
螞蟻數科的技術方案,已服務南洋商業銀行、渣打銀行等超百家海外金融機構。今年10月,其入選香港金融管理局生成式AI沙盒項目,為沙盒提供AI智能體服務與AI安全產品。
這標志著源自中國嚴苛金融場景打磨出的AI方案,正獲得國際市場的認可,展現出強大的全球競爭力。
在通用AI的喧囂之后,產業AI的務實革命才剛剛開始;而這場革命的主角,必將是那些敢于用效果說話的實干者。
— 完 —
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.