12月20日,在華爾街見聞和中歐國際工商學院聯合主辦的「Alpha峰會」上,螞蟻數科AI原生事業部總經理王磊發表題為《探索金融AI深水區--大模型垂直落地的實踐與啟示》的演講。
他表示,隨著DeepSeek、Qwen等開源基礎模型的出現,行業大模型落地不再依賴昂貴的預訓練,而是轉向“后訓練”模式。這一轉變使得金融垂類模型的迭代周期從數月縮短至兩周,算力需求從“萬卡”降至“百卡”,訓練成本實現百倍級下降,大幅降低了產業應用門檻。
![]()
他認為,在金融等嚴肅產業落地AI,必須關注嚴謹性、專業性和遵從性。他強調,大模型無法完全避免幻覺,甚至隨著推理能力提升幻覺可能增強。因此,構建一套壓制幻覺的體系和方法論,是面向垂直行業應用大模型的第一要務,必須守住安全底線。
他并指出,金融行業落地大模型的核心在于構建“可信智能體”,這需要三大基石:一是疊加行業數據的“金融大模型”作為大腦;二是補充時效性與私有數據的“金融知識庫”作為經驗;三是連接業務系統的“金融工具集”作為雙手,三者結合才能讓AI像專業員工一樣工作。
螞蟻數科AI原生事業部總經理王磊還表示,大模型在產業中的應用不僅是一場技術革命,更是一次業務戰略的重塑。他呼吁企業不應只做平庸的中立者,而應突破既有工作流程的條條框框,思考如何讓大模型重塑所有的業務流和工作流,從而帶來真正的產業價值。
以下為演講精彩觀點:
隨著DeepSeek的問世,首批面臨淘汰的是那些專注于基礎模型研發的企業,這促使整個行業將關注重心轉向應用落地。
大模型的問世帶來了自然語言理解領域的革命性突破,這一核心能力極大地降低了人機交互的門檻。
產業界無需再單純依靠堆砌海量算力與人力,或購買大量數據進行模型重訓。我們已探索出一條切實可行的產業落地路徑,即通過疊加垂直領域的專業數據來賦能模型。
我們必須正視大模型這把“雙刃劍”。在深入應用大模型的過程中,構建一套有效抑制“幻覺”的體系與方法論,是面向垂直行業應用時的首要任務。
模型的構建決定了能力的上限,而安全能力則是不可逾越的底線。
評測是大模型應用的起點。智能體的構建并非一次性的軟件交付,而是一個持續培養與迭代優化的過程。
以往的預訓練模型往往依賴萬卡集群,而訓練此類金融垂直領域模型僅需百卡規模,算力需求實現了兩個數量級的縮減。
推動AI在產業界落地時,需關注眾多可信特征。將其高度概括,核心在于三點:嚴謹性、專業性與遵從性。
將大模型應用于產業時,我不愿止步于平庸的中立立場,而堅定地選擇變革的一方,即致力于“戰略重塑”。
在探討大模型于業務及工作流程中的作用時,我們需要突破既有框架的束縛,致力于利用大模型全面重塑現有的工作流程。
以下為演講實錄:
尊敬的各位朋友:
很高興今天能有機會與大家分享螞蟻集團過去一年在大模型金融行業落地過程中的思考與實踐。
這一主題的分享在當下正當其時。因為我們正處于產業擁抱 AI 的關鍵節點,而這個節點的源頭可以追溯到十年前。
一、AI 發展的十年歷程與變革
回顧過去十幾年,這是 AI 浪潮蓬勃發展的十年,大家也能切身感知到 AI 給生活帶來的顯著變化。這張圖將螞蟻集團在 AI 領域的探索與主要產品緊密連接,展示了技術發展的脈絡。
我們可以用技術語言來標記這個起點:2012 年,當時,大家可能不熟悉 AlexNet 這家公司,但或許聽說過“卷積神經網絡”。在那年美國的 ImageNet 大賽中,AlexNet 憑借卷積神經網絡大幅提升了圖像識別的準確度、速度和效率,以大幅領先第二名的優勢取得了優異成績。自此,行業內誕生了如曠視科技、海康威視等大量以識別為核心技術的公司。如今道路上廣泛使用的攝像頭進行車牌和人臉識別的高效運作,皆源于此起點。
同樣在 2012 年,支付寶推出了革命性的移動支付技術——二維碼支付。其識別效率的提升并真正走進千家萬戶,歸功于 AI 技術。2016 年,AlphaGo 戰勝韓國圍棋世界冠軍李世石,打破了人類對圍棋這一“掌上明珠”不可被戰勝的認知,證明了強化學習構建的決策模型在復雜決策領域已能超越人類。
此后,我們將決策模型廣泛應用于生活。例如余額寶、花唄、借唄、網商貸等產品,其背后的服務主體并非人力,而是人工智能。普惠金融建立在 AI 基礎之上,通過模型我們要么能快速識別授信額度與放款時長,識別真正的需求者與潛在的欺詐風險。
決策模型的出現,讓大眾享受到了 AI 的價值。如果說彼時還是“小模型”時代,那么 2022 年 OpenAI 發布的 ChatGPT 則開啟了“大模型”時代,參數量從萬級躍升至萬億級。大模型(常被稱為 AIGC 生成模型)的核心價值在于自然語言理解的革命性突破。從文本理解到多模態(圖片、音頻、視頻)的識別與生成,其本質變革在于極大地降低了人機交互的門檻。
縱觀計算機產業過去三十年,每一次人機交互效率的提升與門檻的降低,都會引發影響未來五至二十年的產業革命。從微軟到 iPhone 再到如今的大模型,這一進程不可逆轉且奔涌向前。
二、螞蟻集團的 AI 產業布局與智能體元年
在此過程中,阿里巴巴與螞蟻集團也在適應科技變化,推出了一系列 AI 應用,如醫療領域的“阿福”(原名 AQ)、金融大模型應用“螞小財”、多模態助手“靈光”以及阿里集團旗下的眾多 AI 助手。
當前 ToC 領域格局已趨于明確。今天我想重點探討產業化 ToB 領域。螞蟻數科作為螞蟻集團旗下致力于產業 AI 賦能的 ToB 科技公司,我們認為今年是 AI Agent(智能體)元年。
過去幾年,大模型構建往往局限于擁有大量數據、算力和人才的大公司,高昂的門檻使其對許多企業而言可望不可及。如果產業應用的前提是必須自研大模型,則無法實現真正的產業化。
但今年 DeepSeek 等開源模型的出現改變了這一局面。它們不僅提供了優秀的算法,更代表了基礎模型向全行業的開放。這使得產業界無需再通過堆砌資源進行預訓練,而是找到了一條行之有效的落地路徑:在開源基礎模型(如 DeepSeek、通義千問、螞蟻百靈)基礎上,疊加產業垂直領域數據進行后訓練。這一模式將模型迭代周期從三至六個月縮短至一個月甚至兩周,極大降低了垂類應用的門檻,促使行業目光從基礎模型轉向應用層。
三、 金融行業大模型落地的痛點與“可信智能體”
關于大模型是否能帶來實際業務價值,我們的答案是肯定的。但在與銀行業 CIO 的交流中,我們總結了金融行業落地的六大痛點:算力有限、數據不足且質量不高、模型迭代太快、知識經驗沉淀不足、缺乏應用落地方法論以及人才短缺。
針對這些痛點,螞蟻數科提出了面向 AI 的戰略。在金融這類嚴肅產業落地 AI,必須關注三點核心特征:嚴謹性、專業性與遵從性。
嚴謹性(對抗幻覺):大模型無法完全避免幻覺,某種程度上這也是其智力水平的體現(如 DeepSeek R1 的推理能力增強伴隨著幻覺率波動)。因此,應用大模型的首要任務是構建一套壓制幻覺的體系。
專業性(對齊專家):大模型需體現機構自身的意志,避免千篇一律。
遵從性(合規底線):在強監管行業,必須確保模型不觸碰紅線和底線。
我們將具備上述特征的稱為“可信智能體”。在金融領域,其構建依賴三大基石:
金融大模型:類似經過寒窗苦讀的“金融博士”,具備通用與金融專業知識。
金融知識庫:補充高時效性數據及銀行私有知識,使其成為熟悉行內情況的“管培生”。
金融工具集:連接銀行內部數字化系統的 API,賦予智能體“手”的能力,使其能執行具體操作。
四、訓練方法論與未來展望
在構建金融大模型時,我們采用兩階段訓練方法,核心在于數據的理解與治理。僅疊加金融數據是不夠的,需將通用數據(數學、歷史等)與金融數據合理配比,以確保在提升金融能力的同時,不降低通用能力。相較于預訓練,這種垂類模型訓練成本極低,算力需求下降了兩個數量級(僅需百卡級別)。
同時,模型訓練需設定安全圍欄,將安全領域知識融入訓練,確保智能體知曉業務底線。
智能體的應用不是一次性的軟件交付,而是一個持續培養與迭代的過程(類似從入學到工作的成長)。我們需要從評測入手,通過分析錯題(Badcase)來判斷是知識缺失、工具不足還是產生幻覺。例如,針對大模型在大數計算上的短板(如概率導致的數值錯誤),我們限制其直接計算,轉而強制調用銀行系統 API 以確保準確性。
最后,我想強調:大模型在產業應用中不僅是技術的重塑,更是業務戰略的重塑。我們應突破傳統思維框架,思考如何讓大模型重塑現有的工作流程。
謝謝大家。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.