2月6日消息,近日,針對首個面向信貸場景的多模態評測基準FCMBench-V1.0相關話題,奇富科技聯合復旦大學、華南理工大學研究人員進行了直播研討。作為奇富科技多模態負責人楊葉輝表示,AI是工具,而金融、醫療這樣的高門檻行業則是足夠“肥沃”的土地。正因為金融業務對隱私、安全與合規有著天然的高要求,模型能力是否真的可靠,不能只靠“自說自話”。
“評測先行,本質上是在做一把尺子。”楊葉輝談到,當前金融機構在選擇模型和方案時,常常陷入“不同模型分別聲稱得到了95分和98分,到底哪個好?”的困惑。沒有統一、公平、公開的評測體系,決策就容易失焦。FCMBench的價值,正在于把模型拉到同一條起跑線上,讓能力在真實業務條件下接受檢驗。
與此同時,華南理工大學許言午教授表示,很多人直覺上覺得AI在金融領域“存在感不強”,其實并不準確。AI早已深度參與保險定價、資產評估和量化交易,只是這些價值并不直接呈現在ToC產品中,因此“看不見”。許言午認為,金融行業更短的業務迭代周期,反而為模型評測和更新提供了現實土壤。他將數據集的發展分為三個階段:先夯實數據質量,再通過學術與賽事運營形成影響力,最終獲得行業層面的官方認可,成為類似托福、雅思那樣的“準入門檻”。在他看來,FCMBench正處在一個極具潛力的起點。
復旦大學陳濤教授表示,深度學習真正的分水嶺,并不只是算法突破,而是ImageNet的出現,讓評測尺度第一次實現了數量級躍遷,終結了小數據集時代“各說各話”的局面。陳濤談到,從數據規模、任務覆蓋度到評測設計的系統性來看,FCMBench已經是目前國內金融領域,乃至國際金融AI研究中規模最大、最具權威性、同時也是少有的統一評測基準。更重要的是,它并非為某一家機構服務,而是以行業共識為目標,定義了真正有價值的問題邊界。(易智)
