螞蟻金融數據庫(螞蟻集團 金融公司)
【環球網科技報道 記者 李文瑤】7月28日,螞蟻世界人工智能大會(WAIC)上,金融螞蟻數科宣布推出國內首個專注金融推理的數據司商業化大模型,同步開源包含1350道金融難題的庫螞Finova評測基準及百萬級DeepFinance訓練數據集。
這一動作被視為中國產業AI向高價值場景攻堅的蟻集關鍵突破之一,也折射出金融智能化進程中的團金現實挑戰與破局路徑行業痛點:金融AI陷“滲透率悖論”盡管全球金融機構對AI投入持續加碼,但核心業務場景滲透率仍處低位花旗銀行一項調研數據顯示,螞蟻93%的金融金融機構預計人工智能將在未來五年內提高利潤,預計到2028年,數據司人工智能可以將銀行業利潤提高9%,庫螞即1700億美元。蟻集

螞蟻數科金融AI產品總經理曹剛在接受采訪時坦言,團金“走到業務深水區,螞蟻比如營銷、金融風控以及客戶經理銷售等,數據司這些領域智能體應用滲透率就會低很多”其根本矛盾在于金融場景的專業嚴苛性要求:在技術發展層面,大模型技術尤其是推理模型發展時間短,尚不成熟。
這導致其在關鍵業務場景的應用效果存在不確定性,使得許多機構持謹慎觀望態度,只在非核心通用場景進行試驗金融等專業領域業務極其復雜,如銀行零售業務包含十多個大場景、上百個細分場景每個細分場景都有獨特問題和需求,需要智能助理進行深度理解和定制化解決。
這要求極高的領域專業知識和高質量數據支持,并非所有行業都具備這些條件,應用需要“更深深度”同時,大模型的訓練、部署和推理成本仍然很高,硬件(如GPU卡)投入大,推理效率相對較低,對底層算力要求高機構必須審慎評估技術投入成本與商業價值之間的平衡點。
過高的成本使得在業務領域大規模應用存在經濟可行性的疑問,導致市場對其在核心業務應用持質疑態度在曹剛看來,由于技術尚處早期、專業場景的深度與復雜性要求極高,以及高昂成本帶來的經濟性挑戰,當前大模型尤其是智能體和個人助理在金融等核心業務領域的落地應用仍面臨顯著障礙,進展不如通用領域順利。
這導致了市場的謹慎和觀望心態螞蟻方案:垂直縱深構建“金融腦”螞蟻數科CTO王維給出的發展路線是專注金融與能源兩大高價值賽道,不做通用大模型,而是“用垂直深度構建護城河”此次發布的金融大模型專注金融場景的復雜推理需求(如風控、理財建議),通過兩階段訓練(通用基座+金融場景微調)顯著提升專業表現。
螞蟻數科自建DeepFinance金融思維鏈數據集,由金融專家標注,覆蓋存款、信貸、投資等14大場景、上百細分任務同時,大模型集成“蟻天鑒”安全評測層,確保輸出符合金融級審慎要求,抑制幻覺并滿足合規可以看到,對于金融大模型,螞蟻數科給出的解題思路是以推理能力+安全合規為核心,通過垂直訓練、高質量數據、工程優化解決金融場景的“高專業、低容錯”痛點。
開源數據集+評測基準推動行業共建,降低金融AI落地門檻聚焦頭部銀行/保險客戶,提供從咨詢到產品的全鏈路服務,目標是成為“金融AI落地的基礎設施”王維判斷,AI應用正從“通用場景試驗”逐步向“核心業務重構”推進,金融推理模型是“智能體的中樞齒輪”,缺失則無法驅動業務重構。
未來發展:從工具升級為決策者“金融智能體的終局不是人機協作,而是AI組織驅動業務”螞蟻數科CTO王維這樣判斷未來金融行業大模型的應用趨勢這一論斷背后,也隱藏著螞蟻對金融AI技術拐點的洞察——推理大模型正推動AI從“工具”升級為“決策者”。
據王維描述,金融AI已進入“場景攻堅期”:從短期來看,智能體滲透營銷、風控等深水區,替代基礎決策;從長期來看,多智能體協作成常態,例如“風控智能體+投顧智能體”自動閉環服務高凈值客戶此次,螞蟻同步開源DeepFinance千億token訓練集,便是直擊行業“數據荒”痛點。
“當你知道技術的局限性,反而不會糾結‘真假智能體’——能力提升才是永恒趨勢”王維說道曹剛也指出,未來競爭核心是合規與責任:螞蟻在Agentar平臺內置“監管圍欄”,自動過濾不合規輸出;同時,行業也需要明確AI錯誤的責任歸屬問題。
金融AI正從技術探索期進入業務重構期,未來三年將圍繞推理模型普及、多智能體協作、成本民主化三大主線爆發螞蟻通過“開源數據集+垂直模型”組合,試圖定義行業新標準,而能否攻克“核心業務滲透”與“合規落地”,將成為勝負手。
正如王維所說:“我們短期高估AI,長期卻低估它——這是每一輪技術革命的宿命。”既要正視智能體的顛覆性潛力,又要扎根垂直場景做“難而正確的事”。返回搜狐,查看更多