在今日舉行的世界人工智能大會論壇上,螞蟻數科隆重推出其最新研發的金融推理大模型 ——Agentar-Fin-R1。這款模型是基於阿里巴巴的通義千問 Qwen3大模型打造,專注於金融行業的專業性、推理能力以及安全合規能力,旨在爲金融機構提供一個 “可靠、可控、可優化” 的智能中樞。
Agentar-Fin-R1在多個權威評測基準上表現出色,不僅超越了同尺寸的開源通用大模型 Deepseek-R1,還在 FinEval1.0和 FinanceIQ 等金融大模型評測中取得了優異的成績。這一成果表明,螞蟻數科在金融領域的 AI 應用已然邁入了新的高度。
爲了滿足不同金融機構在多樣化場景下的需求,Agentar-Fin-R1提供了32B 和8B 參數兩個版本,此外還有非推理版本的14B 和72B 參數模型。螞蟻數科的 CEO 趙聞飆在發佈會上表示,當前通用大模型與產業實際應用之間存在 “知識鴻溝”,因此構建專業的金融大模型是金融與 AI 深度融合的必然之路。未來,金融大模型的應用深度將成爲金融機構競爭力的關鍵因素。
在數據層面,螞蟻數科構建了一個業內最全面的金融任務分類體系,包括6大類、66小類場景,覆蓋銀行、證券、保險、基金、信託等金融全場景。藉助千億級金融專業數據語料和專家標註的金融長思維鏈(CoT)構造機制,Agentar-Fin-R1展現出其 “天生懂金融” 的能力。
如今,螞蟻數科已經幫助上海某銀行打造出一款 “AI 手機銀行”,爲用戶提供自然對話式的金融服務。這種 “對話即服務” 的模式不僅提升了老年客戶的滿意度,還使得月活用戶同比增長了25%。
論文地址:https://arxiv.org/pdf/2507.16802