蚂蚁数科发布金融大模型,开启智能体应用新时代,推动金融服务智能化升级。
7月28日,在2025世界人工智能大会论坛上,蚂蚁数科正式发布金融推理大模型Agentar-Fin-R1,标志着金融AI应用迈向“可靠、可控、可优化”的新阶段。该模型基于Qwen3研发,在FinEval1.0、FinanceIQ等权威金融大模型评测基准中表现卓越,超越了包括DeepSeek-R1在内的多个同尺寸开源通用及金融专用大模型,展现出更强的金融专业性、复杂推理能力以及安全合规保障能力。
当前,金融业正加速推进数智化转型,大模型技术在智能投顾、信贷风控、客户服务、合规审查等场景中的应用日益深入。然而,通用大模型在面对高度专业化、强监管属性的金融任务时,往往暴露出知识不足、逻辑推理薄弱、合规风险高等问题。如何弥合“通用AI”与“产业需求”之间的鸿沟,成为行业亟待解决的核心挑战。
“通用大模型距离产业实际应用存在‘知识鸿沟’。构建专业的金融大模型是推进金融与AI深度融合的必然路径,未来,金融大模型的应用深度将成为金融机构竞争力的关键要素。”蚂蚁数科CEO赵闻飙在演讲中的这番话,直击行业痛点。我认为,这句话不仅是技术路线的判断,更是对金融AI发展范式的重新定义——从“泛化能力优先”转向“垂直能力为王”。
据官方介绍,Agentar-Fin-R1之所以能在多项评测中拔得头筹,得益于蚂蚁数科在数据体系和训练算法上的双重突破。通过构建覆盖银行、证券、保险、基金、信托等6大类、66小类金融场景的任务分类体系,并依托千亿级金融专业语料,结合可信数据合成与专家标注的长思维链(CoT)机制,模型实现了“出厂即专家”的能力跃迁。这种“专业预训练+场景化强化”的路径,或许将成为垂直领域大模型发展的标准范式。
更值得关注的是其训练层面的创新。蚂蚁数科采用加权训练算法,显著提升了模型对复杂金融任务的学习效率与性能表现。这意味着企业在后续部署时,无需投入大量标注数据进行二次微调,大幅降低了算力消耗和落地成本。对于中小型金融机构而言,这一技术进步极具现实意义——它让高阶AI能力不再只是头部机构的专属资源。
Agentar-Fin-R1提供32B和8B参数版本,兼顾性能与部署灵活性,同时配套推出基于百灵大模型的MOE架构版本以提升推理速度。此外,还包含14B和72B参数的非推理版本,满足不同金融机构在边缘设备、私有化部署、高性能计算等多样化场景下的需求。这种“全栈式”产品布局,体现了蚂蚁数科对企业级AI服务的深度理解。
尤为值得一提的是,蚂蚁数科联合中国工商银行、宁波银行、北京前沿金融监管科技研究院、上海人工智能行业协会等机构共同推出Finova大模型金融应用评测基准。该基准聚焦智能体能力、复杂推理与安全合规三大维度,真实模拟金融业务场景,具备高度的实践指导价值。令人瞩目的是,Agentar-Fin-R1在Finova评测中不仅斩获最高分,甚至超越更大参数规模的通用模型。目前Finova已全面开源,此举有望推动整个行业建立统一、透明、可衡量的金融AI评估标准,值得点赞。
作为蚂蚁集团旗下的独立科技子公司,蚂蚁数科近年来持续深耕AI与Web3技术,助力产业数智化升级。今年以来,公司加速布局企业级大模型服务,重点聚焦金融与新能源两大领域。此前推出的金融智能体平台Agentar已通过信通院评测并获得最高等级5级认证,并联合生态伙伴推出超百个金融智能体解决方案,推动大模型在金融行业实现规模化落地。
一个典型案例是上海某银行在其手机银行中引入蚂蚁数科技术支持后,打造了“对话即服务”的AI交互新模式。用户只需自然语言对话,即可完成理财咨询、转账操作、贷款申请等多项服务,极大提升了使用便捷性,尤其受到老年客户群体欢迎,客户满意度显著上升,月活跃用户同比增长25%。这一案例生动证明:真正有价值的AI,不是炫技的工具,而是能解决真实用户痛点的“隐形助手”。
截至目前,蚂蚁数科已服务全部国有银行和股份制银行、超60%的地方性商业银行以及数百家金融机构。这一覆盖率背后,不只是技术实力的体现,更是对金融行业流程、制度、风险文化的深刻理解。在AI与金融深度融合的今天,技术提供商的角色正在从“工具供应商”进化为“业务共建者”。而Agentar-Fin-R1的发布,或许正是这一转变的重要里程碑。
留言评论
(已有 0 条评论)暂无评论,成为第一个评论者吧!