品读文章网
当前位置: 首页 实时讯息

金融大模型“狂飙”,理想与现实的碰撞

0次浏览     发布时间:2025-04-10 21:28:00    

在数字化时代,金融行业正经历深刻变革,金融大模型作为人工智能(AI)与金融科技结合的前沿技术,正在重塑行业格局。显然,大模型已经成为推动产业创新和释放新质生产力的关键驱动力。尤其在数字金融蓬勃发展的当下,通过深度赋能金融科技,大模型正在显著提升金融服务实体经济的效率和质量,为经济高质量发展注入新的活力。

2025年被视为AI技术普及与行业融合的关键节点,DeepSeek系列大模型凭借其强大的功能和广泛的应用前景,迅速在金融行业走红。银行、证券、保险等金融机构纷纷接入该大模型,以提升自身的数字化水平和服务效率。

然而,随着应用场景的不断拓展,大模型的局限性也逐渐暴露。AI大模型的“幻觉”现象,即生成的信息与实际情况不符或缺乏可靠依据,正引发行业的高度关注。大模型在一些关键业务环节的表现并不如预期,甚至需要大量人工干预来保证结果的可靠性。

尽管如此,金融机构在金融科技领域的投入仍在持续增加。据Wind数据统计,2024年国有六大行在金融科技领域的投入合计达到1254.59亿元,较上年末增长约2%。然而,部分银行的投入并未获得预期回报,出现了“高投入、低产出”的现状,这成为金融机构面临的重大挑战。

与此同时,金融机构也在积极探索解决方案,以应对大模型的“幻觉”问题。RAG(搜索增强生成)技术、高质量指令参数数据集、定制化训练与场景优化等方法正在被广泛采用。此外,智能体(Agent)技术的兴起也为金融机构的数字化转型带来了新的机遇。

大模型在金融领域“狂飙”

在数字化浪潮的推动下,金融行业与科技的深度融合已成为必然趋势。这种融合本身具有天然的契合性。一方面,金融行业高度依赖数据驱动的决策和高效的业务流程;另一方面,科技的不断创新为金融行业提供了强大的工具和解决方案。

DeepSeek系列大模型在春节前后迅速走红,银行等金融机构纷纷接入该大模型,以提升自身的数字化水平和服务效率。DeepSeek大模型的接入已成为今年金融领域一个无法回避的热门话题。

事实上,在近期举行的2024年业绩发布会上,多家商业银行已表示,DeepSeek大模型已成功部署并运行于行内系统,广泛应用于智慧办公、智慧营销等场景,取得了显著成效。

在谈及人工智能模型部署时,工商银行副行长张守川表示,近期工行已率先实现DeepSeek大模型的私有化部署,并成功融入“工银智涌”大模型矩阵体系,进一步拓展了工行新质生产力的布局。

农业银行也在积极推进相关工作。据农业银行行长王志恒介绍,该行已成功完成DeepSeek全系列大模型的行内部署与运行,并在智慧办公、智慧营销等多个领域进行了深度应用,目前应用效果显著。

中国银行副行长蔡钊表示:“中国银行已完成DeepSeek-R1模型的内部部署,并基于行内数据进行推理和调优。目前,该模型已向行内员工开放,用于探索应用场景,并在营销助手、远程银行、授信报告生成等多个场景中深入推进应用。”

今年2月,建设银行完成金融大模型的私有化部署,覆盖全集团超半数员工、46个业务领域及200多个场景,显著提升效率和质量,有效控制风险。邮储银行的“邮智”大模型引入DeepSeek能力,在多模态处理、多任务执行、算力优化和效能提升等方面显著增强,推动金融大模型行业应用。

大行在积极推进的同时,股份制银行和城商行也在加速引入DeepSeek。招商银行首席信息官周天虹表示:“招商银行高度重视大模型技术。DeepSeek的R1和V3模型推出后不久,我们就在招行的私有云环境中完成了全尺寸模型的部署,并且构建了模型的后训练能力,能够针对金融场景的特殊需求对模型进行微调。”

浙商银行管理层也在业绩会现场表示,该行成立金融科技研究院,开展大模型、数字人、量子技术等新技术研究应用,推进大模型通用产品建设,集成智能问答、公文写作等能力。目前,浦发银行、平安银行、北京银行、江苏银行等多家银行已纷纷宣布引入DeepSeek大模型,并积极探索相关应用。

公募基金行业也在加速引入人工智能大模型技术,包括汇添富、富国基金、诺安基金在内的十余家头部公募机构已宣布完成DeepSeek大模型的部署。其中,汇添富基金率先完成DeepSeek系列开源模型的私有化部署,并将其深度应用于投资研究、产品销售、风控合规、客户服务等核心业务环节。

在保险业,多家头部保险机构加速应用人工智能大模型技术。例如,中国平安通过全面数字化转型工程,进一步深化大数据开源平台的融合与部署,致力于构建“综合金融+医疗养老”生态圈,同时以技术创新驱动金融主业提质增效。

证券行业数字化转型步伐同步加快,国泰君安、国金证券、广发证券、兴业证券、国元证券、华福证券等多家头部券商相继官宣,已完成DeepSeek-R1模型的本地化部署。

大模型技术的火爆推动信托行业加速入局,包括上海国际信托、华鑫信托、中建投信托、陆家嘴信托、长安信托、华能信托、中铁信托在内的多家信托公司相继完成DeepSeek大模型的部署。

全面部署大模型:提升效率、缩小技术鸿沟

在2024年年报中,人工智能、大模型、算力、算法和数据体系等关键词频现,成为年报中的“热词”,从侧面反映出行业趋势。与此同时,AI技术正从外围服务领域向核心业务领域渗透,其应用场景和影响力持续扩大。这一趋势在金融机构的实践中尤为明显,各大银行纷纷加速AI技术的落地与应用。

例如,工商银行在金融大模型的规模化应用方面取得了突破性进展,成功构建了企业级千亿级金融大模型技术体系“工银智涌”,覆盖20多个核心业务领域及200多个应用场景,累计调用量已突破10亿次。再比如,招商银行的2024年年报中,“智能”“AI”“大模型”等人工智能相关词汇累计出现超过100次,凸显了其对AI技术的高度关注与深度应用。

随着DeepSeek大模型技术的推出,中小金融机构有望凭借其强大的推理能力、高效的计算性能以及较低的推理成本,突破数字化转型瓶颈,加速在金融科技赛道上的发展进程。而从技术角度来看,DeepSeek-V3大模型在训练效率和成本控制上的优势,使其成为金融机构的理想选择。

据浙商证券研报,DeepSeek-V3大模型在训练效率和成本控制上表现优异。其训练耗时不到280万GPU小时,远低于Meta的Llama3-405B模型(3080万GPU小时)。训练成本方面,DeepSeek-V3仅需约557.6万美元,而OpenAI的GPT-4训练成本高达数亿美元。这显示DeepSeek-V3在训练效率和成本优化上具有显著优势,为大模型的商业化应用提供了高性价比。这种高性价比的解决方案,为中小金融机构跨越“技术鸿沟”提供了有力支持。

上海金融与发展实验室主任、首席专家曾刚指出,DeepSeek大模型凭借其较低的训练成本和高效的技术特性,为中小银行跨越“技术鸿沟”提供了高性价比的解决方案。具体而言,中小银行可根据自身业务需求灵活调整DeepSeek模型的参数与功能,实现精准适配。此外,DeepSeek的“开箱即用”能力使中小银行无需巨额研发投入即可快速部署大模型技术。

在数字化浪潮席卷金融行业的背景下,金融机构的数字化转型已不再是选择题,而是关乎生存与发展的必答题和抢答题。招联首席研究员、上海金融与发展实验室副主任董希淼指出,金融机构若想在数字金融领域实现突破,必须深度运用以大模型为代表的生成式人工智能(GAI)技术,将其作为推动数字化转型的核心引擎。

“幻觉”问题:人工智能仍靠“人工”

随着人工智能技术在金融领域的深度渗透,AI大模型的“幻觉”现象正引发行业的高度关注。所谓“幻觉”,是指AI大模型生成的信息与实际情况不符,或者缺乏可靠依据。在金融领域,这种现象可能导致严重的误导性信息传播,进而引发潜在风险。

具体来看,这种“幻觉”现象在实际业务场景中已经带来了诸多问题。例如,在银行对贷款申请人进行信贷审核时,大模型可能会错误评估申请人的资质,导致拒绝贷款或批准的额度低于实际需求等情况;又如,在金融机构员工利用大模型生成工作相关材料时,DeepSeek可能会生成不存在的信息,或者提供与主题无关的参考内容。业内人士在接受记者采访时表示,大模型目前出现的“幻觉”问题,其主要根源在于训练数据存在质量问题,即数据被“污染”。

而从学术界的分析来看,这种“幻觉”现象的成因更为复杂。清华大学计算机科学与技术系教授孙茂松指出,虽然生成式人工智能在生成连贯流畅的文本方面表现出色,但由于其缺乏真正的理解能力,当面对数据不足或信息模糊的情况时,很容易生成不准确甚至虚假的内容。这种“幻觉”现象在对精度要求较高的任务中可能会带来严重的限制。

北京大学智能学院教授王立威认为,大模型的“幻觉”现象是其内在特性之一。目前的大模型主要通过从海量数据中学习来构建自身能力,其本质是一种基于统计的方法。由于这种方法依赖于统计规律,而非逻辑推理,因此无法确保输出结果完全准确。

为应对这一挑战,金融机构和科技企业正在积极探索解决方案。记者了解到,目前,金融领域的解决方案主要围绕RAG(搜索增强生成)、高质量指令参数数据集、结合格式化数据和计算能力进行优化。其中,RAG技术被认为是提升大模型准确性的有效手段之一。

“RAG技术可以通过改变提示的方式,有效提高回答的准确性。”华院计算董事长宣晓华对记者表示,大模型主要依赖归纳法进行学习和生成,在微调阶段,如果使用高质量的数据集,且该数据集能够全面覆盖所属领域的各个方面,那么大模型的可靠性也会得到显著提升。

某大型外资银行科技部门人士对记者表示,数据是AI大模型的基础,质量直接影响模型的准确性和可靠性,采用RAG技术,让AI在回答问题时能够实时调用专业领域的知识和数据,从而提高输出的准确性和可靠性。

定制化训练与场景优化也是金融机构在去“幻觉”化中常用的办法。金融机构通过定制化训练,针对特定业务场景优化AI模型。例如,宁波银行接入DeepSeek大模型后,通过业务人员的微调训练和专业语料库支持,尝试降低“幻觉”问题。富国基金则通过将大语言模型应用于量化投资决策,利用情绪因子等技术提升业务效率。

上海人工智能研究院算法专家陆文韬认为,为了能有效避免AI大模型生成错误结果、产生“幻觉”,从技术实现角度应该注意三个方面问题,一是确保训练数据的高质量和多样性至关重要,二是调整模型架构与训练策略,三是完善实时监控与反馈机制。

此外,智能体(Agent)技术的兴起也为金融机构的数字化转型带来了新的机遇。2025年以来,智能体(Agent)已成为人工智能领域备受瞩目的新方向。据Research and Markets预测,AI智能体市场规模将从2024年的51亿美元增长至2030年的471亿美元,年均复合增长率达到44.8%。

金融机构正通过技术创新,努力提升业务效率,优化用户体验,并探索差异化、特色化的发展路径。例如,某银行消费金融中心通过引入视频作业机器人,已实现90%的贷款面签业务远程办理,年放款金额超过350亿元。业内人士指出,这种技术应用不仅提升了业务效率,还显著降低了运营成本,为金融机构的智能化升级提供了有力支持。

“高投入、低产出”:实际效果待考

尽管AI大模型在金融行业被寄予厚望,但“幻觉”现象的存在使其实际应用效果与预期仍存在显著差距。随着应用场景的不断拓展,大模型应用的局限性也逐渐暴露,往往需要大量人工干预来保证结果的可靠性。

从金融机构内部员工的实际反馈来看,某大型银行内部员工向记者表示,AI系统在实际业务操作中生成的内容往往需要大量的人工校对与调整。特别是在一些关键业务环节,AI的处理结果甚至不如人工操作来得精准可靠。

在银行业务流程中,大模型的应用面临类似的困境。某股份行的科技部门负责人表示,目前银行的业务主线流程中,大模型的切入还比较有限,主要集中在所谓的“边缘业务”。

在具体的业务场景中,这种局限性表现得尤为明显。比如,在辅助合同审核方面,尽管不少金融机构已经引入了AI大模型,但目前准确性欠佳。许多银行虽然优化了柜面流程,但由于机器的准确度不够,人工还需要再检查一遍,并没有达到省事的效果。

在授信流程中,大模型的应用也未能达到预期效果。一位股份行授信部门员工对记者说:“大模型生成的尽调报告内容不完整,数据表格也经常出错,我们只能当作参考,大部分工作还是要自己来。”

在证券行业,类似的情况也普遍存在。记者从多家证券机构了解到,尽管一些金融大模型早已深入行业操作流程,但在文件报送、高频交易等重要环节,仍需依赖人工审核。一位证券机构交易员表示:“之前可能两个人做一个环节,花上两三个小时也就结束了,现在先让大模型做,还要给关键词、调整逻辑,最后还要核对一遍,前后花费的时间和自己做差不多,甚至还要多。”

然而,从上市银行的年报数据来看,金融机构在金融科技领域的投入却持续增加且投入巨大。据Wind数据统计,国有六大行2024年在该领域投入合计达到1254.59亿元,较上年末增长约2%。

其中,中国银行在信息科技领域的投入达到238.09亿元,占其营业收入的3.76%,同比上升了0.27个百分点。与此同时,邮储银行在报告期内的信息科技投入为122.96亿元,同比增长9.03%,占其营业收入的3.53%。

股份制银行金融科技投入额度也不容小觑。其中,招商银行、中信银行的金融科技投入分别为133.5亿元、109.45亿元,均超过百亿元。中小银行也在积极布局,以重庆银行为例,其科技投入总额达到5.74亿元,同比增长高达20%。常熟银行在金融科技领域的投入金额达到了3.85亿元,相较于去年增长了27.65%。

从实际运行结果来看,部分银行的投入并未获得预期回报。某股份行员工还向记者透露,该行此前斥巨资打造AI系统,但运行结果不尽如人意。“我们投入了大量资源,但实际收益却微乎其微。”该员工表示,这个系统一半的时间被用于演示PPT,另一半的时间则被用于修复系统漏洞。

一位大行科技部门员工向记者透露:“我们引入大模型后,硬件设备的投入增加了近30%,但实际业务效率提升并不明显,这让管理层对后续投入产生了疑虑。”

这种“高投入、低产出”的现状,成为金融机构面临的重大挑战。在成本方面,不少银行科技部门引入大模型的投入巨大,无论是服务采买还是运行所需的硬件资源,都是一笔不小的开支,但效益难以量化。