调研|金融行业垂类大模型的应用现状
作为这一变革的前沿,金融行业垂直领域的大模型应用已经开始在金融服务的多个方面展现出其巨大的潜力和价值。本文将深入探讨金融行业垂类大模型的应用现状,分析其市场前景、分类、主要参与主体以及典型案例,并讨论在实际落地过程中面临的挑战。
当前,国内互联网企业、传统金融机构及金融科技企业争相竞逐,“百模大战”如火如荼,AI与金融的结合也日益深化。从通用大模型向金融产业大模型的转变,逐步改变着传统金融行业的运作模式和业务流程。国内外金融大模型如轩辕、貔貅、支付宝的AntFinGML、腾讯云金融大模型等等逐步在推进使用中。
01 发展背景
1. 通用模型难以提供深度服务
随着AI技术的不断升级的,AIGC技术的实践效用迎来了行业级大爆发。在内部模型自身迭代和多技术协同的作用下,出现了集图像识别、语义理解、视觉感知于一体的多模态体系。然而,由于行业深度信息的缺失,通用大模型在特定领域很难提供高价值、专业化的服务。
2. 行业需求与模型能力契合
金融行业属于数据、信息密集型产业,对于多渠道信息汇总与数据处理能力有较高要求;同时,行业要求从业人员专业知识储备与经验,来完成对金融业务的判断、咨询服务、报告产出等工作。
而相对应的,大模型恰好有很强复杂信息处理能力,以及基于原始数据和经验给出相应解决方案方面的能力。
02 金融垂类大模型行业现状
1. 市场前景
据智研瞻统计显示,2019年中国金融大模型行业市场规模250.49亿元,2024年Q1中国金融大模型行业市场规模90.82亿元,同比增长7.10%。2019-2024Q1年中国金融大模型行业市场规模如下:
根据毕马威中国发布的《2024中国金融科技企业首席洞察报告》的揭露,70%的受访企业认为新质生产力能提升金融科技企业自主创新能力,并带来新机遇。同时,91%的受访企业看好大模型金融应用前景。
2.金融大模型分类
从服务细分领域、应用场景、开源状态,对金融大模型进行分类:
3. 主要参与主体
在金融大模型的应用方面,传统金融机构、金融科技公司和互联网金融公司各有优势,故提供的服务也有所差异。
传统金融机构
其主要优势是:丰富的行业经验与专业知识,有助于将生成式AI应用于复杂的金融决策和客户服务中;成熟的合规框架,能够确保AI应用符合行业法规和标准。丰富的客户数据,为生成式AI提供了训练和优化的基础,支持个性化推荐和服务。强大的资金支持,可以投资于AI技术的研发和基础设施建设;强大的品牌信誉,使客户对传统金融机构的信任度较高,增强了新服务的接受度。
金融科技公司
金融科技(FinTech)公司领域主要服务于企业客户(B端),主要提供如在线支付处理、借贷平台、财务管理软件、企业保险解决方案、区块链技术应用和数据分析服务等,其核心职能是为金融机构提供广泛的技术支持和解决方案。
其主要优势是:
- 良好的技术基础,许多金融科技公司在技术基础设施上已具备一定优势,能够快速集成和部署生成式AI模型,提升现有服务;
- 专业化解决方案,结合生成式AI,利用各种低代码模版,来快速提供定制化的支付、融资和风险管理解决方案;
- 更高效的集成能力,它们通常具备强大的API接口,在结合大模型方面,可快速便捷与企业现有系统快速集成,实现无缝对接。
互联网金融公司
互联网金融公司指针对面向零售投资者(C端)市场提供的金融服务,如智能投资顾问、市场情况预测、个性化财务规划、个人投资组合风险评估、金融知识教育培训等。
其主要优势是:
- 快速响应市场需求,通过生成式AI实时分析数据,快速推出符合用户需求的新产品和服务。
- 重视用户体验,较重视用户界面和交互设计上,结合大语言模型,能够提供更流畅的用户体验,简化用户注册、投资和咨询的过程。
- 高度的个性化服务,结合用户行为数据和生成式AI,能够提供高度个性化的投资建议和财务规划。
- 更广泛的数据整合,相对于传统金融机构,能整合来自多种渠道的数据,提供全面的用户画像,支持更精准的服务。
03 金融大模型典型案例
1. 基本技术架构
垂直类大模型是基于通用大模型进行二次的开发。先检索相关的知识,然后基于召回的知识进行回答,也就是基于检索增强的生成。一般要经过三个步骤:
(1)ContinuePreTraining:给模型注入领域知识,即用金融领域内的语料进行继续的预训练。一般为了保持模型的通用能力,还需要注入混杂的通用数据。(2)SFT:通过SFT可以激发大模型理解领域内各种问题并进行回答的能力(3)RLHF:通过RLHF可以让大模型的回答对齐人们的偏好,比如行文的风格。
2. 国外典型案例
国外金融市场更开放、发达,业务量和用户数较多,且金融服务要求更高。在NLP出现初期,很多公司就前仆后继地开发大模型或者开发AIagent。
BloombergGPT——闭源模型
BloombergGPT是彭博社于2023年推出的金融垂直领域大语言模型,是一个有500亿参数、基于BLOOM模型的LLM,该团队采取通用模型和特定领域模型混合分析的方式,直接从0训练一个的金融领域大模型。其主要优势有以下几点:
① 数据来源可靠。由于彭博社在几十年的金融业务中积累了大量的金融数据和文件,拥有先天的数据优势,数据来源可靠。
② 金融数据集来源丰富,token数量大。其在金融领域数据集共包含了3630亿个token,占总数据集token量的54.2%,具体由以下几个部分构成:
③ 模型应用表现好。团队分享了模型的三个定性示例:1)生成Bloomberg查询语言,BloombergGPT可以被用来通过将自然语言查询转换为有效的BQL,使BQL更易于访问。2)生成新闻标题。由于它在许多新闻文章上进行了训练,可以帮助生成新闻标题。3)金融问答。由于金融领域训练数据,智能问答覆盖面广
FinGPT——开源模型
FinGPT是AI4Finance基金会发起的一个专注于金融领域的大型语言模型,它致力于通过构建开放源码的金融大语言模型来推动金融科技(Fintech)的发展和创新。
① 基座模型:开源LLaMA或者ChatGLM,
② 数据集:新闻网站、社交媒体、公司公告、趋势(google或者baidu等搜索引擎)、其他公开数据集
③ 训练方法:LoRA和RLSP(根据股票价格的强化学习)
④ 模型框架
数据源层:通过整合新闻网站、社交媒体平台、财务报表、市场趋势等数据,确保全面的市场覆盖。
数据工程层:专注于NLP数据的实时处理,以应对金融数据固有的高时间敏感性和低信噪比的挑战。
LLMs层:整合各种微调方法,优先考虑轻量级自适应,以保持模型的更新和相关性。
应用层:提供金融任务的实践教程和演示应用程序,包括机器人咨询服务、量化交易和低代码开发。
⑤ 优势
国外首个金融行业垂直类开源大语言模型。主要给金融研究人员和从业者提供可访问和透明的资源,来开发自己的的FinLLM或潜在的应用程序。解决金融数据获取难、处理难的问题,旨在开源领域实现互联网规模的金融数据民主化。
基于GPT的各种金融模型和AIagent
(1)BondGPT:2023年6月全球金融科技领导者Broadridge的子公司LTX,通过GPT-4打造了BondGPT,该模型主要用于债券市场,帮助客户回答各种与债券相关的问题。帮助金融机构、对冲基金等简化债券投资流程并提供投资组合建议。比如输入问题:我有100万美元资金,想投资5年,有哪些高收益的债券选择?BondGPT会回答符合需求的公司名字、利率、价格、发布日期、到期日期、债券评级等信息。
(2)PortfolioPilot:由SEC注册投资顾问机构——GlobalPredictions于2022年11月推出,为投资者提供全球投资组合管理、投资顾问、AI助理等服务,是美国的智能投顾平台。目前PortfolioPilot已积累逾3万名用户,为约200亿美元资产提供AI大模型+智能投顾服务。
其核心模块:追踪模块能借助大模型技术,为用户呈现投资组合管理的可视化工具,包括大类资产配置结构、资产相关性矩阵等;提升模块能基于AI大模型所生成的全球经济洞察观点,对用户投资组合进行评分分析,找出用户投资组合薄弱之处并提供个性化的改善建议;探索模块主要包括新闻、研究、预测三大功能,汇总关键新闻帮助投资者及时了解行业信息。
3. 国内典型案例
国内金融市场发展较晚,且开放性不足,另外NLP发展速度也稍落后于国外。但由于国内市场需求大,金融机构数量多,2023年间金融垂类大模型蓬勃发展。
轩辕-开源
轩辕是度小满的大模型团队,在2023年基于BLOOM-176B架构,针对中文通用领域和金融领域进行针对性预训练和微调的千亿级对话大模型。目前,已实现开源的全参数模型矩阵达17个。在此基础上,今年9月份度小满在始智AIwisemodel社区重磅开源发布第三代大模型「轩辕3.0」,包括对话模型和预训练模型。「轩辕3.0」在金融场景中的任务评测中表现突出,并且在金融事件解读、金融业务分析、投研应用能力和风险管理等测量维度上超越GPT4o。
其数据集采用度小满实际业务场景积累的金融数据,对金融相关问题的理解比通用大模型更有优势。因此在模型评估方面,在金融场景中的任务评测中,轩辕全面超越了市场上的主流开源大模型,赢得了150次回答中63.33%的胜率,充分凸显了其在金融领域的显著优势。在通用能力评测中,轩辕有10.2%的任务表现超越ChatGPT3.5,61.22%的任务表现与之持平,涉及数学计算、场景写作、逻辑推理、文本摘要等13个主要维度。2023年在中文任务评测C-Eval和CMMLU榜单中名列开源首位。
HithinkGPTvs妙想金融
作为国内toC金融公司的佼佼者,同花顺和东方财富公司在金融大模型方面的竞争也不相上下,在2024年1月,相继推出HithinkGPT和妙想金融大模型。目前同花顺问财已经开始启用,妙想app还处于内测阶段。下面从技术方面和用户体验方面进行简单对比:
1-技术方面:从技术架构、token数、落地方式等角度,比较两个模型。
2-用户体验方面:由于妙想内测审核暂未通过,故只初步体验了HithinkGPT问财,后续看机会再更新两者的对比。
优势:
- 市场覆盖广:涉及多个金融市场,如A股、港股、美股、基金、债券等等
- 功能丰富:支持查询、分析、对比、解读、建议多等等,包含在选股票、诊股票、看行情、看新闻等股民常用功能方面表现较好。
- 回答内容丰富:通过动态折线图、动态双柱图、K线图等图表增强可视化能力,还有多种投资数据。
不足:
- 整体界面:HithinkGPT是基于问财上直接套用,对比传统引擎,用户体验还未跟上
- 分析较浅显:分析的深度还不太够,无法取代专业投顾。
- 偏向于技术分析:在回答个股的问题时,两个模型均注重于估值、技术、资金流向,对基本面内容的回答较少。
- 回答准确率偏低:针对用户的提问,偶尔出现答非所问的情况,联系上下文的能力不强。有些问题的逻辑框架不顺畅。
总体来说,目前问财已经进入商业化收费阶段,虽然在投顾方面有了一定的帮助,但是吸引用户去购买更深层次服务的吸引力不够,还需更加努力。特别是在竞争对手也逐步进入商业化阶段的背景下,要积极重视提高模型准确率、内容丰富度和用户体验等方面。
04 金融模型落地挑战
- AI模型的幻觉问题。由于数据质量问题、训练方式问题、缺乏外部知识校验等原因,可能导致大模型易生成与事实不符的内容,在金融这样对精度要求较高的领域,这种错误可能带来严重后果。
- 成本问题。金融大模型需要进行大量数据的训练和长时间的实验,因此开发大模型需要长期战略发展规划,需要投入高性能设备、庞大的算力资源(CPU、GPU)、电力资源、长期的无回报资金以及专业的技术人员支持等,这使得该技术在开发阶段就存在很高的准入门槛。
- 安全合规要求高,数据泄漏、数据隐私问题。金融行业有很多数据的安全管理规范、技术标准,但在大模型时代,他们在模型训练、推理中到底起到了什么作用,哪些数据要进行脱敏化处理,需要结合大模型的应用场景和用户需求形成行业最佳实践。如何在保证安全的同时利用数据训练模型,是行业要面对的挑战,数据泄露的风险比行业深度信息缺失还要严重。
相关资源来源
- BloombergGPT:ALargeLanguageModelforFinance——ShijieWu1,∗,Ozan˙Irsoy1,∗,StevenLu1,∗,VadimDabravolski1,MarkDredze1,3,SebastianGehrmann1,PrabhanjanKambadur1,DavidRosenberg2,GideonMann1
- FinGPT:Open-SourceFinancialLargeLanguageModels——HongyangYang,Xiao-YangLiu,ChristinaDanWang
- XuanYuan2.0:ALargeChineseFinancialChatModelwithHundredsofBillionsParameters——XuanyuZhang,QingYangandDongliangXu
- 《2024年中国金融大模型产业发展洞察报告》——艾瑞咨询
- 《2024中国金融科技企业首席洞察报告》——毕马威
- 智研瞻产业研究院报告
作者:seven777,公众号:商业知行侠
本文由 @seven777 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
- 目前还没评论,等你发挥!