AI 大模型在金融行业应用深度分析 2024

发布日期：2024-04-30 08:16:57 浏览次数： 13299

作者：AI云原生智能算力架构

微信搜一搜，关注“AI云原生智能算力架构”

核心观点

➢当前AI与金融的结合主要有两条技术路径：①通用模型+金融语料训练金融大模型，②金融垂类大模型。

1）双方优劣具有相对性。通用大模型优势：泛用性强、灵活性和利用率高、可迁移性强。劣势：特定领域深度较浅、模型复杂、训练时间长；金融垂类模型优势：领域专业性、针对性的解决方案、高精度和合规性。劣势：适应性限制、更新和维护复杂度、数据利用率低。

2）通用大模型通过金融语料训练超越金融垂类模型可能性较小。通用大模型在行业数据量，性价比，精确性、适用性、实时性、推理速度，合规性和风险控制等方面表现欠佳。

➢通用大模型“百模大战”，头部模型国外领先较大，平均水平国内外差距较小，中文上国内表现更优。

1）国外通用GPT4-Turbo遥遥领先。OpenAI震撼发布GPT4-Turbo，开启新一代人工智能模型的大门；谷歌将在谷歌云上部署 Claude，并于推出自研的大模型LaMDA 的聊天机器人Bard；AWS 推出自有基础模型 Titan 和 AIGC 服务 Bedrock，以及 AI 编程助手 Amazon CodeWhisperer。Anthropic推出Claude，是最接近ChatGPT的商业竞品；xAI发布其首个AI大模型产品Grok，模型通过X平台实时了解世界，GrokV1.5或于2024年3月发布。

2）国内通用百度先行，多家企业推出相关产品。百度推出“文心大模型”，是目前国内预训练大模型应用端生态最好的大模型之一；阿里发布通义千问2.0，专业维度能力较强；vivo发布BlueLM大模型，应用的场景广泛；月之暗面发布Moonshot大模型，目前位于第一梯队。

3）在金融领域中，通用模型应用表现各有差异。其中GPT系列、文心一言、通义千问、腾讯混元以及科大讯飞表现较好。

➢金融垂类模型国外发展先行，国内成品问世。

1）国外彭博BloombergGPT率先登场。BloombergGPT的混合训练方法使其模型在金融任务上的表现大大超过了现有的大语言模型，而在通用场景上的表现则与之相当，甚至优于现有模型。AI4Finance Foundation开发FinGPT，为金融大型语言模型提供互联网规模的数据，以此推动金融领域的开源发展。

2）国内金融垂类模型百花齐放。奇富科技率先宣布推出自研的金融行业通用大模型“奇富GPT”；度小满推出国内首个千亿级中文金融大模型“轩辕”；腾讯云公布腾讯云金融行业大模型，TI-OCR大模型帮助银行解决日常业务问题；恒生电子进一步升级金融大模型LightGPT，并发布多款光子系列大模型应用产品；蚂蚁集团公布蚂蚁金融大模型，在多项金融专属任务中表现突出；东方财富、同花顺加大AI研发技术投入，筹建人工智能事业部，重点推进金融垂直大模型研发应用。

1.1. 通用+金融VS金融垂类：优劣势对比

➢当前AI与金融的结合主要有两条技术路径：

①通用模型+金融语料训练金融大模型

②金融垂类大模型。

➢由于设计和训练目的不同，通用语言大模型与金融垂类模型在优劣上具有相对性。通用语言大模型在泛用性、灵活性、数据利用率、迁移性上相比金融垂类更有优势，而在专业性、针对性、高精度和合规性上，金融垂类模型更胜一筹；在复杂度问题上，通用语言大模型在结构上更加复杂，影响模型效率，而金融垂类模型则是在更新维护上具有复杂性。

图表：通用与金融垂类大模型优劣对比

1.2. 通用+金融VS金融垂类：通用金融训练超越金融垂类可能较小

➢使用金融数据对通用大模型进行训练，数据欠缺，成本过高。金融领域的语料应该充分覆盖各种金融产品、市场情况和业务流程等。但金融领域的数据分散在各个金融机构，通用大模型缺少金融数据进行训练，金融专业知识不足；另外一方面，如果从底层开始训练大模型，所需要投入的算力成本非常高，比如千亿级别的通用大模型，训练一次需要付出几千万的成本

➢在特定任务上，精确性与适用性欠缺，需要更多优化与定制。金融垂类大模型通常会投入大量的时间和资源来收集和整理金融领域的专业知识。这些专业知识包括金融术语、金融工具和金融法规等。通用语言模型虽然可以通过金融语料的训练来提高在这方面的理解能力，但是否能达到金融垂类大模型的专业性仍有待验证。

➢金融领域要求实时性和高效的推理速度。金融领域的决策和分析通常要求实时的响应和快速的推理速度。金融垂类大模型可能会针对这一需求进行了优化，以提供更快的响应时间。通用语言大模型在处理金融领域的实时应用时可能需要进一步的优化。

➢金融领域对合规性和风险控制要求极高。金融领域对于数据保护、隐私和风险控制具有严格的要求，专门训练的金融垂类大模型可能会更好地满足这些合规性需求。

国内外通用大模型在金融领域应用表现

2.1. 国内外通用AI大模型发展历程：国外领先，国内紧追

➢2023年6月国内AI大模型迎来爆发式增长，技术和应用不断发展，但与国外顶尖AI大模型尚有差距。自2022年OpenAI发布ChatGPT以来，国内迅速形成大模型共识，开始追赶国外。目前各行各业开闭源大模型不断出新，竞争形势越发激烈。

➢综合表现上，头部模型国外领先，平均水平国内外差距较小。在所有模型中，GPT4-Turbo遥遥领先，国内最好的大模型为百度文心一言，但仍有15.77分的差距。国内方面，虽仍有差距，但在过去一年内发展迅速，平均水平上与国外差距并不明显。此外，国内开源大模型在中文上的表现要优于国外开源大模型。

图表：AI大模型2023年关键进展

图表：国内外大模型综合表现（2023年11月28日）

2.2. 国外AI通用大模型案例，OpenAI&微软引领业界

2.3. 国内AI通用大模型案例，多家企业推出相关产品

文心一言

百度具备先发优势，文心大模型国内领先

文心一言是百度全新一代知识增强大语言模型，于2023年3月16日正式发布，已进行多个版本迭代，10月17日发布V4.0版本。据百度官方介绍，文心一言目前已有7000万用户。文心一言4 . 0的能力栈较为广泛，可应用的场景较多。其在查询搜索知识应用、任务拆解规划Agent、文案写作以及代码编写及纠错等方面的应用表现不俗。

vivo BlueLM

vivo发布BlueLM大模型，应用的场景相对广泛

BlueLM是vivo自主训练的大语言模型，出自于vivo AI全球研究院。vivo于11月1日开发者大会上正式发布自研AI大模型矩阵，包括十亿、百亿、千亿三个不同参数量级的5个自研大模型。BlueLM主要可以应用在手机智能应用中，进行基础手机指令操作、实时语音助手、查询信息以及一些基于手机端的办公应用。

通义千问

阿里发布通义千问2.0，专业维度能力较强

通义千问，是阿里云推出的大语言模型，于2 0 2 3年4月1 1日在阿里云峰会上正式发布1.0。9月13日，阿里云宣布通义千问大模型已首批通过备案。10月31日，阿里云正式发布千亿级参数大模型通义千问2.0，8大行业模型同步上线。通义千问2.0专业维度上的能力较强，可应用于相对专业复杂场景，例如金融、医疗、汽车等垂直专业场景。

kimi

月之暗面发布Moonshot kimi大模型，位于第一梯队

Moonshot kimi是月之暗面自主训练的大语言模型，于10月9日正式发布。该模型具备多语言能力，支持约20万汉字上下文，通过创新的网络结构和工程优化，实现了无损的长程注意力机制，有较强的文档理解、归纳和处理能力。长程对话、长文本阅读、AI智能体等方面的应用表现强劲。另外，在数学运算、内容创作、虚拟数字人等场景也有不错的表现。

2.4. 通用大模型在金融领域应用表现各有差异

➢国外GPT系列在金融领域表现较好。GPT系列能较好理解金融术语，解答金融相关问题，且具备一定的实时性，在金融领域能够自动生成金融报告、做市场研究、客服机器人等。

➢国内百度文心、阿里通义千问、腾讯混元以及科大讯飞在金融领域表现较好。百度文心一言具备较高的实时性，且金融术语的理解较好，准确度高，能够在金融新闻分类、问答系统和智能写作中发挥作用。阿里通义千问能够较好的解释金融概念、提供一般性的金融投资分析指导，但存在时效性限制。腾讯混元可以优化金融服务的个性化体验、市场情绪的追踪等。科大讯飞火星则将语音识别和处理技术用于交易系统、智能财经助手等。

国内外金融垂类模型发展进程

3.1. 国内外金融垂类模型发展历程：国外发展先行，国内成品问世

➢金融大模型始于2023年3月BloombergGPT，通过应用金融大模型，金融效率将得到大幅提升。彭博推出了为金融领域量身定BloombergGPT模型，吸引了行业关注，大模型有了新的发展方向。金融行业沉淀了大量高质量数据。各金融平台的用户数以亿计，各种用户画像数据、交易数据浩如烟海。利用大模型对上述数据的分析处理，可大幅提高金融效率。比如，金融机构可以预测用户行为偏好，更高效、准确评估客户风险；AI还可以实时监测交易和市场波动，及时制定策略。

➢当前国内外金融行业都在主动拥抱大模型。IDC（国际数据公司）一项调研显示，超半数的金融机构计划在2023年投资生成式人工智能技术，只有10%的金融机构表示没有试验计划。国外自BloombergGPT后，也出现了如FinGPT等一系列金融大模型。而国产金融大模型也已分出了明显的两个“流派”。一派来自于传统金融机构，另一派来自于金融系科技企业或互联网企业。

图表：国内外金融垂类AI模型发布时间&发布机构

3.2.1. 国外金融垂类模型案例：彭博BloombergGPT

➢彭博BloombergGPT率先登场，金融任务表现远超通用模型。2023年3月底，彭博构建了迄今为止最大的特定领域数据集，并训练了专门用于金融领域的LLM，开发了拥有500亿参数的语言模型BloombergGPT。该模型依托彭博社的大量金融数据源，构建了拥有3630亿个标签的数据集，支持金融行业内的各类任务，彭博近40年来在金融领域积累的数据占比为51.3%，剩余的48.7%则来自于公开数据。训练结果表明，BloombergGPT的混合训练方法使其模型在金融任务上的表现大大超过了现有的大语言模型，而在通用场景上的表现则与之相当，甚至优于现有模型。

➢彭博BloombergGPT相比于通用大模型有诸多优势。BloombergGPT模型对金融领域理解更为深刻，并借助其针对性强、来源可靠的金融数据，提供了深度专业的分析能力，同时通过协助优化金融NLP任务，助力提升彭博终端数据的应用价值，开辟金融行业分析和决策的新可能性。

图表：BloombergGPT执行金融任务表现显著优于通用大模型，通用NLP基准上表现相当或更好

3.2.2. 国外金融垂类模型案例：FinGPT

➢FinGPT是由AI4Finance Foundation开发的一种专门为金融领域设计的语言模型。它的目标是为金融大型语言模型（FinLLMs）提供互联网规模的数据，以此推动金融领域的开源发展。FinGPT采用以数据为中心的方法，强调了数据采集、清理和预处理在开发开源FinLLM中的关键作用。通过支持数据可访问性，FinGPT渴望加强金融领域的研究、合作和创新，为开放金融实践铺平道路。FinGPT由四个基本组件组成：数据源、数据工程、LLMs和应用程序。

图表：FinGPT功能模块

➢【应用层】：FinGPT的最后一个组成部分是应用层，旨在展示FinGPT的实际适用性。它为金融任务提供实践教程和演示应用程序，包括机器人咨询服务、量化交易和低代码开发。

➢【LLMs层】：处于核心位置，它包含各种微调方法，优先考虑轻量级适应，以保持模型的更新和相关性。

➢【数据处理层】：该层专注于NLP数据的实时处理，以应对金融数据固有的高时间敏感性和低信噪比的挑战。

➢【数据源层】：FinGPT管道的起点是数据源层，它协调从各种在线资源中获取大量财务数据。

3.3.1. 国内金融垂类模型案例：腾讯云金融行业大模型

腾讯云混元大模型，为客户提供一站式MaaS服务

➢2023年9月7日，腾讯混元大模型正式亮相，10月26日正式对外开放“文生图”功能，同时模型的中文能力整体超过GPT3.5，代码能力大幅提升20%，达到业界领先水平。算力层面，推出高性能的计算集群HCC，作为大模型的算力底座。平台层面，提供一站式机器学习平台TI，以及 QGPU 容器调度平台以及向量数据库。模型 MaaS 层面，提供 L0 层面混元大模型， L1 层面金融行业大模型，以及各类针对下游场景任务的 L2 的模型，如智能客服、智能咨询、辅助分析和决策服务。腾讯云TI-OCR大模型帮助银行解决日常业务问题

➢腾讯云推出的TI-OCR大模型提供多种识别模式，包括智能结构化、固定版式结构化、检测/识别、智能分拣。TI-OCR大模型具备原生大模型支持、通过prompt设计支持复杂任务、多模态技术提高召回率的特点。通过应用TI-OCR大模型，可实现自动化的数据处理和高度结构化，将数据识别准确率提高至95%以上。这一应用降低了高重复手工劳动，减少了运营成本，实现了多元业务数据处理的标准化、线上化和自动化。

3.3.2. 国内金融垂类模型案例：恒生电子LightGPT+WarrenQ

恒生电子LightGPT重磅升级，各项能力均超国内通用大模型

➢2023年10月19日，恒生电子发布金融大模型LightGPT最新的能力升级成果，以及基于LightGPT打造的多款光子系列大模型应用产品，并宣布正式开放产品公测。目前相较于6月发布的版本，LightGPT在整体模型效果上提升15%，安全合规性上提升13%，推理速度上提升50%，并面向金融机构实现LightGPT-7B的开源，推理和训练全面适配华为昇腾系列。在投顾场景中， LightGPT在各个方面平均超出国内通用大模型13%。在投研场景中，LightGPT平均超出国内通用大模型12%。

“WarrenQ+光子”持续加强金融垂域“搜读算写”

➢继6月底恒生电子推出WarrenQ-Chat和ChatMiner两款大模型工具后， WarrenQ上新了 AI写作、语音速记、小程序、招股书/公告深度问答四款新功能，并持续深入私有知识库问答、智能投顾/投研chat助手等金融业务场景。

目前，WanrrenQ服务于数家证券公司，覆盖券商投研、财富、投行、固收等业务系统，为业务人员提供智能化的数据分析和交互技术，提升业务人员工作效率，持续加强大模型加持下的金融垂域“搜读算写”能力。此外，恒生推出了金融智能助手‘光子’，光子可以为金融机构的投顾、客服、运营、合规、投研、交易等业务系统注入AI能力，成为金融从业人员的AI助手。”

3.3.3. 国内金融垂类模型案例：蚂蚁金融大模型

蚂蚁金融大模型现世，多场景达行业专家水平

➢2023年9月8日外大会上，蚂蚁集团正式公布蚂蚁金融大模型。蚂蚁金融大模型聚焦真实的金融场景需求，在“认知、生成、专业知识、专业逻辑、合规性”五大维度28类金融专属任务中表现突出，在“研判观点提取”、“金融意图理解”等众多领域达到行业专家水平。

专业力方面，平台上有完备的数字化金融工具矩阵，蚂蚁金融大模型可通过理解用户语言，精准调用蚂蚁体系内的这些专业工具，给用户提供相应专业服务。

支小宝2.0+支小助1.0促进金融领域服务革新

➢得益于金融大模型带来的知识力、专业力提升，支小宝2.0的智商和财商提升到了新水平，能帮助用户深度解读市场信息、并结合用户的财务目标、投资偏好等，提供个性化的配置策略。知识力方面，做到了有问必答。专业力方面，提供一系列的专业化服务，300多款专业化工具，通过自然语言能够打理，能够操控以上所有服务。语言力方面，支小宝2.0的金融意图识别准确率高达95%。

➢智能业务助手“支小助”的1.0版本，则包含了“服务专家版”、“投研专家版”等六个版本，全方位服务不同金融场景的从业人员，可在投研分析、信息提取、商机洞察、金融工具使用等环节提供深度智能服务。

3.3.4. 国内金融垂类模型案例：东方财富奇思妙想金融大模型

➢东方财富深入AIGC、交互式AI等领域的研究，进一步巩固流量优势。公司已经陆续研发了东方财富金融数据AI智能化生产平台、多媒体智能资讯及互动平台系统等多个人工智能相关项目，并在公司部分产品及服务中进行了具体应用。公司将继续紧跟AI技术发展前沿，不断加强AI能力建设，进一步强化自然语言处理、图像处理、语音识别和多模态融合技术能力，并继续深入AIGC、交互式AI等领域的研究，完善内容生态构建，AI赋能提升用户各场景使用体验和服务能力，未来或创造新的场景以挖掘客户全生命周期需求，进一步巩固流量优势并提高客户转化率。

➢东方财富加大AI研发技术投入，筹建人工智能事业部，重点推进金融垂直大模型研发应用。8月11日，东方财富公告称公司将整合业务及研发力量，组建人工智能事业部。公司具备广泛的AI应用场景，且沉淀了大量有效金融数据，有望通过此次组织架构调整提升AI技术能力，未来将在AI+金融领域实现更大突破。

3.3.5. 国内金融垂类模型案例：同花顺HithinkGPT大模型

➢问财升级，HithinkGPT大模型开启内测。2023年12 月6 日，同花顺开启了问财升级版的内测，底层已经升级为Hithink GPT 大语言模型，结合海量金融领域数据和知识，通过自然语言对话，协助投资者进行标的选择、标的诊断、资讯解读、投资教学等全方位投顾服务。考虑到同花顺坐拥3000 万+月活流量，以及B 端产品iFind 业务的快速增长，同花顺大模型有丰富的落地场景。

➢B端iFinD产品逐渐完善AI功能，AI开放平台提供多种AI服务。公司的iFinD产品实现了基于语音交互与智能搜索服务、机器阅读研报、研报知识图谱自动生成等一整套智能化解决方案，技术实力和功能处于业内领先，预计iFinD+大模型结合基础功能补齐、性价比优势有望引领中期份额突破；同花顺AI开放平台目前可面向客户提供短视频生成、文章生成、数字虚拟人、智能金融问答、智能语音、智能客服机器人、智能质检机器人、会议转写系统、智能医疗辅助系统等多项AI产品及服务。

➢伴随着金融大模型应用的不断深化和拓展，当下金融大模型已经不局限于文本生成和虚拟客服等领域，而是开始广泛应用于金融资讯发布、产品介绍内容创作等。展望未来，随着更多的金融大模型陆续落地，将采用更加精细化处理行业细分场景，同时孕育出新的应用场景，为传统业务注入新活力，也为金融领域带来新的业务机会。这将全面提升金融服务的效能，推动金融业务生态的全面重塑，为金融行业持续的前进和革新铺平道路。

➢我们认为2024年金融垂类AI大模型将迎来前所未有的蓬勃发展，形成一番百花齐放的景象。而具备AI模型技术领先优势、较大金融交易数据基础、较好应用场景入口、积极推进AI模型构建的金融科技企业将持续受益。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业