微信扫码
添加专属顾问
AI中台建设面临的技术与应用挑战
随着基金公司数字化建设的深入,在各类业务场景中对AI能力的要求也不断提高,AI中台中仅能处理简单证照票据材料的基础OCR能力已不能满足业务部门的实际需求,这为OCR、NLP等人工智能技术在基金公司的深入应用带来了挑战。此外,随着人工智能技术的不断发展,以及相关AI技术在基金行业的运用不断深入,一些典型问题和痛点难点逐渐显现。包括以下问题。
1.针对复杂文档的识别,传统OCR技术仍存在挑战
OCR技术在基金行业的运用场景众多,许多场景下的识别技术已趋向成熟,如各类通用证照、通用票据的识别准确率已达到99%。然而,在基金行业的实际业务应用中,大量耗费人力的是相对复杂的业务文档资料处理。例如:直销柜台账户、交易表单、资金指令、基金公告等业务表单的解析和处理。传统的OCR技术无法对上述复杂表单的内容识别及信息提取能力进行有效处理。由于涉及图像增强、印章识别、手写签名比对、复选框解析和复杂表格识别技术,使得OCR在复杂文档资料的处理方面面临较大的技术挑战。
2.针对非结构化长文档,需要智能化文档处理能力
在基金业务实际业务运营中,除了格式相对固定的表单文件,还涉及大量的长文档和非结构化形式的文档资料,例如基金合同、基金公告等,需要通过AI平台实现文档信息的识别、提取和审核。然而,单纯依靠OCR能力无法解决非结构化长文档的智能处理需求,还需要引入NLP能力,通过训练智能信息抽取模型,从长文档中智能化提取相关信息,为业务系统所用,辅助业务人员实现相关的信息录入、业务审核等工作。因此,AI中台的建设需要引入智能文档处理能力,并与OCR能力相结合,从而解决非结构化长文档的智能处理工作,打造更全面的文本处理智能化AI平台。
3.业务需求灵活多变,需构建可拓展的模型训练能力
基金业务各类凭证及文档资料会随着业务需求或监管制度的变化而不断调整格式,即使识别文件对象的格式没有改变,对模型进行持续优化,不断提升识别效果的需求也始终存在。因此,如何对OCR识别模型、智能文档处理模型的生命周期进行有效管理,从而实现模型的快速更新迭代,是AI平台使用过程中的一大挑战。
鹏华基金AI中台智能化建设方案
1.设计企业级的AI中台架构
针对上述主要痛点问题,鹏华基金基于公司的业务特点,结合OCR、NLP技术特点及发展趋势,设计了一套基金行业通用级AI平台架构(如图1所示)。AI平台包含基金数据层、AI智能处理引擎层、AI标注训练平台、AI能力服务层、AI应用层。通过自下而上的AI数据处理、AI引擎构建、AI模型训练、AI模型服务,为上层的业务应用场景提供有效赋能。
图1 鹏华基金AI中台架构图
(1)基金数据层。基金数据层是AI平台底层数据的来源。基金数据的格式支持图像文件、PDF文件、Word文件、Excel文件及其他支持的文件。基金信息文件包含了基金公告、基金合同、信息披露等文件。基金文件的接入可以通过手工接入平台或接口接入平台等方式。
(2)AI智能处理引擎层。AI智能处理引擎主要是基于OCR和NLP等人工智能技术,能够实现对各类基金文档进行自动分类、字段识别、语义识别、图像内容识别等。AI智能处理引擎包括OCR识别、NLP处理等核心AI原子能力,是整个平台的核心技术引擎。
(3)AI标注训练平台。AI标注训练平台是基于AI智能处理引擎的底层核心技术,实现对文档的类型管理、AI标注管理,以及基于深度学习算法等进行AI模型训练和AI模型管理。充分利用AI标注训练平台对不同的基金文件的类型和核心字段进行管理识别,用于上层的抽取应用。
(4)AI服务能力层。AI服务能力层主要封装完整的AI能力组件,可为业务应用层的业务需要所调用,主要包括OCR图像识别和智能文档处理能力,如图像增强识别、签名识别、表格解析、长文档抽取、版面解析、文档审核等可视化的AI系统服务能力,上层业务系统可按照业务需求进行调用。
(5)业务应用层。AI服务能力层主要涉及各类业务系统的AI服务接口调用,通过AI服务层的API服务及iframe页面嵌入的方式,将AI能力有效地嵌入至业务系统,实现业务作业自动化,通过AI赋能促进运营、投顾、投研等业务数字化转型。
2.针对复杂文档的OCR技术优化
通过在AI中台现有OCR能力的基础上构建更智能化、可拓展的OCR识别处理能力,优化针对复杂文档的OCR识别能力,以实现更加高效、精准的OCR服务,主要包括以下优化场景。
(1)AI平台实现对图像的增强处理,包括图像切边增强、弯曲矫正、透视矫正、去摩尔纹、水印去除、阴影处理、手写文字擦除等预处理,提升待识别图像质量。
(2)平台实现印章识别能力,可涵盖日常工作中常见的印章内容识别,印章类别包含公章、财务章、法定代表人章、发票专用章、合同专用章等类别;颜色包含灰度印章、红色印章等;形状包含圆形、椭圆印章等。
(3)平台实现手写体文字的检测,可识别和定位文档中手写体文字的位置并生成对应的图片,接入数据库中的签名,人工可比对两份签名图片。
(4)平台实现复杂表格的解析,可将有框表格、无框表格、半框表格、倾斜、透视变化等多种复杂表格实现精准识别及表格数据的解析,并支持人工对表格内容进行编辑,包括但不限于绘制表格、调整表格、删除表格、新增长线、新增短线、合并单元格、删除线条、跨页合并/拆分、撤销操作等操作,方便业务人员支持一键定位表格解析内容,直观查看解析结果。
3.构建非结构化文档智能处理能力
在基金业务实际业务运营中,涉及大量的内外部非结构化长文档资料的处理工作,例如基金合同、基金公告等材料,需要通过AI平台实现文档信息的识别、提取和审核。AI中台通过构建非结构化长文档智能处理能力,实现非结构化文档的智能版面分析,并且训练智能信息抽取模型,从长文档中智能化提取相关信息为业务系统所用,大幅提升工作人员在长文档资料处理方面的工作效率。
(1)平台可全文识别扫描件、PDF、Word等各种格式文档中的段落、表格、目录、图片、标题等信息,支持前端自定义版面解析模型,不同的文件可通过不同的版面解析参数进行解析。
(2)构建面向基金行业的专用文档识别抽取模型,基金合同、基金公告、基金申购确认单、基金交易确认单等文档的智能识别和关键信息提取。
4.构建可拓展的AI模型训练能力
基金业务各类凭证及文档资料会随着业务需求或监管制度的变化而不断调整格式,AI中台需要具备训练模型自定义能力以及对模型进行持续优化的能力。AI中台充分考虑到OCR识别模型、智能文档处理模型的生命周期有效管理,从而实现模型的快速更新迭代。
AI平台可通过可视化的方式训练OCR及NLP应用模型,提供划选、框选、字段拼接等5种简易标注方式实现训练数据的预标注能力,大大减少用户标注工作量。平台预置序列标注、模板匹配、表格抽取、规则匹配等多种算法,灵活适配不同场景下的AI模型训练方式。自动计算准确率、召回率、F1值、通用准确率等指标,为模型提供参考依据,支持对每一个抽取字段进行评估结果量化统计,方便开发人员快速判断模型效果,以支撑快速实现模型从开发训练到落地应用(如图2所示)。
图2 AI模型训练能力结构图
鹏华基金AI中台智能化建设特色
鹏华基金设计构建企业级的AI服务能力,建设面向全公司各类业务场景的统一AI服务平台,对项目实施路径进行充分规划,明晰实施要点,并对实现AI平台过程中可能面临的重要技术难点和困难进行全面分析,并制定针对性的解决方案。
1.设计良好的AI服务架构,充分考虑共享性及拓展性
鹏华基金企业级AI平台建设的核心理念是形成规范统一的技术及应用服务架构,需要从资源使用、数据治理、AI原子能力构建、AI服务能力构建、应用赋能等多个维度进行架构设计及规范制定,并需要充分考虑到平台未来可能扩展的其他AI能力,实现面向全公司的资源与服务共享,这需要在AI平台建设过程中,始终坚持资源可共享、模型可复用、需求可拓展、系统可运维的原则。同时,在各类业务系统的设计过程中,要对涉及AI处理的相关需求进行充分统筹考虑,纳入AI平台整体范畴,避免AI能力单点建设及重复建设,造成开发资源浪费。
2.注重基础数据治理工作,积累高质量的训练数据
AI模型的训练离不开高质量的训练数据,可获得的训练数据量和数据质量将直接影响AI模型的预期训练效果。基金公司具有天然的数据资源优势,在日常内外部业务运营过程中,会产生存储海量的业务数据。但不同的数据往往是分布式存储于各类业务系统中,通过规划数据中台可将各类数据进行归集,以便AI中台进行调用。此外,大量的数据均以非结构化的形式存储,训练AI模型在使用这些数据时还需要对其进行标注,完善AI模型训练数据的标注规范也是一项重要的工作。数据标注工作需要对业务充分的了解,因此,除科技部门外,应用部门参与或指导数据标注工作也非常必要。在AI项目建设中,业务部门也需要加大人力资源投入,组织人员持续开展数据标注工作,以支撑算法模型训练所需。
3.探索大模型等新技术,拓宽AI平台的应用边界
当前大语言模型、深度学习等技术快速发展,尤其是基于大语言模型的各类AI应用探索也取得了快速突破,AI平台未来能力的拓展也需要充分考虑到大语言模型对传统AI能力的赋能,通过大语言模型能力挖掘出更多的AI应用场景。例如通过大语言模型的预训练能力,可替代传统的NLP算法,实现文本抽取、文本分类、智能标签、智能摘要这些基础性的NLP任务,并可拓展基于大语言模型能力,拓展知识问答、文档翻译、文档创作等智能应用场景。通过前沿AI技术的加持,结合传统AI技术的应用深化,持续加强诸如大模型、深度学习方面技术资源和人才资源积累,积极探索新技术的应用场景,不断拓展和升级AI平台的能力范围应用边界,这也是在数字化时代保持核心竞争力的重要手段。
总 结
在当前这个数字化时代,积极拥抱AI能力以促进数字化变革的价值和意义是不可忽视的。建设企业级的AI服务平台,形成统一的AI服务能力,助力公司在更有效地进行市场数据分析,并提高投资决策的准确性和效率,实现更好地管理客户关系,提供更加个性化的服务。此外,AI技术的有效应用还可以帮助公司更好地控制风险,降低运营成本。公司要充分吸纳各项前沿技术优势,通过利用先进的人工智能技术,更好地适应市场变化,提高竞争力,为客户提供更优质的服务。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-27
人人都在抢邮件和私信,却忘了那个打开率最高的老渠道——还没人用AI做好
2026-06-25
Codex最强替代!我用这款全场景Agent搞定整套营销方案
2026-06-24
装修、服装、家具,正在用 AI 把生意讲清楚
2026-06-16
万字长文|AI 正在重塑营销范式:未来市场部,不是提效,而是重构组织方式(上篇)
2026-06-08
AI营销,开始翻车了
2026-06-01
用 WorkBuddy 做标书,真正省下来的不是时间
2026-05-26
一次 AI 赋能销售项目的失败复盘:为什么蒸馏了销冠经验,还是成不了销冠
2026-05-25
直播回顾 | 如何找到第一个值得用 AI 改造的业务场景
2026-04-20
2026-04-27
2026-04-07
2026-05-11
2026-05-07
2026-06-01
2026-05-26
2026-06-08
2026-05-25
2026-06-16
欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。
在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。
一、 定义
本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。
会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。
知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。
二、 账号注册与登录
登录方式:本网站支持以下登录方式,您可根据实际情况选择:
微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。
手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。
账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。
实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。
未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。
三、 服务内容与规范
知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。
服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。
禁止行为:您在使用服务时不得实施以下行为:
利用技术手段批量爬取、下载、转存知识库内容;
将知识库内容用于商业目的或未经授权地向第三方传播;
干扰本网站正常运行或侵犯其他用户合法权益;
发布违法违规信息或从事违反公序良俗的活动。
四、 知识产权声明
权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。
有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。
侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。
五、 个人信息保护
我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。
您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。
您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。
六、 免责声明
内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。
不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。
第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。
七、 违约责任
如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。
如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。
八、 法律适用与争议解决
本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。
因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。
九、 其他
本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。
本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。
我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。