（二）AI+BI：结合大语言模型实现对话式的智能报表系统

发布日期：2024-03-11 09:54:08 浏览次数： 7402

作者： AI产品经理研习与实践

微信搜一搜，关注“ AI产品经理研习与实践 ”

—

AI+BI的实施挑战

虽然将LLM与BI系统结合可以极大地提升数据分析和报告的智能化程度，对用户体验有着不言而喻的好处。但是，就当前的技术进展和结合情况来看，可能会遇到以下挑战：

数据理解的准确性

由于LLM主要通过训练数据学习，如果训练数据不包含足够的行业特定知识或上下文信息，模型可能难以准确理解复杂的业务数据。因此，LLM可能在理解复杂数据集、特定行业术语或上下文中的细微差别方面存在挑战。这可能导致数据分析结果的误解或错误解释。

幻觉问题（Hallucination）

LLM在生成文本时可能会产生“幻觉”，即创造出与实际数据不符的信息。在BI报告中，这可能导致不准确或虚假的数据洞察和结论。因为LLM在生成文本时，可能会基于其训练数据中的模式进行推断，而这些模式不一定总是反映实际情况。

数据隐私和安全性

使用LLM处理敏感或私密数据时，需要确保数据不被非法访问或泄露。LLM的云基础设施和API调用可能成为数据安全的薄弱环节，尤其是在处理敏感信息时。

模型的通用性与定制化需求

虽然LLM具有强大的通用性，但在特定行业或复杂的数据分析任务中可能难以满足所有定制化需求。原因在于LLM的训练是基于广泛的数据集进行的，可能无法完全覆盖某些特定领域或复杂场景的细节和特性。

用户交互体验

我们需要确保LLM能够提供自然、流畅的交互体验，同时能准确理解用户的查询意图和需求，这可能存在挑战。因为不同用户的查询方式和习惯多样性，对应地表现为自然语言理解的复杂性，可能会影响交互的准确性和用户满意度。

实时性和性能

在需要快速响应的BI应用中，确保LLM提供的解决方案能够满足性能和实时性要求可能是一个挑战。原因在于大型模型可能需要显著的计算资源和处理时间，特别是在处理大型数据集或复杂查询时。（不过就我个人目前的体验而言，这个问题不大，反而是BI系统本身可能存在这个瓶颈需要解决）

在不断地妥协之后，我们感觉在 AI 应用落地中存在一个不可能三角，效率-准确-智能的不可能三角。希望能够快速且准确地解决问题，就会对复杂问题束手无策；需要准确地解决复杂问题，就会需要漫长的时间来思考、拆解、处理；希望能够快速地解决复杂问题，就会无可避免地面临幻觉的产生。
腾讯技术工程团队，benze

—

（部分）产品实践

网易有数ChatBI

网易数帆团队于2023年推出了基于网易自研大模型的对话式数据智能助手——有数ChatBI，它融合了前沿的AIGC技术，通过自然语言理解与专业数据分析能力，用户只需通过日常对话的方式即可获得可信的数据，极大降低数据消费门槛。

图：网易数帆的产品全景图

网易有数ChatBI在结合大模型技术进行数据分析时，面对当前技术无法实现100%准确性的挑战，采取了一系列创新措施来提高产品的可信度和实用性，使之适用于生产环境。

（1）检索增强技术

网易有数ChatBI通过引入检索增强技术，改善了大模型对数据表的理解能力。传统的基于LLM的NL2SQL方案仅将建表语句作为上下文注入，限制了模型对数据表的全面认知。通过将更多相关的表格元数据融入prompt，大模型能够获得更宽广的“视野”，提升其自适应能力，从而减少选错字段或字段值格式不匹配的问题。

（2）个性化知识配置

为了适应特定业务领域的定制化需求，网易有数ChatBI支持个性化知识配置功能。这允许客户根据自己的业务特点和行业术语进行个性化设置，如将特定的行业“黑话”映射为模型可以理解的词汇，从而提高大模型在处理定制化问题上的准确性和适应性。

（3）模型自学习机制

网易有数ChatBI采用了模型自学习机制，模仿ChatGPT等LLM通过对话形式进行自我修正的特性。管理员可以指正模型的错误，使其记录并在下次遇到类似问题时参考修正过的内容生成正确的SQL。这种机制使得ChatBI随着使用而变得更加智能，提升了用户体验和产品的整体性能。

从AI+BI产品经理的角度看，网易有数ChatBI通过上述技术创新，解决了大模型在数据分析领域应用的一些核心问题，如准确性、定制化需求适应性及自学习能力，使其成为一款可靠且高效的数据分析工具。回顾我们前面所提到的“模式”，我认为它主要使用了【text-to-SQL+交互式数据探索助手】。

在网易内部，有数ChatBI在网易云音乐等业务落地，已经覆盖了产品、运营、市场、财务等非技术人员。而借助网易内部的成功落地，有数ChatBI产品发布后，也吸引了甄云科技等外部客户的使用。

京东ChatBI

京东数据产品团队推出的ChatBI产品是一个基于GPT大模型的“AI数据分析师”，旨在通过对话方式简化BI工作，目前还只是一个内部产品。

图：京东chatBI实现的基本结构图

它结合了大语言模型、公/私域知识库和数据分析应用扩展，通过自然语言的交互形式，降低了使用门槛，并通过沉淀的业务知识和数据资产提供准确的分析结果，针对的主要用户痛点包括数据理解、获取和分析的复杂性。

（1）知识库的构建与应用

在ChatBI项目中，京东团队采用了Langchain来开发大语言模型，形成了一个包含两大类资产的综合性知识库。首先是数据中台资产，涵盖元数据、指标SQL以及产品指南等，为模型提供了丰富的数据支持。其次是业务资产部分，包括专门针对特定业务场景构建的模型和累积的业务知识。这部分尤其关注于分析师的分析思路，这些通常难以标准化和复用。通过大语言模型，它现在能够将分析师的专业思路转化为可供机器学习和自动化使用的形式，极大地提升了业务分析的效率和广度。

（2）核心技术能力

在用户与ChatBI的互动过程中，系统首先通过意图识别来理解用户的查询目的，是希望获得特定知识、进行数据分析，还是简单的对话交流。接着，通过实体识别技术，我们能够从用户的提问中提取出关键信息，如时间、指标和维度等，并结合用户的背景信息如权限和部门来进行更准确的解析。对于知识查询类问题，系统会与知识库进行交互，通过优化算法提高回答的效率。而在数据分析场景下，ChatBI会调用相应的接口，将问题传递给大模型进行深入分析，并最终生成直观的可视化结果。回顾我们前面所提到的“模式”，这里使用的是【text-to-API】，至于自然语言文本报告、动态可视化模板报告、交互式数据探索助手则看起来都有使用到。

（3）提升工作效率的应用实例

ChatBI的引入显著提升了工作效率。以往，用户在遇到数据问题时可能需要跨平台搜索指标定义，涉及繁琐的数据分析流程，耗时数小时甚至数天。而现在，用户仅需通过与ChatBI的自然语言对话，即可迅速获得问题的解答和可视化分析结果。这种以对话形式进行的高效数据交互和分析，极大地简化了数据分析流程，让决策支持更加迅速和精准。

百度SugarBI

SugarBI是百度智能云推出的敏捷BI和数据可视化平台，解决报表和大屏的数据BI分析和可视化问题，通过不断将AI能力融合进自身产品中，推出「文心问数Sugar Bot」功能，大幅度提升用户的数据分析效率。

图：百度SugarBI中所融入的智能化功能

根据官方介绍，SugarBI基于百度AI能力，提供自动分析、AI问答、波动分析等智能化功能，其优势在于：

AI问答：数据可视化Sugar BI接入了百度自然语言处理（NLP）技术，通过对用户输入问题的理解，直接展现Sugar BI智能推荐的合适的可视化形式，根据拖入控制面板的数据字段为您自动推荐图表
自动分析：您准备数据，我生成报表。数据可视化Sugar BI 省去拖拽创建报表的过程，系统在几秒钟内，将明细数据自动制作成交互式报表，让您对数据进行快速彻底的智能分析
对应地，智能问数适用的场景分别是：

场景1——智能问数页面，常用于业务最新情况的数据洞察。用户可以在相应页面以问答的交互形式，向Sugar BI 提出业务问题，Sugar BI 将以图表的形式返回答案及业务结论。
场景2——辅助用户在报表/大屏的编辑页面进行页面编辑。用户可以通过问答交互得到想要的图表类型后，直接「采用图表」将其一键固定至报表/大屏中，Sugar BI 会自动帮您进行图表的数据配置。这也是一种新的报表/大屏制作方式，同时也为编辑者提供了更丰富的制作灵感。

基于 NL-to-JSON 等能力，文心问数 Sugar Bot 帮助用户基于对话来直接完成数据探索，并完成一部分报表制作功能。同时，该团队还在进一步研发意图理解、指令拆解、图像生成等 AIGC 能力，基于对话直接满足用户对报表、大屏的生成需求，其愿景是实现大部分内容的直接生成，也就是 NL-to-X 。这样，可以通过生成式 AI 直接满足更多用户业务目标，逐步实现业务与技术重构。

（1）AI问数

在SugarBI平台上，用户有多种方式表达对数据的需求，包括通过报表、大屏以及探索页等多端入口。用户可以采用语音、自然语言输入或是直观的字段拖拽等多种交互形式来提出问题。对于语音输入，SugarBI利用ASR技术将语音转换为文本，进一步通过NLP技术转化为具体的数据查询需求，展现了平台对用户需求表达方式的全面适应性。

SugarBI的核心之一是其表格问答模型，该模型能够理解用户的自然语言查询，并将其转化为对数据的具体需求。这一过程得益于SugarBI背后的数据模型，它将数据宽表的结构（Schema）及同义词等配置进行了高效抽象，以便进行深入的模型训练和部署。这种智能化处理不仅提高了数据查询的准确性，也为用户提供了更加直观和灵活的数据分析体验。

用户的查询需求经过智能处理后，SugarBI会自动转换成图表配置，并生成相应的SQL语句进行数据查询。这一过程展示了从需求捕捉到数据检索的无缝链接，极大地提升了数据处理的效率。拉取到的数据根据其特征，将被SugarBI的智能图表功能自动匹配到最合适的图表类型，从而生成直观且信息丰富的数据可视化结果。（text-to-SQL+动态可视化模板报告模式）

图：SugarBI AI问答的整体技术架构

（2）自动分析

数据预处理与分析准备：SugarBI在启动自动分析前，首先确定分析的数据范围，即选定特定的数据字段集合。然后，SugarBI会详细审查这些字段的配置和数据细节，确保分析的准确性。值得注意的是，SugarBI在这一阶段会遵循设定的用户权限规则，确保数据访问的合规性（例如对于表格分析来说，表格会根据报表所设置的用户权限进行权限和数据的过滤，防止发生越权）。

分析模型的运作：收集完必要的信息后，SugarBI会将这些数据输入自动分析模型。这个模型是基于SugarBI内部大量报表数据经过训练得来的，因此具有较强的分析能力。模型会输出两类关键信息：一是数据过滤条件的优先级排名，二是图表展示字段组合的推荐排名。

图表生成与优化：根据模型的推荐，SugarBI会自动生成相应的数据过滤条件和图表展示字段组合。这一过程中，智能图表功能会被用来推荐最合适的图表类型，以最直观地展示数据。生成的图表和过滤条件将被相互关联，提供给用户灵活的数据探索能力，如下钻和筛选等。

报表的自动排版：最后，SugarBI会对选定的过滤条件和图表进行自动排版，形成最终的报表。这意味着从数据选择到报表生成的整个分析流程，都由SugarBI的自动分析功能智能完成，极大地提升了分析效率和用户体验。

图：SugarBI 自助分析的整体技术架构

腾讯DataBrain chatBI

腾讯的DataBrain团队在GPT4发布之后，尝试结合其能力构建了一个服务于 DataBrain 系统的统一语言智能助手Demo——chatBI，能够让用户在统一的语言交互界面完成数据分析的全过程。和京东的chatBI一样，该产品目前仅供内部使用。

经过多轮尝试，目前了解到其Demo版本是参考了AutoGPT这样的智能体设计思路（把 Prompt 和具体可执行的 Prompt 做了魔改，把 Prompt 中的资源、限制、可执行指令做处理，就能够让 AutoGPT 以数据分析的形状开始跑动）：

整个流程由用户提问开始，GPT 接收到提问后，将任务完成拆解成选表、读取数据信息、拼接 SQL、生成图表、完成分析等。

SQL 的生成能力是调用的之前 DataLab 的 SQL 接口，能够基于需要指标、维度、筛选来给出符合具体场景的 SQL。类似的生成图表、简单数据分析的能力均是通过 Command 的方式来确保输入输出的可解释性和透明性。

不过其团队也表示，目前的ChatBI 版本还有很大的提升空间，存在速度慢、可解决的数据问题很初级、复杂指标计算失败、图表不够丰富等问题。

观远数据BI Copilot

BI Copilot 是观远BI利用大语言模型的能力构建的最新模块，接入了微软Azure OpenAI 商用服务权限（大家理解为就是ChatGPT背后的技术即可）：

Chat2Answer利用知识库构建，可以帮助业务用户理解数据的含义，并提供智能解读。当用户提出数据相关的问题时，Chat2Answer会解释数据背后的原因，并给出针对性的建议和可操作的方案。

这个功能早期的时候叫“chat2SQL”（也就是我们前面提到的text-to-SQL模式），通过自然语言交互协助生成 SQL 查询语句。

用户在遇到问题时可以直接向Chat2Help寻求帮助。当遇到报错或问题时，只需将报错信息复制粘贴到对话框中与Chat2Help进行问答，它将直接告诉用户报错的含义，并指导一步步排除报错、提供解决方案。

神策数据Copilot

神策数据的产品主要是CDP（客户数据平台）领域的，和我们前面所提及的“BI”不是一个概念。不过在研习过程中发现它也利用大模型技术推出了神策分析 Copilot（另外还支持用于运营Copilot），同样支持自然语言的交互，自助式地进行数据分析与查询，因此还是纳入本文中。

从目前的Demo介绍来看，其支持的一些场景如下：

（1）智能分析：应用大模型技术理解用户问题，自动配置分析模型

以事件分析场景为例，在输入框中用自然语言输入要获取的数据指标，比如最近7天搜索点击的用户数，GPT 模型将自然语言转化为请求查询JSON 并发起查询，并进行图形化展示。

在这里，神策团队采用了text-to-json而不是 text-to-SQL的模式，其考虑有二：一方面更容易理解，便于业务人员判断查询；另一方面更容易进行人为干预，比如生成的査询 JSON 不对，想换种计算方式或查询条件看看指标怎么样，可快速调整。

其实现过程大致为：

首先，把schema（简单理解为是关于数据如何存储、数据之间的关系以及数据应该如何解释的信息）传给GPT，让GPT理解数据的schema以及任务。考虑到存在长度限制，需要优化设计，从报表的上千个字段中筛选出进入到 prompt的字段、以缩短prompt。
其次，筛选出来的 schema 会有很多的字段，字段多了也会影响 GPT 的正确率和精准度，因此需要跟 GPT 进行交互，让它挑选出哪些字段与需求有关。
最后，通过 GPT进行 JSON 的生成。对于复杂的查询，可以先让它生成一个结构，在这个结构下再把内容填充进去。

值得一提的是，神策分析 Copilot 具备可理解、可信任、可干预的特点，能有效规避大模型固有的幻觉问题。在生成分析结果的同时，Copilot 将展示分析模型和指标的应用来源，便于用户理解、校验分析逻辑和指标用法，以确保用户选择正确的指标。若分析结果不符合预期，用户可以手动调整帮助系统持续学习、优化结果（即显式反馈）。