2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

通过问答生成SQL:大模型时代BI的最佳解决方案

发布日期:2025-03-05 08:10:29 浏览次数: 2825
作者:编程与架构

微信搜一搜,关注“编程与架构”

推荐语

大模型时代的BI新突破,用自然语言对话实现高效数据查询。

核心内容:
1. AskTable如何将自然语言转化为SQL查询
2. 企业高层和业务一线面临的数据查询挑战
3. 支持的数据库和文件类型,满足多样化数据需求

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


通过问答生成SQL:大模型时代BI的最佳解决方案

AskTable 是一款基于先进的大型语言模型(LLM)的智能数据问答解决方案,旨在帮助企业快速进行数据查询和决策。它集成了意图识别、知识检索、问题解析、数据查询和可视化输出等多种功能。用户通过自然语言提问,即可获得数据分析结果,从而实现更加灵活、高效的数据驱动决策。

chatbi

解决什么问题

企业高层面临的挑战

  • • 低效的数据查询与决策流程:企业高层在进行新项目或决策时,往往需要迅速获得数据支持,但传统方法(如向数据分析师请求数据)通常效率较低,且响应时间较长。
  • • 决策慢,灵活性差:决策过程中的数据需求往往是即时的,依赖传统数据分析师处理数据,往往不能快速适应快速变化的需求。

使用 ChatBI 后,高层可以通过简单的自然语言查询获取实时数据,节省了与分析师沟通的时间,极大提升了决策效率。

业务一线面临的挑战

  • • SQL 门槛高:业务人员通常缺乏足够的数据库查询知识,尤其是在复杂的 SQL 查询语句的编写上,技术壁垒较高。
  • • 业务与技术的融合困难:业务人员需要兼顾业务理解、数据分析和技术实现,但缺乏跨领域的综合能力,使得数据分析和决策变得困难。

ChatBI 将繁琐的 SQL 查询隐藏在自然语言后面,业务人员只需通过简单的语言提问,就能获得数据分析结果,降低了技术门槛,并且更符合业务需求。

支持的数据库或文件类型

ChatBI 支持多种流行数据库以及文件格式的查询,能够满足各种企业的数据需求。以下是支持的主要数据库和文件类型:

Logo
类型
支持版本
说明
MySQL
5.7/8.0
流行的开源数据库
PostgreSQL
14/15/16
流行的开源数据库
PolarDB MySQL
5.7/8.0
阿里云-云原生数据库(MySQL 兼容)
PolarDB PostgreSQL
14/15/16
阿里云-云原生数据库(PostgreSQL 兼容)
Oracle
18c
主流商用关系型数据库
OceanBase
4.2 及以上
分布式关系型数据库(MySQL 兼容)
TiDB
8.1.0 及以上
分布式关系型数据库
ClickHouse
22.12 及以上
分布式列式数据库
StarRocks
3.x
分布式分析型数据库
Hive
3.x
分布式分析型数据库
Excel 文件
.xlsx/.xls
-
CSV 文件
.csv
支持常见分割符包括逗号、制表符等

架构解读

下面是整个系统架构的概览,展示了 ChatBI 如何利用自然语言理解能力将用户的查询转化为 SQL 查询并执行。

img

知识库建设

为了提高自然语言处理的精度和业务适应性,知识库的建设至关重要。企业内部的业务知识和规则常常是 ChatBI 精确理解用户需求的关键所在。

在企业内部,为了提高效率,常常会形成许多约定俗成的简称和规则。这些信息在内部交流中无需多言,大家自然心知肚明。但对于一个外来的 AI 来说,这些“大家都知道”的信息却是陌生的。

要让 AI 真正“懂你”,就需要对它进行训练,让它也能学会并掌握这些“大家都知道”的信息。我们将这类信息归纳为“业务知识”,它是企业文化与经验的沉淀,是帮助 AI 提升理解力的关键所在。

在 AskTable ,您可以通过以下四种方式来添加您企业的业务知识:

  1. 1. 术语库
  2. 2. 训练师
  3. 3. 专属偏好
  4. 4. 元数据
业务知识

术语库

术语库帮助 AskTable AI 理解企业内部特有的术语。例如,当“铁盒子”在企业中代表“发动机”时,可以将这一约定添加到术语库中,确保 AI 在处理相关查询时能准确理解。

当 AskTable 接收到包含这些术语的查询请求时,会参考术语库中的定义,将术语转换为标准业务语言后进行分析,让查询结果更加贴合用户需求。

术语库

训练师

AskTable AI 的能力会随着用户反馈不断优化。通过点赞或提供训练数据,您可以帮助 AI 更快地学习如何更好地生成答案。训练数据包括用户提出的问题及其对应的正确 SQL 查询。

借助这些数据,AI 可以迅速掌握企业的具体需求,持续提高回答的精准度和实用性。

训练数据集
训练数据集

专属偏好

专属偏好让 AskTable AI 更懂用户的提问意图。比如,当数据库中包含多年的数据,您可以预设偏好,仅让 AI 查询最近一年的数据,从而避免不必要的筛选。

通过设置专属偏好,您可以进一步细化 AI 的查询范围,让其更准确地匹配用户需求,为您节省时间并提高工作效率。

专属偏好

元数据

元数据是对数据的“数据”描述,提供了数据的背景信息,如结构、格式和含义。这些信息让 AI 能够更准确地解读和处理数据,从而提升查询的精准度和效率。

AskTable 会自动从数据库中提取元数据,包括数据库、表、字段的信息,以及字段备注。即使没有备注,系统也会自动生成相关信息。所有元数据将汇总并存储在 AskTable 的 Meta Brain 中,为后续查询和分析提供支持。

元数据在数据查询中的作用体现在多个方面,比如:

示例 1:枚举值

例如,一个字段记录性别,其中 sex=1 表示男性,sex=2 表示女性。当用户查询“性别为男”的数据时,AI 会基于元数据自动生成查询条件 sex=1,无需用户明确说明。

示例 2:特定格式

例如,一个字段记录基金的星级评价,使用从 ★ 到 ★★★★★ 的格式。如果用户查询“四星以上的基金有多少”,元数据会帮助 AI 理解星级格式,自动生成正确的查询条件:

  • • 错误:select count(*) from fund where star >= 4;
  • • 正确:select count(*) from fund where star in ('★★★★','★★★★★')

通过元数据的加持,AskTable 能更深入地理解数据的实际含义,为您生成更精准的查询结果,助力高效决策。

元数据

AI 生成 SQL

利用自然语言处理能力自动生成 SQL ,从而满足各种特定场景。

适应场景

  1. 1. 开发者不想针对不同的用户需求,实现不同的问答逻辑,想通过一个页面提供统一查询服务
  2. 2. 开发者不想使用 AskTable 的 UI 界面,想自己实现一个 UI 界面
  3. 3. 开发者想自己访问数据库,而不是通过 AskTable 访问数据库。

举个例子:

用户查询:获取所有在2021年销售超过1000件的产品

生成的 SQL 查询

{
    "question": "获取所有在2021年销售超过1000件的产品",
    "prepared_statement": "SELECT name, sales FROM products WHERE year=2021 AND sales>1000",
    "parameters": {},
    "header": {
        "name": "姓名",
        "sales": "销售额"
    }
}

通过 ChatBI,用户只需用简单的自然语言提出问题,系统即可自动生成对应的 SQL 查询语句,极大地提高了查询效率。

AI利用自然语言统计

从自然语言查询生成 SQL 并直接返回查询结果的 API 接口。通过该 API,开发者可以利用AI的自然语言处理能力,快速获取数据库中的信息。这对于需要简化查询过程和提高开发效率的场景尤为适用。

适应场景

  1. 1. 开发者希望用户能直接通过自然语言查询获取数据,而不需要自行处理 SQL 语句的生成和执行。
  2. 2. 开发者不想使用 AskTable 的 UI 界面,想自己实现一个 UI 界面,直接展示查询结果。
  3. 3. 开发者希望提供灵活的查询方式,适用于多种用户场景。

用户查询:有多少个国家?

生成的返回结果

{
    "status": "OK",
    "elapsed_time": 6,
    "text": "共有206个国家。",
    "files": null,
    "charts": null,
  ....
}

通过这种方式,开发者可以将自然语言查询与数据分析功能集成到自己的应用中,简化了数据交互流程。

总结

AskTable 虽然没有完全开源,但是这个思路是一个非常好的应用场景,大家可以参考它的思路,结合自身的需求和技术栈,去设计和开发符合自己产品特色的 ChatBI 系统。通过分析 AskTable 的应用架构、交互方式及数据处理流程,可以为自己搭建类似的智能对话系统提供宝贵的经验和启示。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅