2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

AI知识库这事儿FastGPT是专业的

发布日期:2024-07-26 14:37:48 浏览次数: 4445

在搭建AI知识库这事儿上,有不少成熟的框架,我推荐使用FastGPT。这篇文章笔者就使用过的两款平台做个比较,FastGPT和百度千帆平台。

1. 为什么要搭建知识库

随着企业的运营,企业的私有数据越来越多(结构化、半结构化、非结构化的数据)。这么多数据,我们不可能都记在大脑里,就算老员工能记住,那对于一个新人来说如何快速上手呢?

所以搭建知识库就成了刚需。得益于LLM(大模型)的发展,让AI可以更好的理解自然语言,再加上向量数据库的检索,让许多沉睡的知识可以被唤醒。

企业可以通过搭建知识库提高工作效率,提升服务质量,还可以基于知识做出更好的决策。

2. 技术方案

2.1. 我推荐的方案

LLM存在幻觉问题,对于它不知道的知识会胡编乱造,可靠性差。所以在搭建知识库的技术方案上,一般有2个争论:

  1. 企业自己微调大模型。
  2. 使用RAG检索增强技术。

微调大模型,就是将已有的知识喂给LLM,让LLM学习。暂不说这种方式的安全性如何。单单从模型迭代的角度来看就不合适。

不管是部署开源模型 还是 采用闭源模型,随着时间的推移,模型的迭代非常快,模型会越来越聪明。模型每14天都会小迭代一次。迭代之后,之前投喂的数据会失效,而且之前做过的优化,会随着模型能力变强后,会变成无用功。

所以,我更推荐RAG技术。检索增强生成(Retrieval Augmented Generation,RAG)是一种强大的工具,它可以将企业的私有知识 通过LLM + 外接向量数据库的方式整合到一起。

2.2. 常规步骤

技术方案选定后,我们常规的搭建知识库的步骤如下:

文档加载 → 文档分割 → 文档嵌入 → 向量化存储 → 文档检索 → 生成回答

2.3. 两个主角

方案和步骤有了,下面看看选哪种框架。业内用LLM做知识库的方案较多,比如FastGPT、Dify、自己基于LangChain开发、百度的千帆平台等等。

本篇主要介绍FastGPT和 百度千帆平台。基于LangChain开发的方案之前的文章也介绍过,感兴趣的朋友自行翻阅之前的文章。

  • 百度千帆平台是百度推出的基于大模型的一站式应用解决方案平台,提供先进的生成式AI生产及应用全流程开发工具链。主打一个一站式。百度深耕AI多年,也是国内最早推出一站式平台的,整体还算方便。
  • FastGPT 是一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力。同时可以通过 Flow 可视化进行工作流编排,从而实现复杂的问答场景!主打一个知识库问答。

下面就两个主角在知识库问答领域的效果做个比较

3. 使用比较

3.1. 操作界面

操作界面上都差不过,从首页,到上传文件到知识库,再到创建AI应用,操作都很简便。

我个人更喜欢FastGPT的页面风格,页面比较清爽,很明显地看到 知识库、创建大模型应用 这2个版块。

FastGPT

首页

创建知识库,将处理好的本地文档、网页、QA问答上传,然后利用词嵌入模型处理,再存入向量数据库。

创建AI应用

百度千帆

首页:

创建知识库,将处理好的本地文档、网页、QA问答上传,然后利用词嵌入模型处理,再存入向量数据库。

创建AI应用

3.2. 可选词嵌入模型

在文档嵌入这一步,需要选择词嵌入模型。FastGPT可以选择适合自己的模型,但是百度千帆没有选择项,只能用百度的模型。

FastGPT

3.3. 可选问答模型

在AI回答这一步,也需要用到大模型。FastGPT可以选择适合自己的模型,但是百度千帆没有选择项,只能用百度的模型。

FastGPT

百度千帆

3.4. 可以发布到的渠道

发布渠道这一局,算百度完胜了!百度千帆集成了多个发布渠道,使用感受较好。FastGPT相对来说就有点少了,而且还需要额外的搭建和部署。

FastGPT

百度千帆

3.5. 最终的回答效果和体验

他俩在正常的问答结果上都差不多,这个结果跟选择的词嵌入模型和问答模型有关。但是在使用的体验上,我有几点要吐槽:

  • FastGPT的对话框,历史对话消息不会丢失。但百度千帆的对话框刷新下,历史对话会丢失,这个体验感有点差。
  • 百度千帆的对话界面,不知道为什么非要突出老大一个图标和应用标题,几乎占了小半屏,导致对话内容的可见区域被压缩,此处我要@下百度的产品经理,请问你这么设计的目的是啥?
  • 对比看下FastGPT就很简洁,对话区域也很大,用起来比较舒适。
  • 百度千帆分享出去的网页必须要登录,这个有点恶心,没必要在这里强行拉一波注册吧。而FastGPT分享的网页免登即可使用。

3.6. 源码开放

FastGPT

FastGPT源码开放,可以自己搭建,模型也可以自己搭配。对于企业内部使用非常友好。

自行搭建的话,需要开发者介入。不过FastGPT也有云上的SaaS版本,按需付费使用,无需开发者介入。

百度千帆

百度千帆是百度的闭源产品,模型也是闭源,而且模型只能用百度。这个对于企业内部使用不友好。

无需开发者介入,稍微懂些产品,看下文档,即可使用。

3.7. 数据安全

如果从数据安全方面考虑,只能选择FastGPT了,所有的数据都可以存储在企业自己的服务器上。

4. 方案总结

总之,没有最优的方案,只有最合适的方案。

大部分场景下FastGPT都是比较胜任的。如果只考虑以最小代价快速实现一个知识库问答,我推荐使用百度千帆平台。其余情况,我推荐使用FastGPT。

在操作界面上、词嵌入模型上、问答模型上、对话体验和数据安全上,我觉得FastGPT都是很专业的。FastGPT的发力点就是在构建专业的知识库领域。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅