微信扫码
添加专属顾问
下面的内容主要分为:
TorchV Bot产品介绍; 如何试用? 附录1:RAG简要说明; 附录2:TorchV Bot操作说明
TorchV Bot是一款基于大语言模型(Large Language Model,后文简称LLM)和检索增强生成(Retrieval-augmented generation,后文简称RAG)技术的人工智能问答机器人,属于TorchV最主要的三款产品(Bot、Assistant和Analyst)中一款。
在使用方面,TorchV Bot的产品价值最简单总结就是:将您业务中已有的各类文档扔进去,就可以快速形成知识库和问答系统,可以作为对外的客服机器人使用,也可以作为对内的业务助理使用。
TorchV Bot是基于TorchV RAG中间件系统的应用,从整体系统架构来看,具体如下:
在整套架构中,本文提到的TorchV Bot仅仅属于产品层的其中一个产品,下面我们从下往上逐层描述:
TorchV Bot是基于LLM和RAG的,为了方便更多朋友进一步了解,这里再介绍一下RAG,如果您对RAG已经了解,可以直接跳过1.2章节。
RAG(Retrieval-Augmented Generation,检索增强生成)是为大语言模型 (LLMs) 提供了从数据源检索的信息,以此为基础生成回答。简而言之,RAG结合了搜索技术和大语言模型的提示功能,即模型根据搜索算法找到的信息作为上下文来回答查询问题。无论是查询还是检索的上下文,都会被整合到发给大语言模型的提示中,然后让大语言模型根据召回的事实内容进行润色输出。
在2023年,大语言模型逐渐火热之后,基于RAG架构的大语言模型系统成为最受欢迎的技术。许多产品几乎全依赖RAG架构,这包括结合网络搜索引擎和大语言模型的问答服务,以及数以百计的数据交互应用程序。
RAG结合大语言模型使用,可以有效解决大语言模型本身存在的三个主要问题:
关于RAG的简要介绍,特别是技术实现,可以参看附录1.
除了RAG,架构中还是用了多个中间件,如幂等分类器(IC)、执行器(Actuator)和连接器(Connector),下面简要叙述它们的作用:
TorchV Bot第一个特点是开箱即用,这里其实有两层意思:
具备开通即可使用的便捷,以及拥有无需维护就能达到生产应用级别的能力,注定会让TorchV Bot适合于越来越多的行业应用场景。
对于企业应用,即使是内部使用,一些敏感文件内容依然需要保密,如销售报表,最好只能让总经理、销售本人和财务人员看到。如果直接放在LLM中,那么实习生也能对“我要看一下XX部门今年的销售数据”等问题进行提问,并获得答案。而采用TorchV Bot则可以通过建立受保护的文件夹来有效设置访问权限,当然该特性目前仅在企业版中提供。
这其实是基本条件,TorchV Bot在这些方面已经获得现有客户的认可。
我们没有做任何标准评测,而且以后应该也不会去参加各种评测。因为我们发现,在我们前面接触的行业客户中,他们的提问我们都很难看懂,更加无法理解输出的答案是否优秀。目前的反馈都是基于约9个类型行业的真实客户使用反馈,客户试用之后的签约是最好的证明,特别是通过PLG来的客户。
针对数据敏感的服务,如涉及到企业经营数据、合同、工艺流程等知识内容,都会有全量私有化部署的需求,既可以断开外网在企业内部使用。TorchV Bot支持全量部署,包括国产大语言模型(会配合客户申请Model的商用授权),全套RAG架构,以及应用。
TorchV Bot从标准版开始就支持API开放,客户可以使用API与自己的原有业务对接,包括小程序、HTML、APP、大屏数字人和具身机器人等。我们也正在开发一键嵌入,估计马上就可以实现让客户使用极少的几行代码将TorchV Bot应用嵌入集成到原系统中。
我们的系统后台配备有各类参数调整的界面,可以让管理人员简便调整参数。如在专业性较强的应用场景,可以将alpha参数偏向于BM25;而在通用场景下,让KNN的权重更大。另外对于大家关心的大模型幻觉问题,我们可以设置让系统如何回答——当召回得分的最大分数低于设定的阈值的时候,选择让LLM兜底回答,还是回复“据已有知识,暂时无法回答您的问题!”
已经有部分朋友获得了试用地址和账号,本次试用本来是准备放在官网发布的,但是无奈,我们的研发人员都在忙着TorchV Bot试用系统的上线,而我,来不及将官网(https://www.torchv.com,2024-01-25,也许过几天会上线)开发完成。
所以,本次就先采用邮件吧。
目前只接受企业用户试用,需要您填写一些信息,必要信息如下:
邮箱:用来接收地址和账号 如何称呼您: 所服务的公司: 您的职位:
当然,如果您可以告诉我们您的使用场景,我们将更加感激!
对了,可以发送到yuanwai@mengjia.net
另外,也可以直接加我微信(lxdhdgss)联系我。
您可以查看附录2 了解TorchV Bot的使用说明。
目前TorchV Bot还处于Beta 1阶段,新版的UI设计稿还在路上,预计Beta 2版本会换装,目前系统应该还存在一些未发现的问题,也希望您在试用过程中不吝指出,谢谢您!
新的创新 = 新技术+业务需求,我们期望与各行业大佬交流AI如何帮助企业提升业务。
我们最希望的是可以帮助您:
实现商业收入提升,增加收入永远是第一位的; 极大降低您的业务成本,让利润增加,节流也很重要; 共同开展创新业务,一起实现行业应用创新,尝试以前不能实现的想法。
数据提取
分块(Chunking)
向量化(Embedding):这是将文本、图像、音频和视频等转化为向量矩阵的过程,也就是变成计算机可以理解的格式,embedding模型的好坏会直接影响到后面检索的质量,特别是相关度。一般我们现在常用的embedding模型有这些:
检索环节技术含量很高,检索优化一般分为下面五部分工作:
元数据过滤:当我们把索引分成许多chunks的时候,检索效率会成为问题。这时候,如果可以通过元数据先进行过滤,就会大大提升效率和相关度。比如,我们问“帮我整理一下XX部门今年5月份的所有合同中,包含XX设备采购的合同有哪些?”。这时候,如果有元数据,我们就可以去搜索“XX部门+2023年5月”的相关数据,检索量一下子就可能变成了全局的万分之一;
图关系检索:如果可以将很多实体变成node,把它们之间的关系变成relation,就可以利用知识之间的关系做更准确的回答。特别是针对一些多跳问题,利用图数据索引会让检索的相关度变得更高;
检索技术:前面说的是一些前置的预处理的方法,检索的主要方式还是这几种:
重排序(ReRank):很多时候我们的检索结果并不理想,原因是chunks在系统内数量很多,系统为了检索效率会牺牲一部分的精确度,所以一次检索的结果可能就会在相关度上面没有那么理想。这时候我们需要有一些策略来对检索的结果做重排序,比如使用Bge-Rerank模型重排序,得到更符合我们业务场景的排序。因为在这一步之后,我们就会把结果送给LLM进行最终处理了,所以这一部分的结果很重要。
查询轮换:这是查询检索的一种方式,一般会有几种方式:
这一环最重要的就是Prompt工程,在Prompt里有很多决定最终输出质量的因素:
以上就是关于RAG的技术解释了。
使用我们回复邮件里面的地址和账号密码即可登录。
让我们先排除各种理论知识,快速上手。在您登录成功后,请先点击“知识管理”->“知识维护”,您将看到如下界面。
也许您的账号登录之后看到的内容会有一些差异,比如还没有任何文件,那需要您点击右上角的“新建”先创建一个知识库,文档内容可以稍后上传。在Beta 2版本,知识库是可以进行管理的,可以选择失效和生效,在知识库灰度升级时将会非常有帮助。
新建知识库之后您可以点击右上角的“快捷导入”来上传您的文档(支持pdf、txt、markdown、word、excel和html格式)。
这里的“知识导入”按钮会一个下拉菜单,里面包括本地文件、WEB网页、纯文本和更多。“新建文件夹”是用来做文件分类的,当然也会在高级版本中具备权限功能。
默认文件的有效时间是“永久有效”,当然您也可以对其进行设定,指定失效时间。
文件上传过程中可以设置失效时间,以及文件内容提取的解析预览(前10页)。
在Beta 2版本中会增加元数据标记功能,让用户具备元数据填写功能,如文件内容的发生时间、所属部门等等,另外也可以进行预览内容的修订。
这里选择确定,进入文件处理过程。
文件上传限制大小为10MB,上传速度应该会比较快。但是请耐心等待一会儿,因为系统需要对文件进行处理,状态一栏会显示处理状态,如“待处理”、“处理中”和“处理成功”。处理大概在会持续1-3分钟。
接下来您可以点击“知识管理”->“问答对话”,进行已经处理成功的文档内容的问答。
这里面需要强调的是新建聊天(会话),同一个会话里面会有上下文记录(实现多轮问答)。如果您需要提上下文无关的新问题,可以新建聊天进行提问。
左下角是保存会话截图和清空会话的按钮。
默认情况下,知识维护和知识问答功能已经可以满足您的试用。如果您需要进一步了解TorchV Bot的其他功能,请继续往下阅读。
这是整个系统中最难的一部分了,默认情况下不建议您自行调整!
prompt编写
这是RAG(检索增强生成)最后一步,就是把内容提交给LLM(大语言模型)处理。
默认情况下,不建议大家调整该部分内容。对于绝大多数用户,这里推荐的仅仅是最上面的指令内容(Instruction)的修改。比如您可以设置大模型的角色,以及给大模型提一些对齐(Alignment)的要求。而已知内容:${context}和问题:${question}等内容,不建议非技术人员擅自改动。
参数配置
以上参数可以分为4个组,分别是:
参数的基本含义可以查看每个参数的tips(问号标识)和上图的示意。
对于绝大多数用户,需要按不同情况调整的仅仅是“根据已上传知识库无法回复时”的回复模式:自定义回复,还是大模型兜底?
自定义回复:可以自定义下方的“回复内容”,一般作用是当根据已上传知识库无法回复时,选择据实回答——不知道;
LLM辅助回答:当根据已上传知识库无法回复时,把用户提问直接给到大模型进行回复。
注意?:大模型回复有可能出现幻觉,有一定的几率会误导观众,请不要在严肃场景使用。
这里的根据已上传知识库无法回复时,指的是根据用户的提问,所有召回的索引置信度均低于kms值。
反之,如果召回的索引置信度有≥kms值的,则下面的回复方式、回复内容不生效。
查看完整的对话记录,不过多赘述。可以按用户ID查询所有对话,按时间段查询对话。
用户对回复的评价。
导航管理目前仅针对微信小程序端首页体现的快捷语,后续会增加各端导航语的支持。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-07-02
【知识库】OfficeCLI:一行命令搞定 Word/Excel/PPT,AI 时代的文档处理利器
2026-07-02
从 Axure HTML 到 Ardot:一次 AI 原型迁移实践
2026-07-01
为什么我选 Pi 而不是 Claude Code、Codex、OpenCode(上)
2026-07-01
Mirawork 亲测:颠覆工作方式的 AI 办公神器
2026-06-30
一个业务一线同学,把 AI 真用起来之后的 12 个真实想法
2026-06-30
PRD 2.0:AI时代的需求文档长什么样(附腾讯模板)
2026-06-29
Rspack 2.1 发布:React Compiler 提速 10 倍!
2026-06-28
想转 AI 落地 FDE?先看 3 个核心能力项
2026-05-26
2026-05-18
2026-06-09
2026-06-04
2026-04-16
2026-04-14
2026-04-25
2026-05-21
2026-04-09
2026-04-22
欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。
在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。
一、 定义
本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。
会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。
知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。
二、 账号注册与登录
登录方式:本网站支持以下登录方式,您可根据实际情况选择:
微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。
手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。
账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。
实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。
未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。
三、 服务内容与规范
知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。
服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。
禁止行为:您在使用服务时不得实施以下行为:
利用技术手段批量爬取、下载、转存知识库内容;
将知识库内容用于商业目的或未经授权地向第三方传播;
干扰本网站正常运行或侵犯其他用户合法权益;
发布违法违规信息或从事违反公序良俗的活动。
四、 知识产权声明
权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。
有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。
侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。
五、 个人信息保护
我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。
您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。
您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。
六、 免责声明
内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。
不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。
第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。
七、 违约责任
如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。
如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。
八、 法律适用与争议解决
本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。
因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。
九、 其他
本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。
本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。
我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。