2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

Coze工作流高阶教程分享,让你的Bot高质量的处理复杂任务

发布日期:2024-06-15 08:25:14 浏览次数: 9111
作者:在野在也

微信搜一搜,关注“在野在也”

一、引言

上期视频介绍了Agent智能体的基础概念,演示了如何通过Coze搭建一个可以实时调用本地知识库,并且对用户的问题进行精准回复的聊天机器人,而且还能将机器人集成到飞书的应用中,这非常适用于企业智能客服的场景应用
这篇文章我们来进阶学习Coze的高阶技巧 - 工作流(Workflow)
文章分为两部分进行介绍:
第一部分为理论部分,介绍什么是工作流,什么阶段才需要用到工作流

第二部分为实践部分,基于实际案例,演示如何在Coze中搭建工作流解决复杂任务

这里是完整的视频内容,视频内容更丰富哟 ?


二、什么是工作流?

假设今天我们的需要从深圳到上海,我们可以选择很多种交通方式:飞机、高铁、汽车…

具体选择哪种交通方式取决于我们的需求

  • 如果我们需要开一个紧急的现场会议,那么就会首选飞机
  • 如果不太急会选择高铁
  • 如果目标是沿途自驾旅旅行,就会选择汽车
无论选择哪一种交通方式,都会有不同的流程,比如选择坐飞机去上海
我们就需要:到机场-过安检-办理值机-登机-飞行-落地-取行李-出机场
这个过程就是一个达到我们需求目标的工作流,一个工作流中包含多个节点,每个节点完成一个固定的任务

工作流定义
工作流就是一组预定义的、标准化的步骤,用来完成特定的任务和达到预期的目标
三、什么时候需要用到工作流?

看过上期视频的朋友应已经知道,Coze搭建的Bot本质上就是“Agent-智能体”

对Agent智能体的关键构成有一个公式

Agent = LLM + 记忆 + 感知&反思 + 规划+ 工具使用

其中“LLM-大语言模型是驱动智能体的核心关键,被称之为智能体的“大脑”

而“LLM-大语言模型”中的“提示词-Prompt”,对大语言模型的输出质量有着很关键的影响

我们在写提示词时,会对一个场景的需求、背景、甚至解决思路进行描述,有时候写着写着就会写成一篇大几百字的提示词文档

随着需要解决的问题越来越多,越来越复杂时,就会达到大语言模型的能力边界“上下文的限制”,从而导致模型输出质量的下降

目前有两条路径可以解决这个问题

第一条路径就是对模型本身的能力提升,像增强模型的理解和推理能力 & 拓展模型上下文长度的限制,这些都属对模型能力的增强

比如谷歌近期发布的一篇论文中提及到能够让大语言模型处理无限上下文长度的方法

第二条路径就是把复杂的任务进行拆解,拆解成多个子任务,通过完成子任务从而达到最终需求的目标

小结

  1. 当有明确的需求和实现需求的路径,可以通过搭建工作流来处理标准化的任务
  2. 当需处理复杂任务时,为来避免大语言模型自身的能力限制(上下文限制 & 输出准确性),确保输出内容的质量,可以将复杂任务拆解成多个子任务,从而达到最终的需求目标
、Coze搭建工作流-Bot能力说明

我们先来看一个我用Coze搭建一个机器人案例,他主要的功能有三个

1. 能够在Google、Twitter和arXiv康奈尔论文网站中帮我查询和总结我所需要的信息内容,并且会附带对应的文章或论文链接,可以帮助我快速的查阅相关的文献资料

2.能够基于给定的关键词辅助生成适配不同平台的文章标题(含:小红书、Bilibili、公众号)
3.能够基于给定的 关键词 或 文章标题 辅助生成文章的配图
每个功能我都单独搭了一个工作流来执行对应的任务,机器人使用的语言模型为GPT-4o,主要扮演的角色是基于用户的问题,分配用户的需求,从而实现不同的需求调用不同的工作流来处理对应的任务

五、Coze搭建工作流-图片工作流

首先找到工作流workflows模块,点击“+”号就能够添加我们已经发布好的工作流,点击创建工作流,输入名称和描述后,就能进入到工作流的编辑页面
进入工作流的编辑页面后,映入眼前的有两块区域
左侧是节点选择区域,这里包含了很多个可选择的节点类型,包括:插件、大语言模型、代码、知识库、工作流、条件节点等等

一个工作流由多个节点构成,节点是作为组成工作流的基本单元

右侧是工作流的编辑页面,有两个初始节点,开始节点和结束节点
开始节点就是用户输入的信息的节点,结束节点就是输出信息的节点
我们把开始节点和结束节点连接起来后,结束节点的值可以取到刚刚在开始节点中定义的字段名称,我们点击右上角的测试按钮,输入“这是一个测试”,可以发现,输出的内容也是“这是一个测试”
这就是一个最简单的工作流,输入什么,就输出什么,中间并没有处理的环节
那现在我们来试着搭建一个生成图片的工作流
我们先来思考一下,搭建一个生成图片的工作流需要具备哪些必要条件?

首先就要有图片生成模型

可以在插件-Plugin中找对应的图片生成插件,有官方推出的DALLE-3

点击添加后,在编辑页面就会出现DALLE-3的节点
在输入的信息当中有两个字段,Prompt就是我们对生成图片的文本描述,所以这里的取值就是用户输入的字段
ratio比率,这里代表的含义是不同的值对应不同的图片大小,如果不填写默认就是1:1(1024*1024)的分辨率
我们把所有节点连接起来后,来进行一个测试

输入:一瓶桂花乌龙茶在草地上绽放
这是图片的生成效果
用过Midjourney或者Stable diffusion的朋友知道
1.英文提示词会优于中文提示词的生图效果
2.提示词的质量和丰富度,能够进一步地提升图片质量和画面的丰富度
那我们来对工作流做进一步的优化
我们先在“DALLE-3”节点前增加一个大语言模型节点,用于将我们的中文转译为英文,并且提取对应的关键词,用到的提示词:
请帮我把用户输入的内容{{query}}翻译成英文,并且提取输入内容的关键词例如1:输入:请帮我生成具身机器人的图片输出:embodied robot, image quality, 8k, HD例如2:输入:一只飞在天上的猫输出:cat, flying, sky, image quality, 8k, HD

光提取关键词还不够,我们还需要把我们的关键词进行提示词的优化,来丰富画面中的细节

我们再接着添加一个优化提示词的插件“PromptPerfect”,这个插件可以基于不同的模型,像:chatgpt、dalle、midjourney,进行提示词的优化

在大语言模型后加上提示词优化的节点,节点的输入信息包括两部分内容:

一个是提示词,这里输入的内容我们取的就是刚刚大语言模型提取出的关键词
另一个是目标模型,这里我们选择另一个取值模式{input},由人工输入一个固定的值,因为我们用的是dalle模型,所以我们直接在这里输入dalle

接着我们把所有节点链接起来再做一轮测试:
“在草地上翩翩起舞的桂花乌龙茶”

好啦,这就是一个相对完善的工作流了

六、Coze搭建工作流-信息检索工作流

在这个工作流中
我先用大语言模型的插件进行中英文的转译和关键词的提取
然后分别把语言模型处理后的输出结果传递给“谷歌搜索” & “twitter搜索” & “arXiv搜索”的插件中同时进行信息检索

但是由于这些插件检索出来的信息很多并且信息结构很杂乱,所以每个插件后面都接了一个代码节点,主要的作用就是将关键的内容做结构化的提取
每个代码节点的输出对象都包括两个内容:
一个是检索出来的结果,另一个相关的引用链接

对于不懂编程的小伙伴来说不要被唬住了啊,我本身也不会敲代码,但是代码节点中的代码能够通过内置的AI功能进行自动化的代码生成
我的使用方式是:先明确上一个节点的输出结构
输出结构怎么看呢,我们可以做单节点的测试,在Twitter节点中点击右上角的播放按钮,输入“增强检索RAG”,可以看到给出的输出结果
有值的数据主要是在“data”中,点击展开后可以发现,它一种多层级的输出结构,一次性为我们检索了10条数据
展开来看可以发现里面包括了:用户的姓名、被关注数量、tweet的内容 和 tweet的链接。但对我有用的只有“名称” “内容” 和 “链接”
明确输出结构后,我们点击Code节点中的“编辑IDE”按钮,就能进入到代码编辑页面
左下角有一个使用AI编辑的按钮,我们点击按钮,可以输入提示词
输入参数`twitter_search`(这就是我们定义代码节点的输入参数)中包含`searchTweet`插件的结果1、需要从`data`的每一条结果中提取`name`、`full_text`、`url`信息,并格式化呈现字符串,将每一条格式化后的结果拼接成一个长的字符串,输出为`twitter_context`(我们定义的输出字段)2、其中`url`是具体的链接数据,请你从`data`中提取所有链接,并格式化成一个字符串,然后将每一条格式化后的结果拼接成一个长的字符串,输出为`twitter_reference`点击回车后,AI就会自己写代码,写完后可以尝试运作一下,如果不报错,就说明代码运作成功,如果报错,再把报错信息给到AI,让AI修改代码

下一个节点我们还是用到语言模型节点
输入的信息:一个是用户最初提出的问题,另一个是上级节点给出的检索答案
给到模型的提示词含义是:首先告诉模型用户输入的信息是什么,Twitter检索到的信息是什么,然后告诉模型要做清晰且专业的表达,总结内容和提炼要点,最后将处理后的内容翻译成中文进行输出

最后,我们测试看一下整体的效果

输入:“我想了解什么是ComfyUI,如何学习ComfyUI”

得到了谷歌、Twitter、arXiv插件检索后的信息要点总结和对应的链接地址

最后的话

做一个总结,我们先介绍了“工作流的理论部分”,知道了工作流概念,知道了搭建工作流的前提条件,是基于明确的需求和实现路径的基础之上,再去搭建解决问题的工作流
然后我们介绍了,如何在Coze中搭建工作流,介绍了主流的节点的使用方法


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅