微信扫码
添加专属顾问
随着人工智能技术的飞速发展,大型语言模型(LLM)在各个领域展现出了巨大的潜力。Qwen-Agent,一个基于Qwen模型的框架,为开发者提供了一个强大的工具,以实现指令跟随、工具使用、规划和记忆等高级功能。本文将详细介绍Qwen-Agent的基本概念、技术特点、功能优势以及实际代码实践,旨在为读者提供一个全面的视角,以便更好地理解和应用这一框架。
Qwen-Agent 是一款多功能的开发框架,专为构建基于大型语言模型(LLM)的智能Agent应用而设计。该框架深度整合了通义千问模型(Qwen),赋予开发者强大的指令遵循、工具运用、策略规划以及持久记忆等核心能力。
通过Qwen-Agent,开发者能够便捷地开发出功能丰富的Agent应用,同时,项目还提供了浏览器助手、代码解释器、自定义助手等一系列实用的示例应用,帮助开发者快速理解和掌握框架的使用。
此外,Qwen-Agent 提供了全面的API接口,极大地简化了二次开发和系统集成的过程,让开发者能够灵活地扩展和定制自己的应用程序。无论是想要提升现有产品的智能化水平,还是创造全新的智能解决方案,Qwen-Agent 都是一个强大而灵活的开发平台。
Qwen-Agent的技术架构由以下几个核心组件构成:
语言模型(LLMs):提供基础的语言处理能力。
Qwen-Agent支持接入阿里云DashScope服务提供的Qwen模型服务,也支持通过OpenAI API方式接入开源的Qwen模型服务。这种灵活性使得开发者可以根据项目需求选择合适的模型服务。
通过工具集成,Qwen-Agent的智能代理可以自动化执行复杂的任务。这些工具可以是内置的,也可以是开发者根据特定需求自定义的。
Qwen-Agent的智能代理具备任务规划能力,能够根据用户的需求制定和执行计划。同时,它们还具备记忆功能,能够保持对话的连贯性,提供更加自然和人性化的交互体验。
Qwen-Agent支持多模态交互,结合图像、语音等多种模态进行交互,这为开发更加丰富和直观的智能代理应用提供了可能。
Qwen-Agent 的安装部署过程简单明了,可以通过以下步骤快速开始:
pip install -U qwen-agentgit clone https://github.com/QwenLM/Qwen-Agent.gitcd Qwen-Agentpip install -e ./
pip install -U qwen-agent[gui]# 或,从源代码安装最新版本: pip install -e ./[gui]
六、开发实践
框架提供了大模型(LLM,继承自class BaseChatModel,并提供了Function Calling功能)和工具(Tool,继承自class BaseTool)等原子组件,也提供了智能体(Agent)等高级抽象组件(继承自class Agent)。
import pprintimport urllib.parseimport json5from qwen_agent.agents import Assistantfrom qwen_agent.tools.base import BaseTool, register_tool
第1步(可选):定义工具函数
添加一个名为`my_image_gen`的自定义工具。
class MyImageGen(BaseTool):# `description`告诉代理这个工具的功能。description = 'AI绘画(图像生成)服务,输入文本描述,并返回基于文本信息绘制的图像URL。'# `parameters`告诉代理工具有哪些输入参数。parameters = [{'name': 'prompt','type': 'string','description': '所需图像内容的详细描述,用中文','required': True}]def call(self, params: str, **kwargs) -> str:# `params`是由LLM代理生成的参数。prompt = json5.loads(params)['prompt']prompt = urllib.parse.quote(prompt)return json5.dumps({'image_url': f'https://image.pollinations.ai/prompt/{prompt}'},ensure_ascii=False)
第2步:定义LLM
您可以选择使用阿里云的 DashScope 提供的模型服务,或者使用开源的 Qwen 模型部署和使用自己本地部署的模型服务。
如果您选择使用 DashScope 提供的模型服务,需要先到阿里云注册获取唯一的 DashScope API 密钥。
llm_cfg = {# 使用阿里云上DashScope提供模型服务(需要提前注册开通)'model': 'qwen-max','model_server': 'dashscope','api_key': 'YOUR_DASHSCOPE_API_KEY',# 如果这里没有设置'api_key',它将使用环境变量`DASHSCOPE_API_KEY`。# 使用与OpenAI API兼容的模型服务,例如vLLM或Ollama:# 'model': 'Qwen2-7B-Instruct',# 'model_server': 'http://localhost:8000/v1', # api_base# 'api_key': 'EMPTY',# (可选)生成的LLM超参数:'generate_cfg': {'top_p': 0.8}}
第3步:创建一个代理
这里我们使用Assistant代理作为示例,它能够使用工具和读取文件。
system_instruction = '''你是一个乐于助人的助手。收到用户的请求后,你应该:- 首先绘制一张图像并获取图像URL,- 然后运行代码`request.get(image_url)`来下载图像,- 最后从给定的文档中选择一个图像操作来处理图像。请使用`plt.show()`显示图像。'''tools = ['my_image_gen', 'code_interpreter']#`code_interpreter`是内置的代码执行工具。#files = ['doc.pdf'] # 给机器人一个PDF文件来读取。files = ['showImage.docx'] # 给机器人一个PDF文件来读取。bot = Assistant(llm=llm_cfg,system_message=system_instruction,function_list=tools,files=files
第4步:定义多轮对话机器人
将代理作为聊天机器人运行。
messages = [] # 这存储聊天记录。while True:# 例如,输入查询"画一只狗并将其旋转90度"。query = input('用户查询:')# 将用户查询添加到聊天记录中。messages.append({'role': 'user', 'content': query})response = []for response in bot.run(messages=messages):# 流式输出。print('机器人响应:')pprint.pprint(response, indent=2)# 将机器人响应添加到聊天记录中。messages.extend(response)
测试效果如下:
返回输出:
|
2024-07-02 10:13:31,961 - split_query.py - 82 - INFO - Extracted info from query: {"information": ["一只东北虎 2024-07-02 10:13:33,892 - memory.py - 113 - INFO - {"keywords_zh": ["东北虎", "一只"], "keywords_en": ["Siberian tiger", "one"], "text": "一只东北虎"} 2024-07-02 10:13:33,893 - simple_doc_parser.py - 326 - INFO - Start parsing showImage.docx... 2024-07-02 10:13:33,933 - simple_doc_parser.py - 365 - INFO - Finished parsing showImage.docx. Time spent: 0.03966975212097168 seconds. 2024-07-02 10:13:33,934 - doc_parser.py - 114 - INFO - Start chunking showImage.docx (showImage.docx)... 2024-07-02 10:13:33,934 - doc_parser.py - 132 - INFO - Finished chunking showImage.docx (showImage.docx). Time spent: 5.602836608886719e-05 seconds. 2024-07-02 10:13:33,935 - base_search.py - 55 - INFO - all tokens: 222 2024-07-02 10:13:33,936 - base_search.py - 58 - INFO - use full ref 机器人响应: [ { 'content': '', 'function_call': {'arguments': '', 'name': 'my_image_gen'}, 'role': 'assistant'}] 机器人响应: [ { 'content': '', 'function_call': {'arguments': '{"prompt":"一只', 'name': 'my_image_gen'}, 'role': 'assistant'}] 机器人响应: [ { 'content': '', 'function_call': { 'arguments': '{"prompt":"一只东北虎"}', 'name': 'my_image_gen'}, 'role': 'assistant'}] 。。。。。。 机器人响应: [ { 'content': '', 'function_call': { 'arguments': '{"prompt":"一只东北虎"}', 'name': 'my_image_gen'}, 'role': 'assistant'}, { 'content': '{image_url: ' '"https://image.pollinations.ai/prompt/%E4%B8%80%E5%8F%AA%E4%B8%9C%E5%8C%97%E8%99%8E"}', 'name': 'my_image_gen', 'role': 'function'}, { 'content': '', 'function_call': { 'arguments': '```py\n' 'import requests\n' 'from PIL import Image\n' 'import matplotlib.pyplot as plt\n' 'import io\n' '\n' '# 获取图像URL\n' 'image_url = ' '"https://image.pollinations.ai/prompt/%E4%B8%80%E5%8F%AA%E4%B8%9C%E5%8C%97%E8%99%8E"\n' '\n' '# 发送 GET 请求下载图片\n' 'response = requests.get(image_url)\n' '\n' '# 确保请求成功\n' 'if response.status_code == 200:\n' ' # 使用 BytesIO 来创建一个可读的字节流\n' ' image_stream = ' 'io.BytesIO(response.content)\n' ' # 打开图片\n' ' image = Image.open(image_stream)\n' ' # 显示图像\n' ' plt.imshow(image)\n' " plt.axis('off') # 关闭坐标轴显示\n" ' plt.show()\n' 'else:\n' ' print(f"Failed to download image, ' 'status code: {response.status_code}")\n' '```', 'name': 'code_interpreter'}, 'role': 'assistant'}, { 'content': '', 'name': 'code_interpreter', 'role': 'function'}, {'content': '上图是一只东北虎的图像。', 'role': 'assistant'}]
|
可以看到图片已经成功保存到本地:workspace/tools/code_interpreter/99b8207e-1423-4c22-b585-113ef1c2cb5e.png
参考引用
Qwen-Agent 官方文档:https://qwen.readthedocs.io/
Qwen-Agent GitHub 仓库:https://github.com/QwenLM/Qwen-Agent
点亮“关注”,设为“星标”,精彩不迷路!我们携手探索AI的无限可能,精彩内容,持续为您更新!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-07-01
从 Prompt 到 Skill:专业工作流的结构升级
2026-07-01
别让 AI 写的文档误导用户:从单次 Prompt 到高可信文档工程化实践
2026-06-30
网传 Karpathy 的 CLAUDE.md 曝光,10条铁律管住Claude Code!
2026-06-29
AI Coding 的底层框架:一切优化都是在对抗熵增
2026-06-29
给模型写方法论:拆解一个跨法域隐私审计Skill
2026-06-28
别再手工调 prompt 了,让 Agent 自己改自己的"操作系统"
2026-06-26
OpenAI工程师首次公开!教大家榨干 Codex
2026-06-22
用AI拆解WBS:我把3天的活缩到了10分钟出框架+2小时调
2026-04-21
2026-04-07
2026-04-25
2026-04-14
2026-05-02
2026-04-20
2026-04-19
2026-04-14
2026-05-25
2026-04-18
2026-06-17
2026-05-23
2026-05-16
2026-04-14
2026-02-28
2026-02-12
2026-02-12
2026-02-08
欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。
在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。
一、 定义
本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。
会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。
知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。
二、 账号注册与登录
登录方式:本网站支持以下登录方式,您可根据实际情况选择:
微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。
手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。
账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。
实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。
未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。
三、 服务内容与规范
知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。
服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。
禁止行为:您在使用服务时不得实施以下行为:
利用技术手段批量爬取、下载、转存知识库内容;
将知识库内容用于商业目的或未经授权地向第三方传播;
干扰本网站正常运行或侵犯其他用户合法权益;
发布违法违规信息或从事违反公序良俗的活动。
四、 知识产权声明
权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。
有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。
侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。
五、 个人信息保护
我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。
您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。
您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。
六、 免责声明
内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。
不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。
第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。
七、 违约责任
如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。
如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。
八、 法律适用与争议解决
本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。
因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。
九、 其他
本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。
本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。
我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。