2026年7月9日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

今天先和大家一起从零实现 AI 代理,只用到 Python 和 OpenAI

发布日期:2024-06-22 03:37:50 浏览次数: 3981
作者:数翼

微信搜一搜,关注“数翼”

说起 Agent 框架,大家可能觉得很复杂吧,其实核心逻辑很简单,简单的让你觉得不是 Agent。 今天先和大家一起从零实现 AI 代理,只用到 Python 和 OpenAI。

ReAct

我们用 ReAct 来实现 AI 代理。 ReAct 是「Reason - Act」 的意思。

简单的描述一下流程就是:

  • • 用户给出问题

  • • AI 分析原因

  • • 调用工具行动

  • • 观察行动结果

    • • 如果满足问题,那么就结束了

    • • 如果不满足,重复第二步,最后直到问题的解决。

实现

引入 OpenAI 和一些基础类库:

import openai
import re
import httpx
import os
from dotenv import load_dotenv

_ = load_dotenv()
from openai import OpenAI

创建 OpenAI 客户端,

client = OpenAI()

简答测试一下问答能力,

chat_completion = client.chat.completions.create(
    model="gpt-3.5-turbo",
    messages=[{"role""user""content""Hello world"}]
)
chat_completion.choices[0].message.content

可能会输出:

'你好,您需要什么帮助?'

Agent 类

下面实现一个 Python Agent 代理类,我们后面的代理都基于这个类实现。 __call__ 表示对象本身的调用。

class Agent:
    def __init__(self, system=""):
        self.system = system
        self.messages = []
        if self.system:
            self.messages.append({"role""system""content": system})

    def __call__(self, message):
        self.messages.append({"role""user""content": message})
        result = self.execute()
        self.messages.append({"role""assistant""content": result})
        return result

    def execute(self):
        completion = client.chat.completions.create(
                        model="gpt-4o"
                        temperature=0,
                        messages=self.messages)
        return completion.choices[0].message.content

我们使用 gpt-40 模型,并定义了一个 execute 方法,来调用大模型。

编写提示语,这个提示语完成了 ReAct 指令,我们如果要自行实现 Agent,都可以以这个提示语为模块进行修改和扩展:

prompt = """
你在一个思考、行动、暂停、观察的循环中运行。
在循环结束时,你输出一个答案
使用思考来描述你对所问问题的想法。
使用行动来运行其中一个可用的操作 - 然后返回暂停。
观察将是运行这些操作的结果。

你可用的操作是:

计算:
例如计算:4 * 7 / 3
运行计算并返回数字 - 使用 Python,因此请确保在必要时使用浮点语法

平均狗体重:
例如平均狗体重:牧羊犬
在给定品种的情况下返回狗的平均体重

示例会话:

问题:斗牛犬的体重是多少?
想法:我应该使用 average_dog_weight 来查看狗的体重
动作:average_dog_weight:斗牛犬
暂停

您将再次收到以下信息:

观察:斗牛犬重 51 磅

然后您输出:

答案:斗牛犬重 51 磅
"""
.strip()

定义 Action

思考和推理有了,记下来我们定一下动作。Agent 有了行动的能力,无论是执行函数还是调用工具, Agent 才完整。

定义两个动作进行运算或者计算平均体重:

  • • calculate

  • • average_dog_weight

把所有的动作到放到 known_actions 里面,这样我们就可以根据动作名称执行相应的动作了。

def calculate(what):
    return eval(what)

def average_dog_weight(name):
    if name in "Scottish Terrier"
        return("Scottish Terriers average 20 lbs")
    elif name in "Border Collie":
        return("a Border Collies average weight is 37 lbs")
    elif name in "玩具贵宾犬":
        return("玩具贵宾犬的平均体重为 7 磅")
    else:
        return("An average dog weights 50 lbs")

known_actions = {
    "calculate": calculate,
    "average_dog_weight": average_dog_weight
}

Agent 实例

提问玩具贵宾犬的重量

abot = Agent(prompt)
result = abot("玩具贵宾犬有多重?")
print(result)

根据我们的提示语,可以看到

想法:我应该使用平均狗体重动作来查找玩具贵宾犬的平均体重。
动作:average_dog_weight:玩具贵宾犬
暂停

可以看到,Agent 返回了动作 average_dog_weight,我们手动调用一下这个方法:

result = average_dog_weight("玩具贵宾犬")

得到输出:

玩具贵宾犬的平均体重为 7 磅

我们把观察到的结果发送给 Agent:

next_prompt = "Observation: {}".format(result)
abot(next_prompt)

查看最终结果 abot.messages[-1]

{'role''assistant',
  'content''Answer: 玩具贵宾犬的平均体重为 7 磅'}

到这里,我们就重现了一次 ReAct 的整个过程,但是每种不足的是,调用现实世界函数是我们手动调用的。

也就是每次观察 LLM 输出,再反馈给 Agent 都要手动参与,也就是 average_dog_weight 这一步。

自动调用

如果把 Agent 支持的函数都改成自动调用,那么 Agent 不就可以自己做事情了么。

我们编写一个循环,用正则解析LLM回答,最大尝试次数为 5 ,自动进行上面的步骤。

action_re = re.compile('^Action: (\w+): (.*)$')   # python regular expression to selection action
def query(question, max_turns=5):
    i = 0
    bot = Agent(prompt)
    next_prompt = question
    while i < max_turns:
        i += 1
        result = bot(next_prompt)
        print(result)
        actions = [
            action_re.match(a) 
            for a in result.split('\n'
            if action_re.match(a)
        ]
        if actions:
            # There is an action to run
            action, action_input = actions[0].groups()
            if action not in known_actions:
                raise Exception("Unknown action: {}: {}".format(action, action_input))
            print(" -- running {} {}".format(action, action_input))
            observation = known_actions[action](action_input)
            print("Observation:", observation)
            next_prompt = "Observation: {}".format(observation)
        else:
            return

再一次进行提问:

question = """我有两只狗,一只边境牧羊犬和一只苏格兰梗犬。
它们的总体重是多少"""

query(question)

可以看到大致如下的输出:

想法:我需要找到边境牧羊犬和苏格兰梗的平均体重,然后将它们加在一起得到总体重。
动作:average_dog_weight:边境牧羊犬
暂停
-- 运行 average_dog_weight 边境牧羊犬
观察:边境牧羊犬的平均体重为 37 磅
想法:现在我需要找到苏格兰梗的平均体重。
动作:average_dog_weight:苏格兰梗
暂停
-- 运行 average_dog_weight 苏格兰梗
观察:苏格兰梗平均体重 20 磅
想法:我现在知道了两只狗的平均体重。我将把它们加在一起得到总体重。
动作:计算:37 + 20
暂停
-- 运行计算 37 + 20
观察:57
答案:边境牧羊犬和苏格兰梗的总体重为 57 磅。

这个过程是不是很熟悉,和 LangChain 的调用过程基本一致。

总结

前面演示的例子是不是看起来挺玩具的。

其实原理都没有太多变化,基于这个应用你就可以扩展出来很多实用或者有趣的东西。

  • • 比如你想查询天气,可以写一个 get_weature 的 行为,

  • • 如果你每天的工作日志都存下来并且可查,就可以实现一个自动编写发送周报的行为,

  • • 对接地图API,查询交通情况,

  • • 物联网对接,控制家里的电器开关。

换句话说,用程序能做的事情大致都可以用自然语言和大模型在外面包装一层,形成 Agent 的能力。

当然,这还只是开始。



--- END ---



53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅