微信扫码
添加专属顾问
我要投稿
从零开始实战,手把手教你用火山 Responses API 开发智能 Agent,轻松实现会话保持与函数调用。核心内容: 1. Responses API 基础用法与优势解析 2. 通过 previous_response_id 实现高效会话保持 3. 完整构建天气/时间查询 Agent 的实战案例
本文将带你从零开始,掌握使用火山引擎 Responses API 开发智能 Agent 的全流程。通过实战代码,你将学会:
previous_response_id 实现会话保持Responses API 是火山引擎专门为 Agent 应用设计的 API,相比传统 Chat API,它在会话管理、函数调用、多轮对话等方面做了专门优化,更适合构建智能 Agent 应用。
最简单的单轮对话示例:
from volcenginesdkarkruntime import Ark
import os
client = Ark(api_key=os.getenv("VOLCENGINE_API_KEY"))
# 单轮对话
response = client.responses.create(
model="doubao-seed-1-6-flash-250828",
input=[{"role": "user", "content": "你好"}]
)
# 获取回复
print(response.output[0].content[0].text)
# 输出:你好!有什么我可以帮助你的吗?
previous_response_id
在多轮对话中,AI 需要记住之前的对话内容。传统做法是每次都发送完整的对话历史,这会导致:
previous_response_id 的优势
Responses API 通过 previous_response_id 实现会话保持:
# 第一轮对话
response = client.responses.create(
model="doubao-pro-32k",
input=[{"role": "user", "content": "我叫张三"}]
)
print(response.output[0].content[0].text)
# 输出:你好张三!
# 第二轮对话:使用 previous_response_id
second_response = client.responses.create(
model="doubao-pro-32k",
input=[{"role": "user", "content": "我刚才说我叫什么?"}],
previous_response_id=response.id # 引用上一轮的响应 ID
)
print(second_response.output[0].content[0].text)
# 输出:你刚才告诉我你叫张三。
response.idprevious_response_idresponse_id 恢复完整上下文函数调用(Function Calling)允许 AI 模型调用外部工具或函数,获取实时数据或执行特定操作。这是构建 Agent 的核心技术。
函数调用需要两次 API 请求:
tools = [{
"type": "function",
"name": "get_current_time",
"description": "获取当前时间",
"parameters": {
"type": "object",
"properties": {
"timezone": {
"type": "string",
"description": "时区,例如:Asia/Shanghai"
}
},
"required": []
}
}]
# 用户请求
response = client.responses.create(
model="doubao-pro-32k",
input=[{"role": "user", "content": "现在几点了?"}],
tools=tools
)
# 检查输出类型
if response.output[0].type == "function_call":
function_call = response.output[0]
print(f"工具名称: {function_call.name}")
print(f"参数: {function_call.arguments}")
# 输出:
# 工具名称: get_current_time
# 参数: {"timezone": "Asia/Shanghai"}
import json
# 执行工具函数
def get_current_time(timezone="Asia/Shanghai"):
from datetime import datetime
from zoneinfo import ZoneInfo
tz = ZoneInfo(timezone)
return datetime.now(tz).strftime("%Y-%m-%d %H:%M:%S")
# 获取工具结果
result = get_current_time("Asia/Shanghai")
# 回传结果
tool_response = client.responses.create(
model="doubao-pro-32k",
input=[{
"type": "function_call_output",
"call_id": function_call.call_id, # 必须使用上一步返回的 call_id
"output": json.dumps(result)
}],
previous_response_id=response.id # 引用之前的会话
)
# 获取最终回复
print(tool_response.output[0].content[0].text)
# 输出:现在是 2025-01-15 10:30:45
tools 参数output[0].type 为 "function_call"call_idprevious_response_idAgent 的核心是"思考-行动-观察"循环:
思考(Thinking)→ 行动(Acting)→ 观察(Observing)→ 思考(Thinking)...
def agent_loop(user_message: str, previous_response_id: str = None):
"""Agent 的核心循环"""
# === 思考阶段 ===
# 构建请求,让模型思考是否需要调用工具
response = client.responses.create(
model=os.getenv("MODEL"),
input=[{"type": "message", "role": "user", "content": user_message}],
tools=tools,
previous_response_id=previous_response_id
)
# === 观察阶段 ===
# 检查模型的决定
if response.output[0].type == "function_call":
# 模型决定调用工具
function_call = response.output[0]
# === 行动阶段 ===
# 执行工具
function_name = function_call.name
function_args = json.loads(function_call.arguments)
print(f"🔧 调用工具: {function_name}")
print(f"📋 参数: {function_args}")
# 执行对应的函数
if function_name == "get_weather":
result = get_weather(**function_args)
elif function_name == "get_current_time":
result = get_current_time(**function_args)
print(f"✅ 结果: {result}")
# 回传工具结果,重新进入思考阶段
tool_response = client.responses.create(
model=os.getenv("MODEL"),
input=[{
"type": "function_call_output",
"call_id": function_call.call_id,
"output": json.dumps(result, ensure_ascii=False)
}],
previous_response_id=response.id
)
# 提取最终回复
final_message = tool_response.output[0].content[0].text
return final_message, tool_response.id
else:
# 模型直接回复,不需要调用工具
message = response.output[0].content[0].text
return message, response.id
import os
import json
from datetime import datetime
from zoneinfo import ZoneInfo
from typing import Optional
from dotenv import load_dotenv
from volcenginesdkarkruntime import Ark
load_dotenv()
client = Ark(api_key=os.getenv("VOLCENGINE_API_KEY"))
# === 工具函数 ===
def get_weather(location: str) -> dict:
"""查询指定城市的天气状况"""
....
def get_current_time(timezone: str = "Asia/Shanghai") -> dict:
"""获取指定时区的当前时间"""
return ...
# 工具函数注册器
FUNCTION_REGISTRY = {
"get_weather": get_weather,
"get_current_time": get_current_time
}
def get_tools() -> list:
"""获取可用的工具列表"""
return [
{
"type": "function",
"name": "get_weather",
"description": "查询指定城市的天气状况",
"parameters": {
....
}
},
{
"type": "function",
"name": "get_current_time",
"description": "获取全球当前时间,返回格式化时间字符串",
"parameters": {
...
}
}
]
# === 核心辅助函数 ===
def get_system_prompt() -> str:
"""获取系统提示词"""
return """你是一个天气和时间查询助手,可以帮助用户查询天气和全球时间信息。
重要规则:
1. 当调用 get_current_time 获取到格式化时间后,直接展示给用户即可,不需要再次转换
2. 如果用户表达了想要结束对话的意图(例如说"再见"、"不聊了"、"就这样吧"等),请直接回复"EXIT_COMMAND"
3. 如果只是普通的寒暄或感谢,继续正常对话
4. 识别退出意图时,要准确判断,不要误判"""
def handle_tool_call(function_call, previous_response_id: str) -> tuple:
"""处理工具调用"""
function_name = function_call.name
function_args = json.loads(function_call.arguments)
call_id = function_call.call_id
print(f" 🔨 调用函数: {function_name}")
print(f" 📋 参数: {function_args}")
# 使用注册器调用函数
result = None
if function_name in FUNCTION_REGISTRY:
result = FUNCTION_REGISTRY[function_name](**function_args)
print(f"\n✅ 工具执行结果: {result}")
else:
result = {"error": f"未找到函数: {function_name}"}
print(f"\n❌ {result['error']}")
tool_output_input = [
{
"type": "function_call_output",
"call_id": call_id,
"output": json.dumps(result, ensure_ascii=False) if result else "{}"
}
]
tool_request = build_request(
input_list=tool_output_input,
tools=[],
previous_response_id=previous_response_id
)
final_response = client.responses.create(**tool_request)
message_content = ""
if hasattr(final_response, 'output') and len(final_response.output) > 0:
for output_item in final_response.output:
if output_item.type == "message" and hasattr(output_item, 'content'):
message_content = output_item.content[0].text if len(output_item.content) > 0 else ""
break
new_previous_response_id = final_response.id
return message_content, new_previous_response_id
# === Agent 核心逻辑 ===
def run_agent():
"""运行 Agent,使用 Responses API 实现 function tool 调用"""
tools = get_tools()
system_input = [{"type": "message", "role": "system", "content": get_system_prompt()}]
print(f"🤖 天气和时间查询助手已启动")
print("📦 正在缓存 system 消息...")
# 启动时先缓存 system 消息
cache_response = client.responses.create(
model=os.getenv("MODEL"),
input=system_input,
caching={"type": "enabled"},
thinking={"type": "disabled"}
)
previous_response_id = cache_response.id
print(f"✅ System 消息已缓存,response_id: {previous_response_id}")
print("=" * 50)
while True:
user_message = input("\n👤 用户: ").strip()
if not user_message:
continue
# 每次只发送用户消息,引用缓存的 response_id
input_list = [{"type": "message", "role": "user", "content": user_message}]
request_body = build_request(input_list, tools, previous_response_id)
response = client.responses.create(**request_body)
previous_response_id = response.id
message_content = ""
function_call = None
if hasattr(response, 'output') and len(response.output) > 0:
for output_item in response.output:
if output_item.type == "function_call":
function_call = output_item
print("\n🔧 Agent检测到需要调用工具:")
message_content, previous_response_id = handle_tool_call(
function_call, previous_response_id
)
break
elif output_item.type == "message":
if hasattr(output_item, 'content') and len(output_item.content) > 0:
message_content = output_item.content[0].text
break
if check_exit(message_content):
return
print(f"\n🤖 Agent: {message_content}")
if __name__ == "__main__":
try:
run_agent()
except KeyboardInterrupt:
print("\n\n👋 再见!")
🤖 天气和时间查询助手已启动
📦 正在缓存 system 消息...
✅ System 消息已缓存,response_id: resp_xxx
=================================================
👤 用户: 查询南京的天气
🔧 Agent 检测到需要调用工具:
🔨 调用函数: get_weather
📋 参数: {'location': '南京'}
✅ 工具执行结果: {'location': '南京', 'weather': '阴', 'temperature': 20, 'unit': '摄氏度'}
🤖 Agent: 南京现在的天气是阴,温度为20摄氏度。
👤 用户: 现在几点了?
🔧 Agent 检测到需要调用工具:
🔨 调用函数: get_current_time
📋 参数: {'timezone': 'Asia/Shanghai'}
✅ 工具执行结果: {'formatted_time': '2025-01-14 22:30:45', 'timezone': 'Asia/Shanghai'}
🤖 Agent: 现在是 2025年1月14日 22:30:45(上海时间)。
👤 用户: 再见
👋 Agent: 再见!
通过本文的学习,你应该已经掌握了:
previous_response_id 轻松管理多轮对话掌握了这些基础后,你可以继续探索:
开始你的 Agent 开发之旅吧!🚀
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-31
谷歌反重力IDE新功能Artifact:优秀的Agent交互设计
2025-12-31
AI笔记:对embedding的粗暴理解
2025-12-31
2026 AI Agent 的核心:Context Engineering,让环境可计算化
2025-12-31
迪士尼牵手OpenAI:AI娱乐“正版化”的开端
2025-12-31
AGI的终极形态,是分布式集体智能?
2025-12-31
Manus联合创始人张涛:智能体Agent的终极形态是什么?
2025-12-31
MCP、Skill、Agent:AI 圈的三个流行词,到底在说什么?——以及 Meta 收购 Manus 这场"垃圾联姻"
2025-12-31
Claude skills 底层逻辑是什么?
2025-10-26
2025-10-07
2025-11-19
2025-11-13
2025-10-20
2025-10-18
2025-10-11
2025-10-21
2025-10-15
2025-10-09
2025-12-31
2025-12-31
2025-12-31
2025-12-30
2025-12-30
2025-12-25
2025-12-25
2025-12-25