微信扫码
添加专属顾问
 
                        我要投稿
本地模型接入MCP的详细指南,手把手教你实现智能体功能升级! 核心内容: 1. MCP协议的核心概念与架构解析 2. 两种主流连接模式(Stdio/SSE)的配置方法 3. 异步函数在SSE模式中的关键作用与实践技巧
 
                                MCP最近很火,但在实际的应用环境中,并没有详细的资料讲解如何使用如何部署,增加初学者的学习成本,本文希望直观的展示mcp工具的具体使用实践。
大语言模型,例如DeepSeek,如果不能联网、不能操作外部工具,只能是聊天机器人。除了聊天没什么可做的。而一旦大语言模型能操作工具,例如:联网/地图/查天气/函数/插件/API接口/代码解释器/机械臂/灵巧手,它就升级成为智能体Agent,能更好地帮助人类。今年爆火的Manus就是这样的智能体。
在以前,如果想让大模型调用外部工具,需要通过写大段提示词的方法,实现“Function Call”,这样其实就非常的不友好。
Anthropic公司(就是发布Claude大模型的公司),在2024年11月,发布了Model Context Protocol协议,简称MCP。MCP协议就像Type-C扩展坞,让海量的软件和工具,能够插在大语言模型上,供大模型调用。
总的来说,mcp就是一个框架,能帮助大模型调用工具 
MCP采用客户端-服务器的分布式架构,它将 LLM 与资源之间的通信划分为三个主要部分:客户端、服务器和资源。
目前配置 MCP服务主要有种模式:
在 MCP 框架中,SSE 模式是为了支持流式生成(如 LLM 的分词响应)而设计的一种 模型响应协议形式,其主要特征如下:
特点:
stream=True 接口兼容。sse模型一般是推荐使用异步函数,那么为什么 SSE 模型要用异步函数?
1. SSE 本质是“流式”通信,需要持续等待数据SSE 是服务端持续推送数据,客户端需要一直监听这个连接,直到服务端关闭或中止。这种长时间等待、读取的过程非常适合用 async 实现,而不是阻塞式的 requests.get()。如果用同步函数,会卡住整个线程,阻塞后续逻辑或 UI。
2. 异步 I/O 更高效,占用资源更少 在异步模式下,await 会在数据没到的时候挂起任务,释放执行权给其他协程,而不是死等。这对于聊天机器人、Web 服务或多用户同时请求来说,性能提升非常明显。
为了方便演示,我写了一个mcp的工具demo
from fastmcp import FastMCP# 创建一个FastMCP应用实例,名称为"demo"# 这将作为所有工具的统一服务入口app = FastMCP("demo")# 定义一个名为"weather"的工具,用于查询城市天气# 该工具接收一个字符串类型的城市名称作为参数def get_weather(city: str):# 定义一个包含部分城市天气信息的字典# 实际应用中这里可能会调用真实的天气APIweather_data = {"北京": {"temp": 25, "condition": "晴"},"上海": {"temp": 28, "condition": "多云"}}# 返回对应城市的天气信息,如果城市不存在则返回错误信息return weather_data.get(city, {"error": "未找到该城市"})if __name__ == "__main__":# 启动应用,使用标准输入输出作为传输方式# 这意味着可以通过命令行与工具进行交互app.run(transport="stdio")
run(transport="stdio") 以子进程方式等待客户端通过标准输入输出发送调用指令
这里为了演示方便,我们直接调用阿里的api接口进行模型与mcp工具的交互
参考链接:通义千问API参考(https://help.aliyun.com/zh/model-studio/use-qwen-by-calling-api)
import asyncioimport jsonfrom openai import OpenAIfrom mcp.client.stdio import stdio_clientfrom mcp import ClientSession, StdioServerParameters# 配置OpenAI API参数,使用兼容模式接入阿里云DashScope服务OPENAI_API_KEY = "sk-xxxxxxxxxxxxxxxxxxxxxxxxxx"OPENAI_API_BASE = "https://dashscope.aliyuncs.com/compatible-mode/v1"class MCPClientDemo:def __init__(self, server_path: str):"""初始化MCP客户端:param server_path: MCP服务端脚本路径"""self.server_path = server_path# 创建OpenAI客户端,连接到兼容API的阿里云DashScope服务self.llm = OpenAI(api_key=OPENAI_API_KEY, base_url=OPENAI_API_BASE)async def run(self, user_query: str):"""执行用户查询,对比使用工具和不使用工具的结果:param user_query: 用户问题:return: 对比结果字典"""# 配置标准IO通信的服务端参数server_params = StdioServerParameters(command="python", args=[self.server_path])# 建立与MCP服务端的连接async with stdio_client(server=server_params) as (read_stream, write_stream):# 创建客户端会话async with ClientSession(read_stream, write_stream) as session:await session.initialize()# 获取服务端注册的所有工具信息tools = (await session.list_tools()).tools# 将MCP工具格式转换为OpenAI函数调用格式functions = []for tool in tools:functions.append({"name": tool.name,"description": tool.description or "",# 使用工具的输入模式或默认模式"parameters": tool.inputSchema or {"type": "object","properties": {"city_name": {"type": "string", "description": "城市名称"}},"required": ["city_name"]}})# -------------------------------# 模型调用 + MCP 工具路径# -------------------------------# 调用Qwen-max模型,启用函数调用功能response_with_tool = self.llm.chat.completions.create(model="qwen-max",messages=[{"role": "user", "content": user_query}],functions=functions,function_call="auto")message_with_tool = response_with_tool.choices[0].messageresult_with_tool = {"model_reply": message_with_tool.content,"tool_called": None,"tool_result": None}# 如果模型决定调用工具if message_with_tool.function_call:tool_name = message_with_tool.function_call.namearguments = json.loads(message_with_tool.function_call.arguments)# 通过MCP会话调用实际工具tool_result = await session.call_tool(tool_name, arguments)result_with_tool.update({"tool_called": tool_name,"tool_arguments": arguments,"tool_result": tool_result})# -------------------------------# 模型不使用 MCP 工具的路径# -------------------------------# 调用相同模型,但不提供工具信息response_no_tool = self.llm.chat.completions.create(model="qwen-max",messages=[{"role": "user", "content": user_query}],# 不传入 functions 参数,模型无法使用工具)message_no_tool = response_no_tool.choices[0].messageresult_no_tool = {"model_reply": message_no_tool.content}# 返回两种调用方式的对比结果return {"user_query": user_query,"with_mcp_tool": result_with_tool,"without_tool": result_no_tool}async def main():"""主函数,演示工具使用与不使用的对比"""# 创建MCP客户端,连接到指定服务端client = MCPClientDemo(server_path="./stdio_mcp.py")# 执行天气查询示例result = await client.run("北京的天气怎么样")# 格式化输出对比结果print(">>> 用户提问:", result["user_query"])print("\n【使用 MCP 工具】")print("模型回复:", result["with_mcp_tool"]["model_reply"])if result["with_mcp_tool"]["tool_called"]:print("调用工具:", result["with_mcp_tool"]["tool_called"])print("工具参数:", result["with_mcp_tool"]["tool_arguments"])print("工具结果:", result["with_mcp_tool"]["tool_result"])else:print("未调用任何工具")print("\n【不使用工具】")print("模型回复:", result["without_tool"]["model_reply"])if __name__ == "__main__":# 运行异步主函数asyncio.run(main())
可以看到模型调用了mcp的weather工具,并返回了工具调用的结果 {"temp":25,"condition":"晴"} 说明模型准确的识别到了工具,并进行了调用。
那如果我开发不同的工具,模型能够准确使用,那是不是就能大幅度扩展模型的能力范围,进一步提升模型的效率呢?
本节演示使用vllm本地化部署qwen系统的模型,并与本地化的mcp工具进行交互。在实际的应用场景中,我们肯定会开发各种不同的工具,那每次使用stdio 这样的形式肯定是不够方便,是不是可以直接在本地的服务器上开一个端口,然后注册各种mcp的工具,如果模型要使用就直接通过mcp协议调用即可。
部署mcp服务,服务放在4200端口上
from fastmcp import FastMCP# 创建FastMCP应用实例,"demo"为应用名称app = FastMCP("demo")# 注册天气查询工具,用于获取指定城市的天气信息def get_weather(city: str):# 预设的天气数据(实际应用中可替换为API调用)weather_data = {"北京": {"temp": 25, "condition": "晴"},"上海": {"temp": 28, "condition": "多云"}}# 返回对应城市的天气,不存在则返回错误信息return weather_data.get(city, {"error": "未找到该城市"})# 注册股票查询工具,用于获取指定股票代码的价格信息def get_stock(code: str):# 预设的股票数据(实际应用中可替换为API调用)stock_data = {"600519": {"name": "贵州茅台", "price": 1825.0},"000858": {"name": "五粮液", "price": 158.3}}# 返回对应股票的信息,不存在则返回错误信息return stock_data.get(code, {"error": "未找到该股票"})if __name__ == "__main__":# 启动HTTP服务,支持流式响应app.run(transport="streamable-http", # 使用支持流式传输的HTTP协议host="127.0.0.1", # 监听本地地址port=4200, # 服务端口path="/demo", # 服务路径前缀log_level="debug", # 调试日志级别)
测试mcp服务是否可以正常运行
import asyncioimport httpxfrom fastmcp import Clientfrom fastmcp.client.transports import StreamableHttpTransportasync def test_mcp_service():"""测试FastMCP服务的异步函数"""# 定义服务URL,与服务端配置保持一致SERVICE_URL = "http://127.0.0.1:4200/demo"try:# 创建基于HTTP的流传输客户端transport = StreamableHttpTransport(url=SERVICE_URL)# 使用上下文管理器创建客户端会话async with Client(transport) as client:print(f"成功连接到MCP服务: {SERVICE_URL}")# 发送ping请求测试服务连通性await client.ping()print("服务心跳检测成功")# 获取服务端注册的所有工具tools = await client.list_tools()tool_names = [tool.name for tool in tools]print(f"可用工具列表: {', '.join(tool_names)}")# ==== 工具调用示例 ====# 1. 调用天气工具查询北京天气weather_results = await client.call_tool("weather", {"city": "北京"})# 提取第一个结果的字典数据(假设服务端返回结构化数据)weather_data = weather_results[0].textprint(f"北京天气: 温度={weather_data['temp']}℃, 天气={weather_data['condition']}")# 2. 调用股票工具查询贵州茅台股价stock_results = await client.call_tool("stock", {"code": "600519"})stock_data = stock_results[0].textprint(f"股票查询: 名称={stock_data['name']}, 价格={stock_data['price']}")# 3. 测试错误处理(查询不存在的城市)try:error_results = await client.call_tool("weather", {"city": "东京"})# 检查错误信息是否符合预期if error_results and hasattr(error_results[0], 'error'):print(f"错误处理测试: {error_results[0].error} - 符合预期行为")except Exception as e:print(f"意外错误: {str(e)}")# 处理连接失败异常except httpx.ConnectError:print(f"连接失败!请检查服务是否运行在 {SERVICE_URL}")# 处理其他未知异常except Exception as e:print(f"测试失败: {str(e)}")if __name__ == "__main__":# 脚本入口点print("="*50)print("FastMCP服务测试脚本")print("="*50)# 运行异步测试函数asyncio.run(test_mcp_service())
可以看到可以正常的访问mcp服务
我们使用vllm部署模型, 把模型打到8000接口
python -m vllm.entrypoints.openai.api_server \ --model ./qwen3-1.7b/ \ --served-model-name "qwen3-1.7b" \ --port 8000 \ --trust-remote-code \ --enable-auto-tool-choice \ --tool-call-parser hermes
接下来我们启动服务对大模型进行提问
import asynciofrom openai import AsyncOpenAIfrom fastmcp import Clientasync def query_mcp_tool(tool_name: str, params: dict):"""调用MCP工具的统一入口:param tool_name: 工具名称:param params: 工具参数:return: 工具执行结果"""async with Client("http://127.0.0.1:4200/demo") as client:return await client.call_tool(tool_name, params)async def chat_with_tools():"""实现支持工具调用的聊天功能1. 连接本地vLLM服务2. 获取可用工具列表并转换为OpenAI函数调用格式3. 根据用户问题调用适当工具4. 整合工具结果生成最终回复"""# 连接本地部署的vLLM服务(兼容OpenAI API)llm_client = AsyncOpenAI(base_url="http://localhost:8000/v1",api_key="EMPTY" # 本地服务不需要API密钥)# 动态获取MCP服务提供的工具列表async with Client("http://127.0.0.1:4200/demo") as mcp_client:tools = await mcp_client.list_tools()# 将MCP工具模式转换为OpenAI函数调用格式tool_schemas = [{"type": "function","function": {"name": tool.name,"description": tool.description,"parameters": {"type": tool.inputSchema.get("type", "object"),"properties": {prop_name: prop_deffor prop_name, prop_def in tool.inputSchema["properties"].items()},"required": tool.inputSchema.get("required", [])}}} for tool in tools]# 用户提问示例user_query = "查询北京天气和贵州茅台股价"# 第一次调用模型,允许模型决定是否需要调用工具response = await llm_client.chat.completions.create(model="qwen3-1.7b",messages=[{"role": "user", "content": user_query}],tools=tool_schemas,tool_choice="auto" # 让模型自动选择工具)# 处理工具调用请求message = response.choices[0].messageprint(message.tool_calls)if message.tool_calls:print("检测到工具调用请求:")# 按顺序执行模型请求的所有工具for call in message.tool_calls:print(f"正在执行 {call.function.name}...")# 调用MCP工具并获取结果result = await query_mcp_tool(call.function.name,eval(call.function.arguments) # 将参数字符串转换为字典)print(f"工具返回: {result}")# 第二次调用模型,结合工具结果生成最终回复final_response = await llm_client.chat.completions.create(model="qwen3-1.7b",messages=[{"role": "user", "content": user_query}, # 原始问题message, # 模型的工具调用计划*[{ # 每个工具的执行结果"role": "tool","name": call.function.name,"content": str(result)} for call in message.tool_calls]])print("\n最终回复:", final_response.choices[0].message.content)else:# 如果模型认为不需要工具,直接返回模型回复print("直接回复:", message.content)if __name__ == "__main__":# 运行异步聊天函数asyncio.run(chat_with_tools())
看一下最后的结果
<think>好的,用户之前让我查询北京的天气和贵州茅台的股价。我先调用了天气和股票的函数,然后得到了结果。现在用户可能想知道具体的天气情况和股价。不过根据返回的数据显示,贵州茅台的股价是1825.0,但通常茅台的股价会波动,可能需要确认数据是否最新。另外,北京的天气信息可能需要更详细的预报,比如温度、天气状况等。用户可能希望得到更全面的信息,或者检查是否有误。我应该提醒用户数据可能实时性,建议查看最新行情或天气预报。同时,确认是否有其他需求,比如是否需要股票代码或天气的详细信息。</think>北京当前天气:晴,温度15℃~25℃,空气质量良好。贵州茅台最新股价:1825.0元(数据仅供参考,实际行情以实时市场为准)。需要更详细的天气预报或股票行情,请补充说明!
可以看到模型明确的表示 我先调用了天气和股票的函数 然后得到了结果~~~~~
说明本地的模型已经与mcp进行了交互
完美下车~
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-10-31
Opera One升级内置AI 迎来智能助手新纪元
2025-10-31
LangExtract——大模型文本提炼工具
2025-10-31
用户测评|DeepSeek-OCR,你用了吗?
2025-10-31
从Palantir智能化技术路线看AI时代企业级架构平台的核心战略位置
2025-10-31
OpenAI 公开 Atlas 架构:为 Agent 重新发明浏览器
2025-10-31
Palantir 本体论模式:重塑企业 AI 应用的 “语义根基” 与产业启示
2025-10-31
树莓派这种“玩具级”设备,真能跑大模型吗?
2025-10-30
Cursor 2.0的一些有趣的新特性
 
            2025-08-21
2025-08-21
2025-08-19
2025-09-16
2025-10-02
2025-09-08
2025-09-17
2025-08-19
2025-09-29
2025-08-20