微信扫码
添加专属顾问
大语言模型的应用之一是与大语言模型进行聊天也就是一个ChatBot,这个应用已经很广泛了。
接下来的一个应用就是AI Agent。
AI Agent是人工智能代理(Artificial Intelligence Agent)的概念,它是一种能够感知环境、进行决策和执行动作的智能实体,通常基于机器学习和人工智能技术,具备自主性和自适应性,在特定任务或领域中能够自主地进行学习和改进。一个更完整的Agent,一定是与环境充分交互的,它包括两部分——一是Agent的部分,二是环境的部分。此刻的Agent就如同物理世界中的「人类」,物理世界就是人类的「外部环境」。
今天就基于开源的大语言模型Qwen2-7B-Instruct与开源的LLM应用框架SenmanticKernel实现我们的第一个AI Agent!
入门先从一个简单的例子入手,比如叫大语言模型将字符串打印至控制台。
在ChatBox应用中,我们叫大语言模型将字符串打印至控制台,它的回答可能是这样子的:
而在简易的AI Agent应用中,大语言模型会帮我们完成这项简单的任务。
又比如,我们需要从数据库中检索信息,假设需要检索的信息如下所示:
List<Order> Orders = new List<Order>()
{
new Order(){Id=1,Name="iPhone15",Address="武汉"},
new Order(){Id=2,Name="iPad",Address="北京"},
new Order(){Id=3,Name="MacBook",Address="上海"},
new Order(){Id=4,Name = "HuaWei Mate60 ",Address = "深圳"},
new Order(){Id = 5,Name = "小米14",Address = "广州"}
};
在ChatBox应用中,我们如果问Id为1的订单信息是什么?大语言模型是不会知道我们想干什么的,回答可能如下所示:
而在简易的AI Agent应用中,AI回答如下:
上一篇文章讲过,在SemanticKernel中OpenAI支持Function Call的模型与月之暗面支持Function Call的模型,只需进行简单的设置即可实现自动函数调用,但我尝试了其他开源的模型,发现做不到。
通过github了解到,其他的模型可以通过提示工程来实现本地函数调用。
什么是提示工程?
提示工程(Prompt Engineering)是一种自然语言处理(NLP)技术,主要应用于生成式AI模型,如GPT-3等。它通过精心设计输入提示(prompt),引导模型生成特定类型的输出。在提示工程中,用户可以控制模型的输出内容、风格和格式,以满足不同的应用场景需求。
提示工程的关键在于设计有效的提示,这通常需要对模型的能力和限制有深入的了解。通过调整提示的结构、语言和上下文,可以显著提高模型生成结果的质量和相关性。在实际应用中,提示工程可以用于文本生成、问答、翻译、摘要、对话系统等多个领域。
上面两个简单的AI Agent应用实现的原理是一样的,选择第二个获取订单的引用进行讲解。
实现的方法来自上一篇博客提到的项目:
Jenscaasen/UniversalLLMFunctionCaller: A planner that integrates into Semantic Kernel to enable function calling on all Chat based LLMs (Mistral, Bard, Claude, LLama etc) (github.com)
在kernel中导入插件:
public sealed class OrderPlugin
{
List<Order> Orders = new List<Order>()
{
new Order(){Id=1,Name="iPhone15",Address="武汉"},
new Order(){Id=2,Name="iPad",Address="北京"},
new Order(){Id=3,Name="MacBook",Address="上海"},
new Order(){Id=4,Name = "HuaWei Mate60 ",Address = "深圳"},
new Order(){Id = 5,Name = "小米14",Address = "广州"}
};
[KernelFunction, Description("根据Id获取订单")]
[return: Description("获取到的订单")]
public string GetOrderById(
[Description("订单的Id")] int id)
{
var order = Orders.Where(x => x.Id == id).FirstOrDefault();
if(order != null)
{
return order.ToString();
}
else
{
return "找不到该Id的订单";
}
}
}
_kernel.ImportPluginFromType<OrderPlugin>("Order");
UniversalLLMFunctionCaller planner = new(_kernel);
string result = await planner.RunAsync(AskText);
重点在planner.RunAsync中。
导入为了实现目的内置的插件:
// Initialize plugins
var plugins = _kernel.Plugins;
var internalPlugin = _kernel.Plugins.AddFromType<UniversalLLMFunctionCallerInternalFunctions>();
UniversalLLMFunctionCallerInternalFunctions插件如下:
internal class UniversalLLMFunctionCallerInternalFunctions
{
// [KernelFunction, Description("Call this when the workflow is done and there are no more functions to call")]
// public string Finished(
// [Description("Wrap up what was done and what the result is, be concise")] string finalmessage
//)
// {
// return string.Empty;
// //no actual implementation, for internal routing only
// }
[KernelFunction, Description("当工作流程完成,没有更多的函数需要调用时,调用这个函数")]
public string Finished(
[Description("总结已完成的工作和结果,尽量简洁明了。")] string finalmessage
)
{
return string.Empty;
//no actual implementation, for internal routing only
}
//[KernelFunction, Description("Gets the name of the spaceship of the user")]
//public string GetMySpaceshipName()
//{
// return "MSS3000";
//}
[KernelFunction, Description("获取用户飞船的名称")]
public string GetMySpaceshipName()
{
return "嫦娥一号";
}
// [KernelFunction, Description("Starts a Spaceship")]
// public void StartSpaceship(
// [Description("The name of the spaceship to start")] string ship_name
//)
// {
// //no actual implementation, for internal routing only
// }
[KernelFunction, Description("启动飞船")]
public void StartSpaceship(
[Description("启动的飞船的名字")] string ship_name
)
{
//no actual implementation, for internal routing only
}
}
}
我将英文原版注释掉并增加了一个中文的版本。
将插件转化为文本:
// Convert plugins to text
string pluginsAsText = GetTemplatesAsTextPrompt3000(plugins);
获取到了插件中所有本地函数的信息。
nextFunctionCall = await GetNextFunctionCallAsync(chatHistory, pluginsAsText);
让大语言模型获取下一次需要调用的函数。
在对话示例中加入一个提示,这个提示是关键!
英文原版如下:
private string GetLoopSystemMessage(string pluginsAsTextPrompt3000)
{
string systemPrompt = $@"You are a computer system. You can only speak TextPrompt3000 to make the user call functions, and the user will behave
as a different computer system that answers those functions.
Below, you are provided a goal that needs to be reached, as well as a list of functions that the user could use.
You need to find out what the next step for the user is to reach the goal and recommend a TextPrompt3000 function call.
You are also provided a list of functions that are in TextPrompt3000 Schema Format.
The TextPrompt3000 Format is defined like this:
{GetTextPrompt300Explanation()}
##available functions##
{pluginsAsTextPrompt3000}
##end functions##
The following rules are very important:
1) you can only recommend one function and the parameters, not multiple functions
2) You can only recommend a function that is in the list of available functions
3) You need to give all parameters for the function. Do NOT escape special characters in the name of functions or the names of parameters (dont do aaa\_bbb, just stick to aaa_bbb)!
4) Given the history, the function you recommend needs to be important to get closer towards the goal
5) Do not wrap functions into each other. Stick to the list of functions, this is not a math problem. Do not use placeholders.
We only need one function, the next one needed. For example, if function A() needs to be used as parameter in function B(), do NOT do B(A()). Instead,
if A wasnt called allready, call A() first. The result will be used in B in a later iteration.
6) Do not recommend a function that was recently called. Use the output instead. Do not use Placeholders or Functions as parameters for other functions
7) Only write a Function Call, do not explain why, do not provide a reasoning. You are limited to writing a function call only!
8) When all necessary functions are called and the result was presented by the computer system, call the Finished function and present the result
If you break any of those rules, a kitten dies.
";
return systemPrompt;
}
我翻译了一个中文版本如下:
private string GetLoopSystemMessage(string pluginsAsTextPrompt3000)
{
string systemPrompt = $@"你是一个计算机系统。
你只能使用TextPrompt3000指令,让用户调用对应的函数,而用户将作为另一个回答这些函数的计算机系统。
以下是您所需实现的目标,以及用户可以使用的函数列表。
您需要找出用户到达目标的下一步,并推荐一个TextPrompt3000函数调用。
您还会得到一个TextPrompt3000 Schema格式的函数列表。
TextPrompt3000格式的定义如下所示:
{GetTextPrompt300Explanation()}
##可用函数列表开始##
{pluginsAsTextPrompt3000}
##可用函数列表结束##
以下规则非常重要:
1) 你只能推荐一个函数及其参数,而不是多个函数
2) 你可以推荐的函数只存在于可用函数列表中
3) 你需要为该函数提供所有参数。不要在函数名或参数名中转义特殊字符,直接使用(如只写aaa_bbb,不要写成aaa\_bbb)
4) 你推荐的历史记录与函数需要对更接近目标有重要作用
5) 不要将函数相互嵌套。 遵循列表中的函数,这不是一个数学问题。 不要使用占位符。
我们只需要一个函数,下一个所需的函数。举个例子, 如果 function A() 需要在 function B()中当参数使用, 不要使用 B(A())。 而是,
如果A还没有被调用, 先调用 A()。返回的结果将在下一次迭代中在B中使用。
6) 不要推荐一个最近已经调用过的函数。 使用输出代替。 不要将占位符或函数作为其他函数的参数使用。
7) 只写出一个函数调用,不解释原因,不提供理由。您只能写出一个函数调用!
8) 当所有必需的函数都被调用,且计算机系统呈现了结果,调用Finished函数并展示结果。
9) 请使用中文回答。
如果你违反了任何这些规定,那么会有一只小猫死去。
";
return systemPrompt;
}
第一次直观感受到了提示工程的魔法。
根据这个模板与对话历史询问大语言模型下一步需要执行的函数名称与参数是什么:
大语言模型回答需要调用的函数名为GetOrderById,参数id为3,接下来验证是否可以转化为一个Function Call:
在plugins中查找是否有同名的函数,如果有KernelArguments,进行本地函数调用:
private async Task<string> InvokePluginAsync(FunctionCall functionCall)
{
List<string> args = new List<string>();
foreach (var paraam in functionCall.Parameters)
{
args.Add($"{paraam.Name} : {paraam.Value}");
}
Debug.WriteLine($">>invoking {functionCall.Name} with parameters {string.Join(",", args)}");
// Iterate over each plugin in the kernel
foreach (var plugin in _kernel.Plugins)
{
// Check if the plugin has a function with the same name as the function call
var function = plugin.FirstOrDefault(f => f.Name == functionCall.Name);
if (function != null)
{
// Create a new context for the function call
KernelArguments context = new KernelArguments();
// Add the function parameters to the context
foreach (var parameter in functionCall.Parameters)
{
context[parameter.Name] = parameter.Value;
}
// Invoke the function
var result = await function.InvokeAsync(_kernel, context);
Debug.WriteLine($">>Result: {result.ToString()}");
return result.ToString();
}
}
// Invoke the function
var result = await function.InvokeAsync(_kernel, context);
在本例中会执行:
[KernelFunction, Description("根据Id获取订单")]
[return: Description("获取到的订单")]
public string GetOrderById(
[Description("订单的Id")] int id)
{
var order = Orders.Where(x => x.Id == id).FirstOrDefault();
if(order != null)
{
return order.ToString();
}
else
{
return "找不到该Id的订单";
}
}
这个函数,得到如下结果:
大语言模型判断已经完成了任务,下一步执行
[KernelFunction, Description("当工作流程完成,没有更多的函数需要调用时,调用这个函数")]
public string Finished(
[Description("总结已完成的工作和结果,尽量简洁明了。")] string finalmessage
)
{
return string.Empty;
//no actual implementation, for internal routing only
}
这个函数,如下所示:
下一个调用的函数是Finished的,会跳出循环:
返回最后的信息:
最终的效果如下所示:
以上就是本次分享的全部内容,尝试使用开源的大语言模型与SenmanticKernel框架结合,构建自己的简易的AI Agent,不过AI Agent的效果还不是很好,任务变复杂有可能会出错,具体学习可以看推荐的项目的源代码,作者写的还是比较清晰的。感谢硅基流动提供的平台,让我等没有硬件资源的人,也可以流畅的使用开源的大语言模型,进行大语言模型的应用探索。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-07-04
ThinkParse 1.1.0 开源发布:把文档解析,做成可扩展的企业级服务
2026-07-04
Agent 工程终于有脚手架了, Google开源一个开发agent的工具
2026-07-03
用云新范式:Qoder Cloud Agents × Alibaba Cloud Skills
2026-07-03
Ornith-1.0 发布: 新一代 Agentic Coding 之王,MIT 开源
2026-07-02
Meta把内部设计系统开源了,支撑内部13000+应用,专为Agent调优
2026-07-02
别再把 AI 当搜索引擎了,这 20 个操作让它替你干活
2026-07-02
ollama v0.31.1发布:Apple Silicon上Gemma 4提速近90%,默认开启无感升级
2026-07-01
在 OpenCode 中接入本地模型:Ollama 部署与配置完全指南
2026-04-09
2026-04-18
2026-04-18
2026-06-22
2026-05-10
2026-05-06
2026-05-31
2026-05-20
2026-04-21
2026-04-21
2026-06-16
2026-05-30
2026-05-16
2026-04-22
2026-04-21
2026-04-15
2026-04-09
2026-04-01
欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。
在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。
一、 定义
本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。
会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。
知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。
二、 账号注册与登录
登录方式:本网站支持以下登录方式,您可根据实际情况选择:
微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。
手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。
账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。
实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。
未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。
三、 服务内容与规范
知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。
服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。
禁止行为:您在使用服务时不得实施以下行为:
利用技术手段批量爬取、下载、转存知识库内容;
将知识库内容用于商业目的或未经授权地向第三方传播;
干扰本网站正常运行或侵犯其他用户合法权益;
发布违法违规信息或从事违反公序良俗的活动。
四、 知识产权声明
权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。
有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。
侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。
五、 个人信息保护
我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。
您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。
您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。
六、 免责声明
内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。
不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。
第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。
七、 违约责任
如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。
如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。
八、 法律适用与争议解决
本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。
因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。
九、 其他
本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。
本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。
我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。