微信扫码
添加专属顾问
我要投稿
通过提示词编写代码
通过LangGraph 构建编写代码的流程,如果有错误则自我纠正
受最近长上下文 LLMs 趋势的启发,我们使用 GPT-4 和 128k 令牌上下文窗口对 60k 令牌 LCEL 文档进行上下文填充。我们将一个关于 LCEL 的问题传递给我们填充了上下文的 LCEL 链以生成初始答案。
我们使用 OpenAI 工具将输出解析为 Pydantic 对象,该对象包含三个部分:(1)描述问题的序言,(2)import 代码块(3)代码。
我们首先检查 导入 执行,因为我们发现在代码生成过程中,导入语句中可能会出现幻觉。
如果 导入 检查通过,我们接下来检查代码本身是否可以执行。在生成提示中,我们指示 LLM 不要在代码解决方案中使用伪代码或未定义的变量,这应该产生可执行的代码。
重要的是,如果任一检查失败,我们将堆栈跟踪与之前的答案一起传回生成节点以进行反思。我们允许重试 3 次(仅作为默认值),重试次数可以根据需要扩展。
作为基线,我们实现了没有 LangGraph 的提示词代码生成,使用 GPT-4 和 128k 令牌上下文窗口对 60k 令牌 LCEL 文档进行内容生产。将一个关于 LCEL 的问题传递给我们填充了上下文的 LCEL 链以生成答案。
欢迎关注我,获取更多关于 AI 优化的前沿资讯。别忘了将今天的内容分享给你的朋友们,让我们一起见证 AI 技术的飞跃!
觉得我的文章对你有帮助的话,请不要吝啬你的点赞、在看和转发~
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-15
2026年了,我强烈推荐你用一用Codex,功能太全面了!附使用指南
2026-05-14
DAA度量Agent,百度智能云率先重构AI云
2026-05-14
美团 LongCat 开源 General 365:树立推理评测新标尺
2026-05-14
终端里住进了一个叫 Claude Code 的搭档
2026-05-14
小企业专属Claude来了!一键接入全套业务流,不用写代码AI自动算账催款
2026-05-14
开源 ElevenLabs 平替来了!OmniVoice Studio 本地免费实现电影级配音
2026-05-14
重构大模型通信架构:火山引擎 RocketMQ For AI 解决方案
2026-05-14
别再一步步确认了:/goal让AI编程真正自己干活
2026-04-15
2026-02-14
2026-03-31
2026-03-13
2026-04-07
2026-03-17
2026-03-17
2026-04-07
2026-03-21
2026-02-20
2026-05-09
2026-05-09
2026-05-09
2026-05-08
2026-05-07
2026-04-26
2026-04-22
2026-04-18