微信扫码
添加专属顾问
通用人工智能(GenAI)应用的开发领域正以惊人的速度不断演进。我们正在经历从简单的提示工程(Prompt Engineering)到构建复杂人工智能系统开发与构建的显著转变。这些系统涵盖了包括检索、预处理、后处理、防护措施、代码解释、大型语言模型(LLM)路由、模型集成、混合编排(静态和动态)中的内存管理等复杂流程,如检索增强生成(RAG)和人工智能代理(AI Agent)等技术日益普及。
这种复杂性和先进性虽然赋予了 AI 应用开发者强大的能力,但也带来了挑战。在开发阶段,开发者需要理解复杂程序执行过程中的每个步骤,以获得观测、调试、评估和改进他们的 GenAI 应用的洞察力。其后,随着越来越多的 GenAI 应用从概念验证阶段过渡到生产环境,部署后的可观测性变得至关重要,让开发者监控 GenAI 应用上线后的行为,性能,用户反馈和响应,以洞察和调试边缘案例,加速应用的迭代优化。
正如本篇博客所强调的,GenAI 应用开发的生命周期并没有改变,但由于涉及的系统复杂性,挑战却在日益增加。下图作为一个视觉指南,帮助我们在流程中发现复杂性,强调出成功开发 GenAI 应用所需的系统方法。
#01
强化 GenAI
应用开发的追踪和可观测性
使用 prompt flow SDK 你可以轻松追踪和监控 GenAI 应用的执行过程,从输入到输出,再到中间环节的执行信息。在 prompt flow trace 中你可以观测到 GenAI 工作流中每个函数调用的详细日志,包括中间结果,使用的 AI 模型参数配置,token 开销,执行时间等性能指标,这有助于您快速了解 AI 模型的工作方式和它们产生的结果,以及调试和优化 GenAI 应用的生成结果。
Prompt flow SDK 同时支持 Trace 在本地和云端,你可以通过 `pf` 本地 SDK 在本地开发过程中查看 trace,同时也可以通过 `pfazure` 云端SDK 将 trace 发送到 Azure AI Studio国际版,Azure Machine Learning 或其他 OpenTelemetry 收集器(如 Azure Application Insights)。这种灵活性确保您可以将 Trace 与任何基于 Python 的代码集成,轻松地进行应用测试、调试、评估和部署监控。
▲ Local trace
在已经 GA 的 Azure AI Studio 国际版上,我们提供更强大的基于云的跟踪,这是一个构建 GenAI 应用程序的一站式平台,为企业级开发团队提供本地到云端的团队协作、持久存储,云服务资源调用,基于 UI 界面的交互式管理和可视化的开发体验。
▲ Cloud trace
基于 Trace 的基本调式
当你的应用运行遇到报错时,Trace 可以帮助你更深入地观测到引发错误的函数中,评估异常情况,并使用提供的异常消息和 trace 栈进行故障排除。参考此例子 Tracing with LLM applicable 开始你的 LLM 应用的 Trace!
▲ Debugging in trace exception
分析 RAG 应用的检索
对于基于 RAG 的 LLM 应用(例如基于企业专业知识的问答聊天机器人),通常在调试非预期结果的过程中,想要明确问题出在检索过程中,还是在LLM 的提示生成中,是一个艰巨的任务。然而,借助新引入的 Trace 功能,检索和 LLM 生成将被展示为独立的执行步骤,便于你观测其输入输出,分析prompt 或检索配置对结果的影响。例如,您可以观察基于测试问题检索的上下文,分析参数配置,尝试微调参数以实现最佳检索。
▲ Analyzing the retrieval of RAG
观测 multi-agents 的交互
Multi-agents 是 LLM 应用的常见的场景,它是更先进的应用框架,例如构造一个由 LLMs、tool 和 human 支持的可对话代理,实现通过多角色之间的自动化,交互式聊天,来共同执行一个任务。在这种对角色自动对话场景下,Trace 视图将帮助你监控多角色对话的流程,观测每个角色以及 LLM 之间自动调用的交互过程。请参考这个例子 Tracing with AutoGen 来开始你的 multi-agent 场景的 trace!
▲ Observing the multi-agents interactions
强化应用评估和调试的万能 flow - Flex Flow
Evaluation 是 prompt flow 的核心价值,先前我们已支持用户 evaluate 其构建出来的 prompt flow。现如今,我们的 prompt flow SDK 引入了 Flex flow 这一个新功能,为 prompt flow 增强了对任意 GenAI 应用来做 evaluation 的适应性和可扩展性。它使你能够将您自己的应用代码快速集成到 prompt flow 中,进行全面的 Batch test 和 evaluation。
随着 Flex Flow 和 Trace 功能的引入,你现在将你的应用 Flex Flow,基于这个万能的 flex flow 在本地执行 evaluation run,在结果中观测每一行的trace。我们支持三种运行与观测模式:
1. 本地 run,结果存储本地,本地查看结果
2. 本地 run,结果存储本地+云端,云端查看结果
3. 云端 run,结果存储云端,云端查看结果
基于模式2,用户可以将本地执行的结果直接发送到云端 AI Studio 进行持久化存储,以保证你的测试数据的云端共享和长期存储。此外,基于模式3,用户还可以选择在云计算中运行 evaluation,这将在云端记录运行及其结果,便于用户使用云端资源,包括算力和数据。
启用 Trace 功能后,调试 evaluation 实验结果中的error case 变得更为容易,用户可以深入其 trace 视图进行详细观测和检查。
▲ Evaluation run result
Trace 你原生的 prompt flow
新的 Trace 能力将默认应用到所有 prompt flow 的 flow 开发过程,从 authoring,到 batch run 和 evaluation,再到 deploy,为 flow 的开发者提供了更优的可观测性和可调试性。此外,flow authoring 阶段所有历史测试记录都会持久存储在一个列表中,有助于你日后追踪,调试和数据复用。
#02
集成 Trace 和 Monitor 的简化部署
GenAI 应用在经历严格测试后,待其质量和性能得到保证后,用户可以顺利地将其部署到 Azure AI Studio 国际版中作为一个在线 endpoint。Azure AI Studio 国际版为用户提供了一个安全可扩展的环境来运行 GenAI 应用,并提供了各种功能来增强您的部署体验,包括与 Azure Application Insight 集成,进行全面的部署后监控。
从Trace 监控中获得深入见解
在部署后的阶段,我们支持将你得应用请求数据,日志信息汇聚在 application insight 中进行监控,这里同样可以包括 trace 数据。开发者通常在后台日志中,希望深入了解应用在线上的性能情况,以进一步优化,而此时,每个请求的 trace 数据、聚合metrics 和用户反馈数据变得至关重要。
收集用户反馈
Prompt flow SDK 提供了一个新的 /feedback API,帮助客户从在线服务阶段收集反馈。启用 Application Insight 后,反馈数据将保存到客户配置的追踪导出目标中。
#03
全面加速的云端开发
除了 Trace,我们同样对云端开发做了加速优化。我们在 Azure AI Studio 国际版发布了 prompt flow 的一些其他功能,以加速 GenAI 应用的开发:
秒级别的 compute session 启动
新的compute session允许您在几秒钟内设置云计算资源,快速进行flow的创作和测试。
评估的可扩展性增强
为提高批量运行的可扩展性,我们实施了两项改进。首先,我们取消了1000条数据记录的限制,允许 batch runs 在10小时内处理更大的数据集。其次,我们引入了从上次运行中断的地方恢复的能力(resume),可以使用 "pf run create –resume-from" 命令完成。
使用FastAPI服务引擎
为了在线服务的加速,prompt flow 目前也支持了 fastapi,这是一个现代且快速的 Web 框架,以高性能和可靠性提供您的 GenAI 应用。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-07-03
开发者转向 AI 应用工程,真正要迁移的是工程判断力
2026-07-02
不改一行代码,看透 AI Agent 的每一次调用
2026-07-02
AI 不缺智商缺纪律:一场 Harness 工程化实践
2026-07-02
天工 3.2 重磅升级:Skywork Tags 上线,给 Agent 一张工牌,邀其加入你的工作群聊
2026-07-02
Context Infra 会是 AI 领域的下一个热点
2026-07-01
一文了解|SkillScan 智能体技能安全扫描最佳实践
2026-07-01
协作的逆向演进:从 Agent 逻辑重构团队管理
2026-07-01
港科大郭毅可谈Agentic AI时代的核心命题:人机共生,人不可能退场
2026-04-15
2026-04-07
2026-04-07
2026-04-24
2026-04-17
2026-04-05
2026-04-05
2026-04-14
2026-04-24
2026-04-22
欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。
在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。
一、 定义
本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。
会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。
知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。
二、 账号注册与登录
登录方式:本网站支持以下登录方式,您可根据实际情况选择:
微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。
手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。
账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。
实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。
未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。
三、 服务内容与规范
知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。
服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。
禁止行为:您在使用服务时不得实施以下行为:
利用技术手段批量爬取、下载、转存知识库内容;
将知识库内容用于商业目的或未经授权地向第三方传播;
干扰本网站正常运行或侵犯其他用户合法权益;
发布违法违规信息或从事违反公序良俗的活动。
四、 知识产权声明
权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。
有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。
侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。
五、 个人信息保护
我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。
您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。
您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。
六、 免责声明
内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。
不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。
第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。
七、 违约责任
如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。
如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。
八、 法律适用与争议解决
本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。
因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。
九、 其他
本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。
本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。
我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。