AI Agent带来哪些安全风险？如何应对？

发布日期：2024-09-27 07:32:50 浏览次数： 4434

作者：沙丘社区

微信搜一搜，关注“沙丘社区”

根据沙丘智库发布的《2024中国AI Agent市场指南》，AI Agent是一种具有自主性或半自主性的智能实体，能够利用人工智能技术在数字或物理环境中感知、决策、采取行动并实现目标，这种能力使得AI Agent有可能彻底改变各行各业和各种环境。

大模型缺少在最少的人类监督下自主行动的能力，以及在复杂环境中适应和执行目标的能力，基于大模型的AI Agent利用大模型理解、思考输出的“专家能力”，并附加规划、记忆、执行、工具调用能力，可以替代大量人工执行，消除大模型和真实世界沟通的障碍，解决大模型落地的“最后一公里”。

AI Agent带来的新风险

AI Agent具有巨大的应用潜力，但同时也带来了新的安全风险。传统AI模型和应用的安全风险通常限于模型输入、模型处理和模型输出、编排层的软件漏洞以及托管它们的环境。除了这些威胁外，AI Agent还引入了新的人工智能风险。

在使用AI Agent时，安全风险范围扩大到了AI Agent触发和参与的一系列事件和交互中，这些通常对人类或系统操作员来说是不可见的，也无法进行阻止。

AI Agent在执行任务时可能引入的一系列安全问题，包括数据安全、资源管理、恶意活动、编码错误、供应链安全以及恶意代码的传播等，这些问题需要通过适当的安全措施进行解决。AI Agent带来的安全风险包括：

· 数据暴露或外泄：AI Agent在执行任务的过程中可能会在任何环节暴露或外泄敏感数据；

· 过度消耗系统资源：AI Agent在执行和交互的过程中可能会无节制地消耗大量系统资源，无论是有意还是无意，这可能导致系统资源过载；

· 未授权或恶意活动：AI Agent可能会有意或无意地执行未授权或恶意的活动，例如恶意程序或人类的Agent“劫持”行为；

· 编码逻辑错误：AI Agent可能会由于编码逻辑错误导致数据泄露或其他威胁，这些错误可能是未经授权的、意外的或恶意的；

· 供应链风险：使用从第三方网站下载的库或代码用于AI Agent可能会带来供应链风险，这些代码可能被植入了恶意软件，旨在执行恶意任务；

· 恶意代码的传播和复制：使用自动化的Agent流程可能会传播和复制恶意代码，以及通过检索增强生成（RAG）对Agent进行“投毒”触发恶意行为。

AI Agent安全风险的应对措施

为了应对上述AI Agent安全风险，企业应采取如下措施：

第一，监控所有AI Agent的行动和信息流；

第二，检测和标记异常的AI Agent行动；

第三，尽可能地使用自动化手段实时修复问题。

这些措施的访问权限应授予给IT、安全或任何其他需要管理AI Agent风险的管理员用户。

（1）监控所有AI Agent的行动和信息流

为了检测异常和违规行为，需要给AI Agent的行动、流程、连接、数据暴露、信息流、输出和响应提供一个全面的仪表盘视图。同时，还需要支持对Aengt的所有交互和活动进行不可更改的审计跟踪。

仪表盘视图应支持对以下内容的可见性：

· 输出的使用情况：AI Agent的输出是如何随时间被组织使用的；

· AI Agent的使用场景：AI Agent被用于哪些具体的用例；

· AIAgent的交互意图：例如Agent的目标、行为和通信方式；

· 是否遵循企业政策：AI Agent的表现是否符合企业可接受的使用政策；

· 是否遵循安全、隐私和法律要求：AI Agent的表现是否符合相关的安全、隐私和法律要求；

· 将AI Agent的行动与企业身份和访问管理（IAM）系统集成，确保可以确定访问权限，并实施最小权限访问控制。

（2）检测和标记异常的AI Agent行动

检测并标记那些异常的AI Agent行动以及违反了企业相关政策的行动。企业在建立了仪表盘视图、确定了预期的行动基线后，就可以开始检测异常的交易和行动。

考虑到AI Agent交互的速度和数量，人工无法进行所有的监督和修复，因此应尽可能对异常交易进行自动修复；对于无法自动修复的异常情况，应该立刻暂停，并转给人工进行审查和修复。

（3）尽可能地使用自动化手段实时修复问题

修复措施应包括适当的限制和缓解措施：

· 数据脱敏：当企业定义的敏感数据（例如，个人身份信息或机密的非结构化信息）传递给Agent系统时，进行脱敏处理；

· 实施最小权限访问：尽可能实施最小权限访问控制。如果检测到违规行为且无法自动修复，则阻止访问，并将问题转发给人工审查和解决；

· 支持特定Agent威胁指标的拒绝列表：基于企业数据相关的威胁情报制定一个特定Agent威胁指标的拒绝列表，Agent在行动时需要根据列表进行验证；

· 支持文件和文件类型的拒绝和接受列表：定义Agent可以访问和不可以访问的文件和文件类型，包括在RAG中支持Agent工作流的文件；

· 实施监控和反馈循环：通过实施监控和反馈循环，识别由于不准确性导致的不需要的行动。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-07-01

业务架构、应用架构、数据架构、技术架构……架构到底是什么？

2026-07-01

未来产品团队，不再按岗位分工

2026-06-29

dbskill 更新：一键排版发布公众号

2026-06-22

写代码你不在乎AI味儿，写文章为啥那么计较？

2026-06-03

用 WorkBuddy 辅助写投标技术方案：别让 AI 替你投标，让它替你把话说清楚

2026-05-30

企业级 AI Coding 还有一堆问题，并没有像PR一样说的这么好用

2026-05-27

如何使用 AI 设计企业级产品？

2026-05-24

我研究了这个 18.6k Star 的 Skills，做幼师的女朋友夸我真猛！

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

纳米漫剧流水线，我劝你别太离谱

2026-04-14

gpt-image-2发布后，PPT最强skill

2026-04-28

刚刚，Claude Design 发布！网友：将摧毁设计行业……

2026-04-18

体验完阿里首款Design Agent，我开始替UI/前端焦虑了..

2026-05-21

如何使用 AI 设计企业级产品？

2026-05-27

不要再直接把 UI 图转成代码了，先看这份 UI Spec 模板

2026-05-19

Amazon Quick桌面版：读文档、做PPT、查邮件，一句话全搞定

2026-05-06

AI里，你必学的新Office三件套：MD、CSV、HTML

2026-05-21

我研究了这个 18.6k Star 的 Skills，做幼师的女朋友夸我真猛！

2026-05-24

用 WorkBuddy 辅助写投标技术方案：别让 AI 替你投标，让它替你把话说清楚

2026-06-03

大家都在问

业务架构、应用架构、数据架构、技术架构……架构到底是什么？

2026-07-01

写代码你不在乎AI味儿，写文章为啥那么计较？

2026-06-22

如何使用 AI 设计企业级产品？

2026-05-27

Nano Banana 2 实测：8 大落地场景 + 全部 Prompt，AI 绘画 SOTA 到底逆天在哪？

2026-02-28

AI内容工程化：为什么你的团队用了AI，内容还是做不出来?

2026-02-07

OpenAI发布的新科研工具Prism，相比起Overleaf如何？值得入手吗？

2026-01-29

当A++成为新的“紧箍咒”：我们是否忘记了测试的初衷？

2026-01-21

AI对全球白领就业冲击有多大？

2026-01-06

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw