免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

Agent 烧钱如流水?Agentic OS (ANOLISA) 帮你逐笔看清 Token 账单

发布日期:2026-05-11 20:26:40 浏览次数: 1586
作者:阿里云开发者

微信搜一搜,关注“阿里云开发者”

推荐语

想知道Agent的Token都花在哪了吗?ANOLISA的AgentSight帮你逐笔拆账,让成本优化有据可依。

核心内容:
1. Agent运维的痛点:Token消耗不透明,成本失控难追溯
2. AgentSight核心功能:实时监控Agent状态与逐笔Token追踪
3. 可视化成本分析:从全局概览到单次查询,实现精准优化

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

自3月30日Agent 的操作系统——Agentic OS" data-itemshowtype="0" linktype="text" data-linktype="2">阿里云发布首个面向 Agent 的操作系统——Agentic OS 以来,我们收到了许多用户的热烈反馈。其中,被提及频率最高的莫过于“我怎么才能去极致降低 Token 消耗?”这个问题的背后其实是多个小问题:Token 账单数字那么大,这些 Token 是哪个 Agent 花的?花在哪一步了?有没有浪费的?

浪费的无效 Token 是要节省的。而省无效 Token 的前提,是先看见 Token 花在了哪里在过去,Token 消耗就是一个黑箱——你只知道月底的总数,不知道每一笔的去向。就像收到一张只写了合计金额的信用卡账单,你想省钱,但连哪笔该砍都不知道。

近期,Agentic OS(ANOLISA)上线了多重功能,其中 AgentSight 组件提供了能看清 Agent 全局状态和每笔 Token 去向的可视化面板。

AgentSight 是 Agentic OS(ANOLISA)的可观测组件旨在解决 Agent 运行中 Token 消耗远超预期、用户缺乏感知与追溯手段的问题。它在零侵入业务逻辑的前提下,实现对 Agent 运行全链路的细粒度数据采集与关联分析。


一屏掌控:Agent 的健康和花销,不用再猜

你让 Agent 7×24 小时跑着,处理工单、执行巡检、回应请求。但你不可能 7×24 小时盯着它。这是 Agent 运维最基本的矛盾。

过去,你可能遇到过这些场景:Agent 在后台悄悄卡死了,你直到下一次打开终端才发现;关键任务中断了,没有任何人提醒你;Token 悄悄跑了几十万,月底账单才让你意识到成本失控。看不见,就无法管理。

AgentSight 组件的可视化面板把这些“看不见”变成了“一屏尽览”。打开面板,你能看到在 Agentic OS(ANOLISA) 上 Agent 的健康状态、活跃会话和异常中断——哪些在线、哪些离线、哪些正处于卡死状态。数据实时刷新,从全局概览到单个对话,信息层级清晰。

(图/AgentSight组件可视化面板)

当 Agent 离线或卡死时,AgentSight 不只是告诉你“出问题了”。它会自动发出告警,并支持触发重启,让 Agent 快速恢复运行——从发现到恢复,大幅减少人工介入。

Agent 的每一次心跳,你都看得见。出了问题,不用等第二天早上才知道。


Token 逐笔拆账:花了多少、花在哪、为什么花

你可能听过一句话:“不能度量的东西就无法优化。”Token 消耗也是如此。

一个小案例——查看天气

我们看一个让人大跌眼镜的小任务——查天气。

用户询问:“杭州的今日天气”。这是一个极其简单的单轮查询,预期的 Token 消耗应该非常低——用户输入不超过 20 个 Token,系统提示词在数百 Token 级别,一次工具调用加上响应也不过数千 Token。

但实际消耗是多少?花了 14 万 Token。但你无法分辨哪些是无效Token,以此来避免不必要的浪费。

通过AgentSight的可视化面板可以观察到 Token 消耗数数据,如下图所示。根据选用的模型不同花费的Token可能存在差异,但一般是输入Token远大于输出Token数下文中我们会继续分析,从而得知,绝大部分算力都浪费在了重复读取旧的历史记录上

(图/AgentSight的可视化面板观察到的Token消耗数据)

为什么会有如此巨大的消耗?

我们通过AgentSight可视化界面可测到事件详情。从下图中可以看到,当用户询问“杭州今日天气”后,Agent 共产生了两次大模型调用,每个大模型调用的 Token 用量与耗时都清晰可查。每增加一次工具调用,历史消息就多“回放”一次,token 成本呈线性甚至超线性增长。下图中,两次工具调用分别查看了天气的skill并根据skill查询具体的天气,输入Token数越来越多,历史消息不断回放。

(图/调用过程)

(图/Agent输出结果)

AgentSight 组件将 Token 消耗按会话级和对话级两个维度进行拆解分析。通过这种粒度,用户可以清晰定位问题:是某个 Agent 整体消耗过高、单次对话 Token 使用异常,还是详情中某个 Skill 在反复调用中产生浪费。

会话级每个 Agent 在每次会话中消耗了多少 Token,一张图看全局分布。你可以一眼找到那个“最烧钱”的 Agent,或者发现某次异常会话的 Token 消耗远超均值。

对话级深入到单条对话链路中,追踪 Token 的变化趋势——是 System Prompt 占了大头,还是 History 窗口膨胀,还是某个 Skill 调用的输入特别冗长?每一笔都有去向。

(图/会话级与对话级示例图)

还能按时间段、按 Agent 维度做趋势对比。上周花了多少,这周花了多少,哪天出现了异常波动——模式清清楚楚。

(图/通过时间、Agent、模型等多维度查询示例图)

看清了“花了多少”和“花在哪”之后,下一个问题自然是“为什么花在这里”。AgentSight 组件后续也将提供轨迹分析能力——从任务接收、工具调用、决策分支到最终输出,全链路回放。你可以看到 Agent 在什么节点调用了什么 Skill、走了哪条分支、在哪个环节吃掉了最多的上下文窗口。定位到冗余路径后,有针对性地优化 Agent 的行为设计,省下来的无效 Token 就是实打实的钱。

Token 从一个月底的“总额”,变成了一本随时可查、可追溯、可优化的“明细账本”。

文末将提供使用AgentSight组件查看Token消耗的详细教程。


Agentic OS(ANOLISA) 新功能速览

4月15日Agentic OS(ANOLISA)发布v0.2版本。核心组件功能更新如下:

  • 小规格实例(2C2G)初始可用内存提升20%~30%,OpenClaw 并发会话数量提升 200+%、Agent 冷启动时间显著降低;

  • Copilot Shell 认证界面全面升级,内置多种模型提供商快捷配置,Aliyun 认证支持 RAM 角色一键授权;

  • AgentSight 新增可视化面板,提供 Agent 实时健康监控、离线告警、卡死进程重启能力,支持会话、对话级的 Token 消耗分析、Agent轨迹分析;

  • AgentSecCore 支持 Skill 完整性自动化校验(签名校验);

  • OS Skills 内置技能“sysom-diagnosis”支持完整系统诊断能力;

  • 新增 Tokenless 优化工具包,通过模式压缩、响应压缩及命令重写三大核心策略,降低上下文窗口的 Token 消耗并提升运行效率。


教程:使用AgentSight组件,查看你的第一笔 Token 明细账


方式一、在阿里云上安装Agentic OS (ANOLISA)

并使用AgentSight组件

第一步:创建ECS实例

前往实例创建页[1],注意:

  • 为保证使用体验,建议实例内存大于 2 GiB

  • 系统镜像选择 Alibaba Cloud Linux ,在下拉菜单中选择:Alibaba Cloud Linux 4 LTS 64位 Agentic 版

  • 需勾选绑定公网 IP (EIP 或公网带宽)

其他参数可使用默认配置。

第二步:首次配置

登录实例后,系统自动进入 Copilot Shell(cosh),首次使用需配置模型授权。推荐使用 Aliyun Authentication 以获得快速、免配置的使用体验。不同授权方式的区别与使用,请参见:管理配置[2]

第三步:通过对话交互、CLI命令或者可视化看板查看Token消耗
查看方式一、通过对话交互的方式

上述步骤配置完成后,即可在 cosh 中用自然语言与系统交互。Agentic OS 内置丰富的操作系统级Skills,涵盖系统运维、安全加固、故障诊断等场景。接下来,我们可以直接使用以上自然语言指令,系统会自动调用 AgentSight 完成查询并返回分析结论。比如:

  • 查看 Token 消耗:输入“今天 Token 用了多少?”

  • 查询审计日志:输入"帮我查一下今天的 LLM 调用记录"

查看方式二、使用CLI命令
  • agentsight token — 查询 Token 用量

    查询 Token 用量数据。

# 查看今日用量agentsight token
  • agentsight audit — 查询审计事件

查询审计事件(LLM 调用、进程操作)。

# 查看最近事件agentsight audit# 按 PID 和类型过滤agentsight audit --pid 12345 --type llm# 汇总统计agentsight audit --summary
  • agentsight discover — 扫描 Agent

发现系统上运行的 AI Agent。

# 扫描 Agentagentsight discover# 列出已知类型agentsight discover --list-known
查看方式三、使用可视化面板

启动可视化面板的服务已在系统默认运行,如下所示,该命令启动了 HTTP API 服务器,提供嵌入式 Dashboard UI。

agentsight serve --host 0.0.0.0 --port 7396 #需要root权限执行

该命令将绑定所有网络接口,可通过服务器公网 IP 访问:http://<服务器公网IP>:7396

请确保服务器防火墙 / 安全组已放行 7396 端口。

可视化面板Dashboard 是一款 Web 可视化界面,用于查看对话历史、Trace 详情和 Token 统计数据。查看详情如下:

  • Token 消耗总览:查看当前机器在所选时间段内的 token 消耗情况(可参照前文的图/AgentSight组件可视化面板)

  • Agent 状态:右侧状态栏可以查看当前 Agent 进程状态,并提供 Agent 进程 hang 住重启功能

  • 会话中断诊断:针对长时间会话无输出或对话无响应的问题,自动识别 LLM 错误与 Agent 进程崩溃,输出详细原因分析,辅助快速定位与解决

  • Session 详情:点击"详情"查看每个 session 和 trace的 token 使用详细情况

  • 模型分析:查看用户输入后的模型提示词与思考过程,定位 Token 主要消耗环节

  • Token节省:查看当前已经节省的Token数量,支持点击SESSION ID查看每个优化项,点击详情可查看优化前后的内容对比。通过对MCP响应的内容进行压缩,但仍保持原有语义,使得token消耗下降。

方式二、本地部署ANOLISA并查看Token消耗

ANOLISA 已经在 GitHub 上开源,可以从源码构建 ANOLISA 各组件并运行。

第一步、安装依赖
安装Node.js(用于 Copilot Shell)

要求:Node.js >= 20、npm >= 10。

Alinux 4(已验证):一行命令搞定,系统仓库提供的 Node.js 版本满足要求。

sudo dnf install -y nodejs npm make gcc-c++

其他发行版(通过 nvm):如果系统仓库的 Node.js 版本不满足 >= 20,推荐使用 nvm 管理 Node.js 版本。

# 如果 Node.js >= 20 已安装则跳过if command -v node &>/dev/null && node -v | grep -qE '^v(2[0-9]|[3-9][0-9])'; then  echo "Node.js $(node -v) 已安装,跳过"else# 从 Gitee 镜像安装 nvm  curl -fsSL --connect-timeout 15 --max-time 60 https://gitee.com/mirrors/nvm/raw/v0.40.3/install.sh | bash  source "$HOME/.$(basename "$SHELL")rc"# 配置 npmmirror 加速 Node.js 下载  export NVM_NODEJS_ORG_MIRROR=https://npmmirror.com/mirrors/node/  nvm install 20  nvm use 20fi# 验证node -v   # 期望:v20.x.x 或更高npm -v    # 期望:10.x.x 或更高
安装Rust( AgentSight使用需要)

要求: 需要 Rust >= 1.91.0

Alinux 4(已验证):系统 rust 包版本低于 1.91.0,无法直接使用,仅需通过 dnf 安装构建工具,Rust 本身需用 rustup 安装(见下方)。

sudo dnf install -y gcc make

Ubuntu 24.04(已验证):Ubuntu 24.04 仓库提供了 rustc-1.91,可直接使用。

sudo apt install -y rustc-1.91 cargo-1.91 gcc makesudo update-alternatives --install /usr/bin/cargo cargo /usr/bin/cargo-1.91 100
安装AgentSight 系统依赖
dnf(Alinux / Anolis OS / Fedora / RHEL / CentOS 等):sudo dnf install -y clang llvm libbpf-devel \  elfutils-libelf-devel zlib-devel openssl-devel \  perl perl-IPC-Cmdsudo dnf install -y kernel-devel-$(uname -r)

apt(Debian / Ubuntu):

sudo apt-get update -ysudo apt-get install -y clang llvm libbpf-dev \  libelf-dev zlib1g-dev libssl-dev perl \  linux-headers-$(uname -r)

部分发行版没有单独的 perl-core 包,这是正常的。

内核要求:AgentSight 要求 Linux 内核 >= 5.10 且启用 BTF(CONFIG_DEBUG_INFO_BTF=y )。可以通过检查 /sys/kernel/btf/vmlinux   文件是否存在来确认。

检查版本

所有依赖安装完成后,运行以下命令确认版本:

node -v            # v20.x.xnpm -v             # 10.x.xrustc --version    # rustc 1.91.0+cargo --version    # cargo 1.91.0+python3 --version  # Python 3.12.xuv --version       # uv 0.x.xclang --version    # clang version 14+(仅 AgentSight 需要)
第二步、构建Copilot Shell(cosh)组件

Copilot Shell 是一个 Node.js / TypeScript 项目,使用 npm workspaces 的 monorepo 布局。

cd src/copilot-shellmake depsmake build

构建产物是 dist/cli.js,你可以直接运行,或者添加持久的 co / cosh 别名到你的 shell:

# 直接运行node dist/cli.js# 或安装到系统 PATH(创建 cosh/co/copilot 命令)sudo make installcosh
第三步、构建AgentSight组件
cd src/agentsightmake build

构建产物是 target/release/agentsight

安装到系统路径:

sudo make install

安装后可以用 sudo agentsight trace 启动 AI Agent 活动追踪,用 agentsight token 查询 Token 用量,用 agentsight audit 查询审计事件。

第四步、通过对话交互、CLI命令或者可视化看板查看Token消耗

该步骤与上文“方式一、在阿里云上安装Agentic OS (ANOLISA)并使用AgentSight组件”中的查看方式一致。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询