我要投稿

100万上下文全面上线！Claude两款4.6模型取消长文本溢价，支持直塞600张图

发布日期：2026-03-14 10:19:15 浏览次数： 2246

作者：AI寒武纪

微信搜一搜，关注“AI寒武纪”

↑阅读之前记得关注+星标⭐️，😄，每天才能第一时间接收到更新

Claude Opus 4.6和Sonnet 4.6的100万上下文终于全面开放。

最核心的变化是，长文本不再加收任何溢价费用。在这两款模型的完整百万窗口内，统统适用标准计费规则。Opus 4.6的百万Token输入输出价格分别为5美元和25美元，Sonnet 4.6则为3美元和15美元。这里不存在任何倍率套路，发起一次90万Token的请求与9千Token的请求，单价完全一致。

随着此次正式版上线，具体迎来了以下核心升级：

首先是计费与速率的全量打通。除了统一的标准定价外，所有上下文长度均享受完整的速率限制，用户的标准账户吞吐量在整个百万窗口内完全适用。

多模态处理能力直接飙升六倍。单次请求支持的图像或PDF页面数量上限从100骤增至600。该功能已在Claude原生平台、微软Azure Foundry以及谷歌云Vertex AI同步可用。

API调用变得更加无缝。超过20万Token的长请求现在会自动处理，不再需要添加Beta测试版请求头。如果开发者原本的代码里包含该测试版请求头，系统也会直接忽略，完全不需要修改现有代码。

针对Claude Code的用户，100万上下文现在已直接内置于Max、Team和Enterprise版本的Opus 4.6中。过去这部分百万级上下文需要消耗额外的使用量，现在Opus 4.6会话会自动调用完整窗口。这大幅减少了上下文的强制压缩次数，让更多的对话记录得以完整保留。

当然，百万级吞吐量的前提是模型能够准确召回细节并进行有效推理。在MRCR v2评测中，Opus 4.6拿下了78.3%的分数，在所有具备同等上下文长度的前沿大模型中位列第一。

这种长文本处理能力带来了最直接的应用改变：开发者现在可以直接把整个代码库、长达几千页的合同文件，或者包含工具调用、观察结果和中间推理步骤的长周期智能体完整运行轨迹，原封不动地交给模型处理。过去处理长文本必须依赖的工程化改造、有损摘要提取以及上下文清理工作，现在统统成为历史，整个交互过程得以原汁原味地保留。

目前，这项100万上下文能力已经可以通过Claude原生平台，以及亚马逊Bedrock、谷歌云Vertex AI和微软Foundry直接使用。Claude Code的高级订阅用户只要切换至Opus 4.6模型，即可默认开启百万上下文体验。

--end--

最后记得⭐️我，每天都在更新：如果觉得文章还不错的话可以点赞转发推荐评论

/...@作者：你说的完全正确（YAR师）

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-05-04

打造Claude Code的宝藏经验！提示缓存就是一切

2026-05-04

Apple Silicon 上本地跑 LLM，速度直接甩 Ollama 几条街

2026-05-03

奥特曼：Codex 正在经历 ChatGPT 时刻。这是要起飞了

2026-05-01

永别了，终端！OpenAI疯狂升级Codex，接管Mac人类全程0操作围观

2026-04-30

Karpathy 最新访谈：Vibe Coding 只是开始，真正重要的是 Agentic Engineering

2026-04-30

近4万Star！一个终端把自己变成了AI开发环境，Cursor和Claude Code都沉默了

2026-04-29

Claude Code 的 Memory 系统：让 AI 记住你的偏好

2026-04-29

深入浅出Harness Engineerring之核心模式与理念

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

2026年国内如何注册 Claude 账号教程

2026-03-13

豆包 2.0 模型发布，全信息整理（全网最完整，另附 79 页 Model Card）

2026-02-14

谷歌重大更新：国内手动开启 Gemini AI 侧边栏与 Auto Browse 自动浏览全攻略

2026-02-03

OpenAI 发布新的 Codex 桌面版，我现在不骂 Codex 难用了

2026-02-03

独家| DeepSeek-V4终于要来了：梁文锋憋半年大招，多模态+长期记忆全面破局

2026-03-17

全网最详细的Codex入门教程，手把手教你玩转Vibe Coding。

2026-02-09

香港终于能直接用 Gemini 了，内地用户能用上吗？

2026-03-17

OpenAI Codex CLI 完整使用指南

2026-04-07

大家都在问

「双线实测」Qwen 3.6-Plus，Agentic Coding 已经这么能「扛活儿」了？

2026-04-26

本体化语义层，会是 AI 数据平台的新地基吗？

2026-04-22

设计行业的“棺材板”，要被Claude Design盖上了？

2026-04-18

当所有人都不写代码了，谁来看懂代码？

2026-04-13

什么场景该用 AI Native？

2026-04-12

12MB的Go二进制，让AI操控浏览器只花800 tokens，PinchTab凭什么这么省？

2026-04-07

华为AI 49元/月！贵？不贵？

2026-04-01

为什么这波 AI 产品都开始抢着做 CLI ？

2026-03-31

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部