微信扫码
添加专属顾问
我要投稿
Claude Sonnet 4.5强势来袭,编程能力直逼GPT-5,这场AI大战你站哪边? 核心内容: 1. Claude Sonnet 4.5在编程基准测试中的突破性表现 2. 新增VS Code扩展和Chrome插件等实用功能 3. 两大新API功能助力构建更强大的AI Agent
回到Sonnet 4.5本身,可以看到4.5在Terminal Bench进入50%分位,在Agentic tool use的bench上更是有一个质的飞跃,从71来到了98,不会是蒸馏的gpt-5吧?因为他俩数值好接近。再一个就是Computer Use上也是质的飞跃,从44迈入61.4,好想看看gpt-5在该榜单表现…
Claude Code赢来升级,还带来VS Code扩展,可以通过检查点功能进行回退。所以说我看不懂Github推出Copilot CLI命令行的copilot是不是反向操作?
此外,Claude还可以使用代码分析数据创建文件以及可视化,他们的Chrome扩展插件也正式发布并公开给所有人使用,他们演示了使用Claude让浏览器自动发邮件和编辑Google Docs。
最后一个是临时研究预览版Imagine With Claude,只有Max可用。
价格保持一致,未有更新。到底还是敌对,DeepSeek R1发布的时候,那个CEO就是各种讽刺抵制,现在狙击的行为好明显。不过DeepSeek只是发了个实验版本,瞧把你吓得。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-04
AgentScope 正式发布 Skills 支持 - 实现渐进式披露
2026-02-04
从“回答者”进化为“研究员”:全面解析 Deep Research
2026-02-04
刚刚,Xcode 史诗级更新:原生集成 Claude Agent SDK,苹果开发直接起飞!
2026-02-04
国产 Cowork 它来了!MCP、Skills和Expert Agents都支持,全部免费体验!
2026-02-04
混元研究博客上线姚顺雨团队最新成果:从 Context 探索语言模型的范式转变
2026-02-04
通俗讲解大模型短期记忆 vs 长期记忆
2026-02-04
谁动了我的电脑?谁应该抱怨?
2026-02-03
从 CLI 到桌面:Codex 把 coding agent 变成“任务指挥台”
2026-01-24
2026-01-10
2025-11-19
2025-11-13
2026-01-26
2026-01-01
2025-12-09
2025-11-12
2026-01-09
2025-12-21
2026-02-04
2026-02-03
2026-02-03
2026-02-02
2026-02-02
2026-02-02
2026-01-31
2026-01-30