我要投稿

GPT-5.1 「马甲」泄露！现在免费就能用，年底 AI 一大波更新要来了

发布日期：2025-11-10 17:53:43 浏览次数： 2762

作者：APPSO

微信搜一搜，关注“APPSO”

Gemini 3 还没影子，GPT 5.1 已经在路上。7 号深夜，OpenRouter 平台上线了一个全新的隐名模型。已经有眼尖动作快的网友尝鲜体验，并且认为这就是披着马甲的 GPT 5.1，暂名：Polaris Alpha。

目前提供 API 调用（包括 OpenRouter），知识库截止时间为 2024 年 10 月，不支持推理模式。最大 context 容量 256K，单次最大输出 128K。

一键直达👉🏻：https://openrouter.ai/chat

开发商信息保密，但是在网友的不懈努力下，成功「越狱」，让 Polaris Alpha 自曝了家门。

图片来自 X 用户 @LarryAtherton1

这倒也算不上实锤，可能只是训练数据的问题——很多模型都会输出来自专有供应商的数据。除非系统提示中明确说明，或者通过指令调优反复灌输，否则这些模型实际上并不「知道」自己是什么。

无论如何，目前暂时没有官宣，暂且就还是叫它 Polaris 吧。APPSO 也第一时间简单试用了一下。由于是通过 API，部分功能比如处理语音素材暂时受限，除此之外，Polaris 的表现，让人相当期待 GPT 5.1。

案头工作：流畅，一如既往

首先是一些比较基础的简单任务：根据要求写邮件。这是一封道歉邮件，跟嘉宾通报活动改期。我特地强调了口吻要既饱含歉意，又表示亲近，让 Polaris 感受一下。

算是中规中矩吧，信息齐全，行文逻辑清楚，语气不会有强烈的「人机感」。比较神奇的是，在打开 Search 模式的前提下，Polaris 会去检索一些道歉信的写法，而它的引用信息里，居然有淘宝百科…… 看上去 Polaris 覆盖的信息源越来越多，也越来越冷门了。

然后是需要创意想法的文案写作任务，prompt 我都给得很模糊，只要求有网感，适合在小红书上传播。

Polaris 给出了三种不同的风格，给出的文案非常完整。后面还给出了活动具体执行的方案。从这里已经可以看出来，措辞上颇有 GPT 系才会有的文字风格，也有网友专门做了相似性统计——马甲快要披不住了。

文字风格仍然是每一个大语言模型的立身之本，毕竟现在最主流的应用场景就是案头工作。2026 年都快要来了，还给出「人机味」的文字，是不能被原谅的。目前 Polaris 的文风，有相当典型的「GPT」风味，很多网友都有同样的感受。

同时，对于 chatbot、聊天、陪伴等应用场景里，文风能否快速适应用户节奏，并且灵活「习得」个性化的口吻，也将是 GPT5.1 面临的挑战——全球用户要求 4o 回来的盛况，OpenAI 应该不想再经历一次了吧。

由于不能直接处理音频文件，我上传了转录后的播客文字稿，让 Polaris 整理提炼信息点，适当调整口语化的地方，重点是：根据不同的主题维度，拉出一个层次明确的提纲，同时保留时间戳。

输入目前看来可以超过 1w 字（单条发送），受限于 OpenRouter 每个窗口只能保存八条记忆的限制，超长输入会一定程度的影响输出稳定性。不过自我纠正能力不错，第一次跑的时候生造了并不存在的时间戳，重抽一次之后自行纠正了。

自从 GPT 5 之后，ChatGPT 的单个窗口容量明显增大，从社交媒体上的反馈来看，最高的 token 总数可以去到 60 万-80 万才达到上限。这对于个性化用户信息而言是个非常好的信号，但不可避免的是，超长上下文额之后，会出现记忆调度的失序，以及输出稳定性的下降。

这留给了 GPT 5.1 全新的挑战，如何在进一步扩大窗口容量之后，依然保持灵活准确的记忆调度。对于用户而言，几乎是第一秒就能感受到的决定性体验。

编程：超简单，超顺滑

OpenRouter 提供几种基础的编程工作实现和预览。我快速用它测了一下 Polaris 写小游戏的本事。

最直观的感觉是时间稍微有点久，差不多要个五分钟了。不过倒是不需要我提供复杂的 prompt，「设计一个贪吃蛇游戏代码」，就足够生成一个可以上手的小游戏。

甚至还提供不同的模式、设置，在 preview 里的试玩都很顺畅。另外又让它跑了一个打地鼠游戏，也是顺利完成。

网页设计也很 OK，我把上面生成出来的咖啡馆文案，丢回给 Polaris，让它设计一个活动的落地页。

Polaris 研究了整个文案，并且加入了一些补充，最后出来的视觉效果也不错，我挺喜欢它给按钮设计的发光效果，这似乎是它的一个「独家特色」，在其他网友的测试中也出现了：

图片来自 X 用户

从网上的其它测试是来看，它的美学表现值得期待。

图片来自 X 用户 @HarshithLucky3

这些基础工作都没有太大的问题，但老实说，现在 AI 编程的赛道堪称白热化，而 GPT 系产品在编程上，竞争力一直不算很强。GPT 5.1 实装后，在编程上的表现能不能有大突破，只有继续等待才能知道。

前阵子 Sam Altman 明确发话表示，年底时 ChatGPT 将推行 NSFW 模式（成人模式），在目前的 Polaris 上，似乎已经看得到苗头了。

如果是这样，那 Polaris 是 GPT 5.1 的证据又多一条，尤其是考虑到最近 OpenAI 已经在小范围内做年龄验证，这并非全量行动，而是针对不确定实际年龄的用户做定向推送。

成人模式的争议很大，实际执行也并不如想象中简单，除了验证，还有隐私信息识别、储存等一系列麻烦。到底能不能有一个平衡多方诉求的解决方案，还得看真正的 GPT 5.1 如何应对。

眼瞧着年底又是一场血战，Gemini 3 早就放出风声（虽然一直跳票），Nano Banana 2 也突然冒头。更别提前阵子 Kimi K2 Thinking 的发布，收获了海内外一大波关注，训练成本仅为 460 万美元。

OpenAI 仍然有着惊人的支出，虽然也有着惊人的活跃用户群，但盈利还看不到苗头。在一系列又强又便宜的中国模型的狙击下，GPT 5.1 能达到期望吗？

快知道了，网传 11 月中就将发布，到时或许会有答案。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-22

当 AI 开始承担任务：从工具、产品到组织的 AI-native 方法论

2026-06-21

从提示 Agent 到循环工程

2026-06-21

微信小微，几个要点

2026-06-21

AI 也会做梦？拆解 OpenClaw 独特的梦境记忆系统

2026-06-21

[译] 我所知的全部智能体工程技巧

2026-06-20

13人团队叫板Anthropic：我们造了一个更快更便宜的大模型

2026-06-20

微信左上角长出“两只眼睛”：小微测试版，可能是微信 AI 化最关键的一步

2026-06-20

Agent Skill 管理范式探索：像管理软件包一样管理 Agent 能力

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

OpenAI Codex CLI 完整使用指南

2026-04-07

Claude Code 和 Codex 接入 Figma MCP 保姆级教程

2026-04-07

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

GPT5.5来了，最大特点解析

2026-04-24

Claude Opus 4.7 发布，全网最详细解读

2026-04-17

突发！Claude Code 源码泄露，扒出这些隐藏功能

2026-03-31

GPT-6，曝光了

2026-04-05

GLM-5.1 实测：面向 Agent 长程任务的国内第一模型

2026-04-02

重磅！GPT-6曝光了

2026-04-05

大家都在问

企业智能体的下半场，如何让智能体越用越聪明？

2026-06-18

Agent 记忆，我们全都理解错了？

2026-06-18

如何利用 Harness “一句话交付产品功能”？

2026-06-10

Loop Engineering 循环工程又是什么鬼？

2026-06-10

Agent 工程化五件套：Prompt、Skill、MCP、CLI 到底怎么配合？

2026-06-07

为什么云端 Agent 基建这么难？

2026-06-06

当 AI 开始拥有“自主调度权”：Claude 4.8 这个新功能，到底有多可怕？

2026-06-03

哪些活，该交给Claude Code的 /workflows?

2026-06-02

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw