我要投稿

OpenAI GPT-image-2 正式上线 Microsoft Foundry（企业级国际版）

发布日期：2026-04-22 17:57:55 浏览次数： 1929

作者：Azure云科技

微信搜一搜，关注“Azure云科技”

设想一个小型设计团队正在运营一场全球社交媒体推广活动。他们拥有为每个市场制作本地化图像的创意愿景，却没有足够的资源去重新拍摄、重新排版或外包如此大规模的工作。每个素材都需要适配不同的平台、不同的尺寸、不同的文化背景，而且所有素材都需要同时交付。这正是灵活的图像生成大显身手的地方。

OpenAI 的 GPT-image-2 模型现已正式发布，并于今天正式上线 Microsoft Foundry（国际版），为图像生成带来了质的飞跃。这让企业中的开发人员和设计师能够更好地控制图像输出，更灵活且安全地将这些数字资产应用于自身业务当中。

信任与安全

在 Microsoft，我们赋能个人和组织的使命始终如一。作为这一承诺的一部分，通过 Microsoft Foundry（企业级国际版）提供的模型会经过内部审查，并在部署时配备旨在大规模支持负责任使用的安全措施。

对于 GPT-image-2，Microsoft 采用了深度安全方法，在保持人工监督的同时解决违禁内容和滥用问题。该部署将 OpenAI 的图像生成安全缓解措施与 Azure AI 内容安全（企业级国际版）相结合，包括针对敏感内容的过滤器和分类器。

GPT-image-2 有哪些新功能？

GPT-image-2 带来了真实世界智能、多语言理解、更强的指令遵循能力、更高的分辨率支持以及智能路由层，为开发人员提供了在生产工作流中大规模进行图像生成的工具。

真实世界智能

知识截止日期为 2025 年 12 月，这意味着它能够为你提供更具上下文相关性和准确性的输出。该模型还具备增强的思考能力，可以搜索网络、检查自身输出，并仅通过一个提示词生成多张图像。这些增强功能使图像生成模型不再是简单的工具，而是成为创意助手。

多语言理解

增强了对日语、韩语、中文、印地语和孟加拉语的语言支持，并具备新的思考能力。这意味着该模型能够创建图像并呈现具有本地化效果的文本。

更高的分辨率支持

引入了 4K 分辨率支持，使开发人员能够以自定义尺寸生成丰富、细腻且逼真的图像。

需要注意的分辨率准则

注意：如果请求的分辨率超出像素预算，服务将自动将其缩小。

智能路由层

GPT-image-2 还包含一个扩展的路由层，具有两种不同的模式，允许服务智能地为请求选择合适的生成配置，而无需显式设置尺寸值。

模式 1 — 旧版尺寸选择

在模式 1 中，路由层从三个旧版尺寸层级中选择一个用于生成：

此模式适用于已经熟悉旧版尺寸层级的团队，他们希望无需进行任何手动更改即可受益于自动选择。

模式 2 — 词元档位选择

在模式 2 中，路由层从六个档位中进行选择 — 16、24、36、48、64、96 — 它们大致对应于旧版尺寸层级：

这种方法可以在生成的词元数量上提供更大的灵活性，从而有助于针对给定的提示词更好地优化输出质量和效率。

实际效果展示

GPT-image-2 在各种视觉风格中展现了更高的图像保真度，能够生成更加细腻精致的图像。但不要只听我们说，让我们通过几个提示词和编辑来看看模型的实际表现。以下是我们使用的示例：

提示词：空无一人的地铁车厢内部。沿过道方向的广角视图。干净、现代的地铁车厢，配有座椅、扶手杆、线路图条和车窗上方的广告框。逼真的灯光效果，带有轻微的冷色荧光色调，逼真的材质（金属扶手杆、乙烯基座椅、纹理地板）。

图1. 使用 GPT-image-1 生成

图 2. 使用 GPT-image-1.5 生成

图3. 使用 GPT-image-2 生成

如您所见，使用相同的基础提示词时，图像质量和真实感随着每个模型的迭代而提升。现在让我们看看如何对同一张图像进行增量修改：

提示词：在广告框中填充“Zava Flower Delivery”的统一广告活动，并使用多种花卉。

图 4. 使用 GPT-image-2 生成

现在我们的地铁车厢里已经满是新的 ZAVA 鲜花配送服务广告。让我们再做一个小改动：

提示词：在所有 Zava Flower Delivery 广告中，将展示的花卉更改为玫瑰（红色和粉色玫瑰）。

图 5. 使用 GPT-image-2 生成

只需三个简单的提示词，我们就生成了一个鲜花配送广告的模型。从营销材料到网站创建再到用户体验设计，GPT-image-2 现在使开发者能够为实际业务用例交付生产级别的素材。

跨行业的图像生成

这些新功能为跨多种企业场景的更丰富、更可投入生产的图像生成工作流打开了大门：

零售与电子商务：按平台所需的精确尺寸生成产品图像，从方形缩略图到宽幅横幅，无需后期处理。
营销：制作清晰、色彩丰富的活动视觉素材和针对不同市场本地化的社交媒体资产。
媒体与娱乐：以适合制作流水线的分辨率生成故事板画面和场景。
教育与培训：创建视觉学习辅助材料和课程内容，并按各设备的精确显示要求进行格式化。
UI/UX 设计：通过以设计系统所需的精确尺寸生成界面资产，加速原型和模型制作工作流。

定价

注意：所有价格均为每 1M 词元的价格。

开始使用

无论你是在构建个性化零售体验、自动化视觉内容流水线还是加速设计工作流，GPT-image-2 都能为你的团队提供分辨率控制和智能路由，生成完全符合需求的图像。立即在 Microsoft Foundry（企业级国际版）中试用 GPT-image-2 模型！

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-24

使用 Google AI Studio 轻松构建原生 Android 应用

2026-06-24

场景营销前端 AI Coding — AI Native 的视觉稿还原

2026-06-24

Claude Tag：你的公司正在被 AI 偷学

2026-06-24

精华：去哪儿网AI Coding研发平台实践，值得读三遍的样本

2026-06-24

做 FDE 的第一步不是写代码，而是把客户问题拆到能验收

2026-06-24

Claude学会常驻Slack，AI协作变天了

2026-06-23

微信6年来最大改版——关于微信AI助手小微的15条思考

2026-06-23

Loop Engineering 实战笔记：让 Agent 自己发现、执行和复盘

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

OpenAI Codex CLI 完整使用指南

2026-04-07

Claude Code 和 Codex 接入 Figma MCP 保姆级教程

2026-04-07

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

GPT5.5来了，最大特点解析

2026-04-24

Claude Opus 4.7 发布，全网最详细解读

2026-04-17

突发！Claude Code 源码泄露，扒出这些隐藏功能

2026-03-31

GPT-6，曝光了

2026-04-05

GLM-5.1 实测：面向 Agent 长程任务的国内第一模型

2026-04-02

重磅！GPT-6曝光了

2026-04-05

大家都在问

企业智能体的下半场，如何让智能体越用越聪明？

2026-06-18

Agent 记忆，我们全都理解错了？

2026-06-18

如何利用 Harness “一句话交付产品功能”？

2026-06-10

Loop Engineering 循环工程又是什么鬼？

2026-06-10

Agent 工程化五件套：Prompt、Skill、MCP、CLI 到底怎么配合？

2026-06-07

为什么云端 Agent 基建这么难？

2026-06-06

当 AI 开始拥有“自主调度权”：Claude 4.8 这个新功能，到底有多可怕？

2026-06-03

哪些活，该交给Claude Code的 /workflows?

2026-06-02

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw