微信扫码
添加专属顾问
我要投稿
OpenAI GPT-image-2 正式上线企业级平台,为全球设计团队带来高效、安全的智能图像生成解决方案。 核心内容: 1. GPT-image-2 的新功能:真实世界智能、多语言理解、4K分辨率支持 2. Microsoft Foundry 提供的企业级安全措施与合规保障 3. 智能路由层技术实现自动优化图像生成配置
设想一个小型设计团队正在运营一场全球社交媒体推广活动。他们拥有为每个市场制作本地化图像的创意愿景,却没有足够的资源去重新拍摄、重新排版或外包如此大规模的工作。每个素材都需要适配不同的平台、不同的尺寸、不同的文化背景,而且所有素材都需要同时交付。这正是灵活的图像生成大显身手的地方。
OpenAI 的 GPT-image-2 模型现已正式发布,并于今天正式上线 Microsoft Foundry(国际版),为图像生成带来了质的飞跃。这让企业中的开发人员和设计师能够更好地控制图像输出,更灵活且安全地将这些数字资产应用于自身业务当中。
01
在 Microsoft,我们赋能个人和组织的使命始终如一。作为这一承诺的一部分,通过 Microsoft Foundry(企业级国际版)提供的模型会经过内部审查,并在部署时配备旨在大规模支持负责任使用的安全措施。
对于 GPT-image-2,Microsoft 采用了深度安全方法,在保持人工监督的同时解决违禁内容和滥用问题。该部署将 OpenAI 的图像生成安全缓解措施与 Azure AI 内容安全(企业级国际版)相结合,包括针对敏感内容的过滤器和分类器。
02
GPT-image-2 带来了真实世界智能、多语言理解、更强的指令遵循能力、更高的分辨率支持以及智能路由层,为开发人员提供了在生产工作流中大规模进行图像生成的工具。
真实世界智能
知识截止日期为 2025 年 12 月,这意味着它能够为你提供更具上下文相关性和准确性的输出。该模型还具备增强的思考能力,可以搜索网络、检查自身输出,并仅通过一个提示词生成多张图像。这些增强功能使图像生成模型不再是简单的工具,而是成为创意助手。
多语言理解
增强了对日语、韩语、中文、印地语和孟加拉语的语言支持,并具备新的思考能力。这意味着该模型能够创建图像并呈现具有本地化效果的文本。
更高的分辨率支持
引入了 4K 分辨率支持,使开发人员能够以自定义尺寸生成丰富、细腻且逼真的图像。
需要注意的分辨率准则
注意:如果请求的分辨率超出像素预算,服务将自动将其缩小。
智能路由层
GPT-image-2 还包含一个扩展的路由层,具有两种不同的模式,允许服务智能地为请求选择合适的生成配置,而无需显式设置尺寸值。
模式 1 — 旧版尺寸选择
在模式 1 中,路由层从三个旧版尺寸层级中选择一个用于生成:
此模式适用于已经熟悉旧版尺寸层级的团队,他们希望无需进行任何手动更改即可受益于自动选择。
模式 2 — 词元档位选择
在模式 2 中,路由层从六个档位中进行选择 — 16、24、36、48、64、96 — 它们大致对应于旧版尺寸层级:
这种方法可以在生成的词元数量上提供更大的灵活性,从而有助于针对给定的提示词更好地优化输出质量和效率。
实际效果展示
GPT-image-2 在各种视觉风格中展现了更高的图像保真度,能够生成更加细腻精致的图像。但不要只听我们说,让我们通过几个提示词和编辑来看看模型的实际表现。以下是我们使用的示例:
提示词:空无一人的地铁车厢内部。沿过道方向的广角视图。干净、现代的地铁车厢,配有座椅、扶手杆、线路图条和车窗上方的广告框。逼真的灯光效果,带有轻微的冷色荧光色调,逼真的材质(金属扶手杆、乙烯基座椅、纹理地板)。
图1. 使用 GPT-image-1 生成
图 2. 使用 GPT-image-1.5 生成
图3. 使用 GPT-image-2 生成
如您所见,使用相同的基础提示词时,图像质量和真实感随着每个模型的迭代而提升。现在让我们看看如何对同一张图像进行增量修改:
提示词:在广告框中填充“Zava Flower Delivery”的统一广告活动, 并使用多种花卉。
图 4. 使用 GPT-image-2 生成
现在我们的地铁车厢里已经满是新的 ZAVA 鲜花配送服务广告。让我们再做一个小改动:
提示词:在所有 Zava Flower Delivery 广告中,将展示的花卉更改为玫瑰(红色和粉色玫瑰)。
图 5. 使用 GPT-image-2 生成
只需三个简单的提示词,我们就生成了一个鲜花配送广告的模型。从营销材料到网站创建再到用户体验设计,GPT-image-2 现在使开发者能够为实际业务用例交付生产级别的素材。
03
这些新功能为跨多种企业场景的更丰富、更可投入生产的图像生成工作流打开了大门:
零售与电子商务:按平台所需的精确尺寸生成产品图像,从方形缩略图到宽幅横幅,无需后期处理。
营销:制作清晰、色彩丰富的活动视觉素材和针对不同市场本地化的社交媒体资产。
媒体与娱乐:以适合制作流水线的分辨率生成故事板画面和场景。
教育与培训:创建视觉学习辅助材料和课程内容,并按各设备的精确显示要求进行格式化。
UI/UX 设计:通过以设计系统所需的精确尺寸生成界面资产,加速原型和模型制作工作流。
定价
注意:所有价格均为每 1M 词元的价格。
04
无论你是在构建个性化零售体验、自动化视觉内容流水线还是加速设计工作流,GPT-image-2 都能为你的团队提供分辨率控制和智能路由,生成完全符合需求的图像。立即在 Microsoft Foundry(企业级国际版)中试用 GPT-image-2 模型!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-04-22
“蒸馏”学术大牛后,我的论文直接把导师看傻了
2026-04-22
本体化语义层,会是 AI 数据平台的新地基吗?
2026-04-22
Claude Design 会取代设计师吗
2026-04-22
用 Harness 工程 来构建 Claude Code
2026-04-22
Google发布A2UI 0.9:AI直接生成界面
2026-04-22
ChatGPT Image 2 来了,它终结了整个行业!从今天开始,一切都可能是假的。
2026-04-22
GPT-Image-2 全量上线,中文顶到爆,50+ Case 生图实测
2026-04-21
Anthropic 的 Harness 哲学:把 Agent 当牲口,而非宠物
2026-01-24
2026-04-15
2026-01-23
2026-01-26
2026-03-31
2026-03-13
2026-02-14
2026-02-03
2026-02-03
2026-02-03
2026-04-22
2026-04-18
2026-04-13
2026-04-12
2026-04-07
2026-04-01
2026-03-31
2026-03-31