我要投稿

OpenAI 官方发布 GPT Image 1.5 提示词指南（15+场景Prompt建议收藏！）

发布日期：2025-12-17 13:14:53 浏览次数： 4164

作者：甲木未来派

微信搜一搜，关注“甲木未来派”

一觉起来，OpenAI发布了他们的新一代图像生成模型：GPT Image 1.5

这是OpenAI的Sam发布了红色预警的第二步，

第一步，发布了GPT-5.2模型，瞄准“专业工作和长周期智能体”的工作任务，想跟谷歌掰掰手腕。

这次，想对标谷歌的 Nano Banana Pro，

关于🍌，应该不用做过多介绍，

毫无争议的SOTA模型，

而现在，OpenAI发布的GPT Image 1.5就是想在图像生成领域奋起直追。。

发布及上线，所有人可用，直接打开ChatGPT，侧边栏新增「图片」列，并且还换了个粉色皮肤...

具体的更新点，来看下官方视频：

总结下来：

1、真实感、准确性和可编辑性方面均有显著提升：更强的指令遵循，多轮编辑中的光线、构图、人物外貌这些元素一致性不错。

2、细节保留能力大幅提升：整体的细节理解层做的不错。

3、速度与成本双重优化：速度快了很多，同时API的价格相比之前降了20%

4、文字渲染能力提升：现在，GPT Image 1.5 能够处理更密集、更小的文字，比如 Markdown 直接渲染成报纸版面等等

但是，注意，上边说的都是针对于之前Image版本的提升点，

如果相比Nano Banana Pro，无论是中文理解和渲染，以及世界知识层面还是有差距的。。

关于GPT Image 1.5跟Nano Banana Pro的对比，改天再给大家分享。

今天主要给大家分享一下OpenAI官方跟着这次GPT Image 1.5一同发布的 Gpt-image-1.5 Prompting Guide（提示词指南）

不仅能用于GPT-Image-1.5，其它绘画模型（🍌）也通用。

原文链接🔗：https://cookbook.openai.com/examples/multimodal/image-gen-1.5-prompting_guide

OpenAI 官方提示词设计指南（中文精炼版）

一、提示词基本功

想要 AI 听话，你的 Prompt 必须遵循一定的“语法结构”。

🏗️ 结构 + 目标：

不要写小作文。按一致的顺序写：背景/场景 → 主体 → 关键细节 → 限制条件。

一定要注明用途（例如：广告、UI 原型、信息图），这决定了 AI 调用的“模式”和润色程度。

🎯 具体性 + 质量线索：

别再用什么“8K”、“超高清”这种虚词了。

要具体！明确材质（磨砂玻璃、皮革）、形状、纹理。如果是照片，请使用摄影术语（如：50mm镜头、f/1.8光圈、漫射光）。

这些物理参数比“好看”这种形容词管用得多。

⏱️ 延迟 vs 保真度：

这是一个很有趣的参数。对于需要大量跑图的场景，可以显式地设置 quality="low"。

很多时候，低画质模式不仅快，而且在构图验证阶段已经足够用了。

注释：这点主要是用于api调用的场景

📐 构图控制：

明确指定取景（特写、广角、俯视）、透视（平视、低角度）。

关键点：如果布局很重要，直接告诉它位置，“Logo在右上角”，“主体居中，左侧大量留白”。

🚫 约束条件（改什么 vs 留什么）：

跟我们日常的prompt思路一样。明确声明“不变项”。

例如：“保留人物的面部特征和发型，只改变衣服”。或者“不要水印”、“不要额外文字”。

🔤 图片中的文字：

想让 AI 写对字？把文字用引号括起来，或者全部大写。对于生僻词，甚至可以 S-P-E-L-L（拼写）出来。

🧵 多图输入：

通过索引和描述引用每个输入（“图像 1：产品照片……图像 2：样式参考……”），并描述它们如何交互（“将图像 2 的样式应用于图像 1”）。

合成时，明确指出哪些元素移动到哪里（“将图像 1 中的鸟放到图像 2 中的大象身上”）。

🔄 迭代而非重来：

不要试图在一个 Prompt 里搞定所有事。

从一个清晰的基础 Prompt 开始，然后通过简短的指令微调：“把光线调暖一点”、“移除多余的树”。

这个其实就是我们在同一个对话框中不断迭代的思路。

接下来，我们来看下官方的Case场景！

同样地，我会把Nano的部分场景也放出来..

🎨 场景一：生成类（Text → Image）

这一部分，主要test“无中生有”的问题。

1. 信息图表 (Infographics)

适用场景：给老板做PPT、解释复杂流程、海报。

技巧：对于文字密集的图，api中务必开启 High Quality 模式。

“
Prompt：“制作一张关于全自动咖啡机（如Jura品牌）运作流程的详细信息图。从豆仓、研磨、称重、水箱到锅炉等环节。我希望从技术和视觉上清晰地理解其工作流。”

官方case里面是英文图，我直接生成了一张中文的。

然后再对比看一下🍌的效果，

我觉得中文场景，还是可以放弃GPT了..

2. 图片翻译 (Translation in Images)

适用场景：跨境电商、外贸海报本地化。

技巧：核心是“保留除文字外的一切”。

“
Prompt：“将信息图中的文字翻译成西班牙语。不要改变图像的任何其他方面（保留排版风格、位置、间距和层级）。”

这步其实两个模型完成的效果都还可以，但是GPT的生成速度还是略逊一筹。

3. 写实主义：逼真图像呈现自然质感

适用场景：摄影作品、生活照。

技巧：像摄影师一样说话。提到瑕疵（毛孔、皱纹、磨损），避免“影棚感”。

Prompt 示例：

创作一张写实风格的抓拍照片，画面中一位年迈的水手伫立在小型渔船上。
他皮肤饱经风霜，可见明显皱纹、毛孔与日晒肌理，双臂残留着几处褪色的传统水手纹身。此刻他正平静地整理渔网，爱犬静卧在甲板旁。
采用35毫米胶片摄影风格，以50毫米镜头拍摄眼平视角的中近景。
柔和的海岸日光，浅景深，细腻的胶片颗粒感，自然的色彩平衡。
画面应呈现真实自然的质感，展现真实的皮肤纹理、磨损的材质和日常细节。不美化，不进行过度修饰。

这块我看不出来有太大区别🤔🤔，大家可以试试更复杂的场景。

4. 世界知识调用

适用场景：历史场景复原、特定事件描绘。

技巧：GPT 1.5 内置了强大的推理能力，你不需要描述每一个细节，只需给出时间地点。如下prompt，暗示“伍德斯托克音乐节”

“
Prompt 示例：“创建1969年8月16日纽约州贝塞尔市真实的户外人群场景。要求具备逼真写实效果，服装、布景及环境均符合时代特征。”

5. Logo 生成

适用场景：品牌设计、初创项目。

技巧：强调矢量感、留白和简洁。Prompt 示例：

为本地面包店Field & Flour设计原创且不侵权的标志。
标志需传递温暖、简约且永恒的质感。采用简洁的矢量化造型、鲜明的轮廓线条及均衡的负空间布局。
优先选择简约设计而非繁复细节，确保在大小尺寸下均清晰可辨。采用平面化设计，笔触极简，除非必要否则避免使用渐变效果。
背景保持纯色。交付居中排列的单一标志，留足充足间距。无水印。”

这个case场景，我觉得GPT表现似乎更好一点

6 故事转漫画

适用场景：分镜脚本、自媒体条漫。

技巧：将叙事拆解为清晰的视觉节点。

Prompt 示例：

创建一个包含4个等大画格的垂直漫画条。 
第1格：主人从前门离开。宠物出现在身后的窗户里，在那块玻璃映衬下显得很小，眼睛睁大，爪子趴得高高的，房子突然安静下来。 
第2格：门咔哒一声关上了。寂静被打破。宠物慢慢转向空荡荡的房子，姿态改变，眼神里闪烁着搞事的念头。 
第3格：房子大变样。宠物像主人一样瘫在沙发上，旁边是饼干碎屑，阳光像聚光灯一样切过房间。 
第4格：门开了。宠物完美地端坐在门口，警觉而镇定，仿佛什么都没发生过。”

7. UI 原型设计

适用场景：产品经理、UI设计师快速出图。

技巧：UI 原型图的最佳效果在于，将产品描述得如同它已经存在一样。重点关注布局、层级、间距和实际的界面元素，避免使用概念艺术的语言，这样最终呈现的效果才会像一个可用的、已发布的界面，而不是设计草图。

Prompt 示例：

为本地农贸市场创建一个真实的移动应用界面原型。
展示当日市场信息，包含简洁的页眉、带小图和分类的简短摊贩列表、小型“今日特惠”板块，以及地点和营业时间的基本信息。
设计需注重实用性与易用性：采用纯白背景，搭配自然柔和的点缀色，使用清晰字体，减少装饰元素。
整体呈现应符合小型本地市场的真实场景，兼具精良设计与美观性。
将界面原型置于iPhone模拟框架中。

官网的UI效果我不太清楚是不是一次性效果，

所有图中🍌🍌模型生成，我都是一次性效果拿出来的。

✏️ 场景二：编辑类（Text + Image → Image）

这是 GPT Image 1.5 和 Nano Banana Pro最擅长的地方，也是我们最常用的功能。

关于🍌的对比，这里就不放了，之前的文章中写过很多次🍌的表现了，我们来看看GPT的表现

1. 风格迁移

技巧：明确“锁死”什么，“改变”什么。

“
Prompt 示例：“使用输入图片（参考图）的风格，生成一个男人在白色背景上骑摩托车的画面。”

2. 虚拟服装试穿

适用场景：电商模特图生成。核心逻辑：锁死人物ID，只换衣服。

Prompt 示例：

使用提供的服装图片对女性进行着装编辑。
不得以任何形式改变其面部特征、肤色、体型、姿势或身份特征。必须完整保留其原貌、表情、发型及身体比例。仅替换服装部分，确保服装自然贴合原有姿势与身体轮廓，并呈现真实的布料动态效果。
灯光、阴影及色温需与原照片完全匹配，使服装呈现逼真效果，避免出现拼接痕迹。
不得更改背景、拍摄角度、构图或图像质量，不得添加任何配饰、文字、标识或水印。

3. 草图转渲染图 (Drawing → Image)

适用场景：建筑设计、工业设计。技巧：把 Prompt 当作技术说明书写。

Prompt 示例：

将此图稿转化为逼真的照片级图像。
保留原图精确的布局、比例和透视效果。
选用符合草图意图的真实材质与光照效果。
请勿添加新元素或文字。

4. 产品抠图与模型准备 (Product Mockups)

适用场景：电商主图制作。技巧：强调边缘质量和标签完整性。

Prompt 示例：

从输入图像中提取产品。
输出：透明背景（RGBA PNG格式），轮廓清晰锐利，无光晕/色散现象。
精确保留产品几何结构与标签可读性。
可选：在透明度通道添加细微逼真的接触阴影（无硬切线）。
不改变产品样式；仅去除背景并进行轻度润色。

5. 带有真实文字的营销创意 (Marketing Creatives)

技巧：对于广告牌文字，必须逐字精确。

Prompt 示例：

创建一个真实的广告牌效果图，展示洗发水在日落时分的高速公路场景中。
广告牌文字（精确复制，无额外字符）：
“Fresh and clean”
字体排版：粗体无衬线字体，高对比度，居中对齐，字距调整干净利落。
确保文字仅出现一次且完全清晰可辨。
无水印，无标识。

6. 光照与天气转换 (Lighting and Weather Transformation)

技巧：只改变环境条件，保留物体几何结构。

Prompt 示例：“将画面看起来像是下雪的冬夜。”

7. 物体移除与插入 (Object Removal/Insertion)

技巧：精准描述要操作的对象，并强调“不要改变其他任何东西”。

Prompt 示例（移除）：“移除男人白色T恤上的树形Logo。不要改变其他任何东西。”

8. 多图参考

用于将多个输入元素组合成一张逼真的图像——非常适合“将此物体/人物插入到该场景”的工作流程，无需重新生成所有内容。

Prompt 示例：将第二张图片中的狗置入第一张图片的场景中，紧挨着那位女士，采用相同的灯光风格、构图和背景。其他元素均保持不变。

图像编辑的一致性这块，GPT的基本功还行。

💎 场景三：高价值商业应用

这部分是能直接用来赚钱的技巧。

1. 室内设计“精准替换”

适用场景：软装搭配展示。

Prompt 示例：

在此房间照片中，仅将白色区域替换为木制椅子。
保留拍摄角度、室内光线、地面阴影及周边物体。
图像其他所有元素均保持不变。
实现逼真的接触阴影与织物纹理效果。

2. 3D立体节日贺卡

适用场景：节日营销海报。技巧：强调触感（纸张层次、纤维）。

Prompt 示例：

“一幅温馨的圣诞场景：一只旧泰迪熊静卧在纪念盒中，”
“毛绒略显磨损，缝线处有柔软的修补痕迹，置于窗边，窗外飘着雪花。”
“这幅画面暗示着孩童已长大成人，但记忆依然鲜活。”
创作一张圣诞贺卡插画。

场景：
{场景描述}

氛围：
温暖、怀旧、柔和、感性。

风格：
高端节日贺卡摄影风格，柔和电影质感光线，
真实质感纹理，浅景深效果，
雅致散景光晕，高印刷品质构图。

限制条件：
- 仅限原创作品
- 无商标
- 无水印
- 无标识

仅包含此贺卡文字（逐字）：
“{short_copy}”

3. 收藏级玩具/周边概念图

适用场景：IP周边开发、提案。

Prompt 示例：

制作一款采用泡罩包装的{角色描述}收藏级动作人偶。

概念：
一款怀旧节日收藏品，灵感源自孩子们冬日假期玩耍的简易玩具飞机。
唤起温暖、想象力与童年奇幻。

风格要求：
高端玩具摄影，真实塑料与金属涂装质感，
影棚布光，浅景深效果，
标签印刷清晰锐利，高端零售陈列感。

限制条件：
- 仅限原创设计
- 禁止使用商标
- 禁止添加水印
- 禁止使用标识

包装文案仅包含以下内容（原文照录）：
“{简短文案}”

4. 儿童绘本：角色一致性工作流 (Character Consistency)

这是目前最难的，OpenAI 给出了一个 “两步走” 的解决方案。

第一步：建立角色锚点 (Character Anchor)

“
Prompt：“创建一个儿童绘本插图，介绍主角。角色：一个童话风格的小英雄，受森林游侠启发，穿着简单的绿色连帽束腰外衣，棕色软靴。表情善良，眼神温柔。风格：手绘水彩外观，柔和的轮廓，温暖的大地色系。背景：简单的森林背景，清晰展示角色。”

第二步：推进叙事 (Story Continuation)

“
Prompt：“使用同一个角色继续儿童绘本故事。场景：同一个森林小英雄在暴风雪后，温柔地帮助一只受惊的松鼠从倒塌的树中出来。角色一致性：必须穿着相同的绿色连帽外衣，保持相同的五官、比例和配色。风格：水彩插图，柔和光线，雪景森林。限制：不要重新设计角色。”(注：此步骤需引用第一步生成的图片作为参考)