免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

OpenAI 官方发布 GPT Image 1.5 提示词指南(15+场景Prompt建议收藏!)

发布日期:2025-12-17 13:14:53 浏览次数: 1609
作者:甲木未来派

微信搜一搜,关注“甲木未来派”

推荐语

OpenAI最新发布的GPT Image 1.5图像生成模型,在真实感、细节保留和文字渲染方面都有显著提升,官方还贴心地提供了15+场景的Prompt指南!

核心内容:
1. GPT Image 1.5的四大核心升级点
2. 官方Prompt指南的三大基本功要点
3. 15+实用场景的Prompt建议与应用技巧

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


一觉起来,OpenAI发布了他们的新一代图像生成模型:GPT Image 1.5

这是OpenAI的Sam发布了红色预警的第二步,

第一步,发布了GPT-5.2模型,瞄准“专业工作和长周期智能体”的工作任务,想跟谷歌掰掰手腕。

这次,想对标谷歌的 Nano Banana Pro,

关于🍌,应该不用做过多介绍,

毫无争议的SOTA模型,

而现在,OpenAI发布的GPT Image 1.5就是想在图像生成领域奋起直追。。

发布及上线,所有人可用,直接打开ChatGPT,侧边栏新增「图片」列,并且还换了个粉色皮肤...

具体的更新点,来看下官方视频:

总结下来:

1、真实感、准确性和可编辑性方面均有显著提升:更强的指令遵循,多轮编辑中的光线、构图、人物外貌这些元素一致性不错。

2、细节保留能力大幅提升:整体的细节理解层做的不错。

3、速度与成本双重优化:速度快了很多,同时API的价格相比之前降了20%

4、文字渲染能力提升:现在,GPT Image 1.5 能够处理更密集、更小的文字,比如 Markdown 直接渲染成报纸版面等等

但是,注意,上边说的都是针对于之前Image版本的提升点,

如果相比Nano Banana Pro,无论是中文理解和渲染,以及世界知识层面还是有差距的。。

关于GPT Image 1.5跟Nano Banana Pro的对比,改天再给大家分享。

今天主要给大家分享一下OpenAI官方跟着这次GPT Image 1.5一同发布的 Gpt-image-1.5 Prompting Guide(提示词指南)

OpenAI官网Cookbook

不仅能用于GPT-Image-1.5,其它绘画模型(🍌)也通用。

原文链接🔗:https://cookbook.openai.com/examples/multimodal/image-gen-1.5-prompting_guide

OpenAI 官方提示词设计指南(中文精炼版)

一、提示词基本功

想要 AI 听话,你的 Prompt 必须遵循一定的“语法结构”。

  1. 🏗️ 结构 + 目标

不要写小作文。按一致的顺序写:背景/场景 → 主体 → 关键细节 → 限制条件

一定要注明用途(例如:广告、UI 原型、信息图),这决定了 AI 调用的“模式”和润色程度。

  1. 🎯 具体性 + 质量线索

别再用什么“8K”、“超高清”这种虚词了。

要具体!明确材质(磨砂玻璃、皮革)、形状、纹理。如果是照片,请使用摄影术语(如:50mm镜头、f/1.8光圈、漫射光)。

这些物理参数比“好看”这种形容词管用得多。

  1. ⏱️ 延迟 vs 保真度

这是一个很有趣的参数。对于需要大量跑图的场景,可以显式地设置 quality="low"

很多时候,低画质模式不仅快,而且在构图验证阶段已经足够用了。

注释:这点主要是用于api调用的场景

  1. 📐 构图控制

明确指定取景(特写、广角、俯视)、透视(平视、低角度)。

关键点:如果布局很重要,直接告诉它位置,“Logo在右上角”,“主体居中,左侧大量留白”。

  1. 🚫 约束条件(改什么 vs 留什么)

跟我们日常的prompt思路一样。明确声明“不变项”。

例如:“保留人物的面部特征和发型,只改变衣服”。或者“不要水印”、“不要额外文字”。

  1. 🔤 图片中的文字

想让 AI 写对字?把文字用引号括起来,或者全部大写。对于生僻词,甚至可以 S-P-E-L-L(拼写)出来。

  1. 🧵 多图输入

通过索引和描述引用每个输入(“图像 1:产品照片……图像 2:样式参考……”),并描述它们如何交互(“将图像 2 的样式应用于图像 1”)。

合成时,明确指出哪些元素移动到哪里(“将图像 1 中的鸟放到图像 2 中的大象身上”)。

  1. 🔄 迭代而非重来

不要试图在一个 Prompt 里搞定所有事。

从一个清晰的基础 Prompt 开始,然后通过简短的指令微调:“把光线调暖一点”、“移除多余的树”。

这个其实就是我们在同一个对话框中不断迭代的思路。

接下来,我们来看下官方的Case场景!

同样地,我会把Nano的部分场景也放出来..


🎨 场景一:生成类(Text → Image)

这一部分,主要test“无中生有”的问题。

1. 信息图表 (Infographics)

适用场景:给老板做PPT、解释复杂流程、海报。

技巧:对于文字密集的图,api中务必开启 High Quality 模式。

Prompt:“制作一张关于全自动咖啡机(如Jura品牌)运作流程的详细信息图。从豆仓、研磨、称重、水箱到锅炉等环节。我希望从技术和视觉上清晰地理解其工作流。”

GPT Image 1.5效果
NanoBanana Pro效果

官方case里面是英文图,我直接生成了一张中文的。

然后再对比看一下🍌的效果,

我觉得中文场景,还是可以放弃GPT了..

2. 图片翻译 (Translation in Images)

适用场景:跨境电商、外贸海报本地化。

技巧:核心是“保留除文字外的一切”。

Prompt:“将信息图中的文字翻译成西班牙语。不要改变图像的任何其他方面(保留排版风格、位置、间距和层级)。”

GPT Image 1.5效果
NanoBanana Pro效果

这步其实两个模型完成的效果都还可以,但是GPT的生成速度还是略逊一筹。

3. 写实主义:逼真图像呈现自然质感

适用场景:摄影作品、生活照。

技巧:像摄影师一样说话。提到瑕疵(毛孔、皱纹、磨损),避免“影棚感”。

Prompt 示例:

创作一张写实风格的抓拍照片,画面中一位年迈的水手伫立在小型渔船上。
他皮肤饱经风霜,可见明显皱纹、毛孔与日晒肌理,双臂残留着几处褪色的传统水手纹身。此刻他正平静地整理渔网,爱犬静卧在甲板旁。
采用35毫米胶片摄影风格,以50毫米镜头拍摄眼平视角的中近景。
柔和的海岸日光,浅景深,细腻的胶片颗粒感,自然的色彩平衡。
画面应呈现真实自然的质感,展现真实的皮肤纹理、磨损的材质和日常细节。不美化,不进行过度修饰。
GPT Image 1.5效果
NanoBanana Pro效果

这块我看不出来有太大区别🤔🤔,大家可以试试更复杂的场景。

4. 世界知识调用

适用场景:历史场景复原、特定事件描绘。

技巧:GPT 1.5 内置了强大的推理能力,你不需要描述每一个细节,只需给出时间地点。如下prompt,暗示“伍德斯托克音乐节”

Prompt 示例:“创建1969年8月16日纽约州贝塞尔市真实的户外人群场景。 要求具备逼真写实效果,服装、布景及环境均符合时代特征。”

GPT Image 1.5效果
NanoBanana Pro效果

5. Logo 生成

适用场景:品牌设计、初创项目。

技巧:强调矢量感、留白和简洁。Prompt 示例:

为本地面包店Field & Flour设计原创且不侵权的标志。
标志需传递温暖、简约且永恒的质感。采用简洁的矢量化造型、鲜明的轮廓线条及均衡的负空间布局。
优先选择简约设计而非繁复细节,确保在大小尺寸下均清晰可辨。采用平面化设计,笔触极简,除非必要否则避免使用渐变效果。
背景保持纯色。交付居中排列的单一标志,留足充足间距。无水印。”
GPT Image 1.5效果
NanoBanana Pro效果

这个case场景,我觉得GPT表现似乎更好一点

6 故事转漫画

适用场景:分镜脚本、自媒体条漫。

技巧:将叙事拆解为清晰的视觉节点。

Prompt 示例:

创建一个包含4个等大画格的垂直漫画条。 
第1格:主人从前门离开。宠物出现在身后的窗户里,在那块玻璃映衬下显得很小,眼睛睁大,爪子趴得高高的,房子突然安静下来。 
第2格:门咔哒一声关上了。寂静被打破。宠物慢慢转向空荡荡的房子,姿态改变,眼神里闪烁着搞事的念头。 
第3格:房子大变样。宠物像主人一样瘫在沙发上,旁边是饼干碎屑,阳光像聚光灯一样切过房间。 
第4格:门开了。宠物完美地端坐在门口,警觉而镇定,仿佛什么都没发生过。”
GPT Image 1.5效果
NanoBanana Pro效果

7. UI 原型设计

适用场景:产品经理、UI设计师快速出图。

技巧:UI 原型图的最佳效果在于,将产品描述得如同它已经存在一样。重点关注布局、层级、间距和实际的界面元素,避免使用概念艺术的语言,这样最终呈现的效果才会像一个可用的、已发布的界面,而不是设计草图。

Prompt 示例:

为本地农贸市场创建一个真实的移动应用界面原型。
展示当日市场信息,包含简洁的页眉、带小图和分类的简短摊贩列表、小型“今日特惠”板块,以及地点和营业时间的基本信息。
设计需注重实用性与易用性:采用纯白背景,搭配自然柔和的点缀色,使用清晰字体,减少装饰元素。
整体呈现应符合小型本地市场的真实场景,兼具精良设计与美观性。
将界面原型置于iPhone模拟框架中。
GPT Image 1.5效果
NanoBanana Pro效果

官网的UI效果我不太清楚是不是一次性效果,

所有图中🍌🍌模型生成,我都是一次性效果拿出来的。


✏️ 场景二:编辑类(Text + Image → Image)

这是 GPT Image 1.5 和 Nano Banana Pro最擅长的地方,也是我们最常用的功能。

关于🍌的对比,这里就不放了,之前的文章中写过很多次🍌的表现了,我们来看看GPT的表现

1. 风格迁移

技巧:明确“锁死”什么,“改变”什么。

Prompt 示例:“使用输入图片(参考图)的风格,生成一个男人在白色背景上骑摩托车的画面。”

左边输入图,右边输出图

2. 虚拟服装试穿

适用场景:电商模特图生成。核心逻辑:锁死人物ID,只换衣服。

Prompt 示例:

使用提供的服装图片对女性进行着装编辑。
不得以任何形式改变其面部特征、肤色、体型、姿势或身份特征。必须完整保留其原貌、表情、发型及身体比例。仅替换服装部分,确保服装自然贴合原有姿势与身体轮廓,并呈现真实的布料动态效果。
灯光、阴影及色温需与原照片完全匹配,使服装呈现逼真效果,避免出现拼接痕迹。
不得更改背景、拍摄角度、构图或图像质量,不得添加任何配饰、文字、标识或水印。
输入图像
输出效果

3. 草图转渲染图 (Drawing → Image)

适用场景:建筑设计、工业设计。技巧:把 Prompt 当作技术说明书写。

Prompt 示例:

将此图稿转化为逼真的照片级图像。
保留原图精确的布局、比例和透视效果。
选用符合草图意图的真实材质与光照效果。
请勿添加新元素或文字。
左边为输入图,右边为输出图

4. 产品抠图与模型准备 (Product Mockups)

适用场景:电商主图制作。技巧:强调边缘质量和标签完整性。

Prompt 示例:

从输入图像中提取产品。
输出:透明背景(RGBA PNG格式),轮廓清晰锐利,无光晕/色散现象。
精确保留产品几何结构与标签可读性。
可选:在透明度通道添加细微逼真的接触阴影(无硬切线)。
不改变产品样式;仅去除背景并进行轻度润色。
左边为输入图,右边为输出图

5. 带有真实文字的营销创意 (Marketing Creatives)

技巧:对于广告牌文字,必须逐字精确。

Prompt 示例:

创建一个真实的广告牌效果图,展示洗发水在日落时分的高速公路场景中。
广告牌文字(精确复制,无额外字符):
“Fresh and clean”
字体排版:粗体无衬线字体,高对比度,居中对齐,字距调整干净利落。
确保文字仅出现一次且完全清晰可辨。
无水印,无标识。
左边为输入图,右边为输出图

6. 光照与天气转换 (Lighting and Weather Transformation)

技巧:只改变环境条件,保留物体几何结构。

Prompt 示例:“将画面看起来像是下雪的冬夜。”

7. 物体移除与插入 (Object Removal/Insertion)

技巧:精准描述要操作的对象,并强调“不要改变其他任何东西”。

Prompt 示例(移除)“移除男人白色T恤上的树形Logo。不要改变其他任何东西。”

8. 多图参考

用于将多个输入元素组合成一张逼真的图像——非常适合“将此物体/人物插入到该场景”的工作流程,无需重新生成所有内容。

Prompt 示例:将第二张图片中的狗置入第一张图片的场景中,紧挨着那位女士,采用相同的灯光风格、构图和背景。其他元素均保持不变。

图像编辑的一致性这块,GPT的基本功还行。


💎 场景三:高价值商业应用

这部分是能直接用来赚钱的技巧。

1. 室内设计“精准替换”

适用场景:软装搭配展示。

Prompt 示例:

在此房间照片中,仅将白色区域替换为木制椅子。
保留拍摄角度、室内光线、地面阴影及周边物体。
图像其他所有元素均保持不变。
实现逼真的接触阴影与织物纹理效果。

2. 3D立体节日贺卡

适用场景:节日营销海报。技巧:强调触感(纸张层次、纤维)。

Prompt 示例:

“一幅温馨的圣诞场景:一只旧泰迪熊静卧在纪念盒中,”
“毛绒略显磨损,缝线处有柔软的修补痕迹,置于窗边,窗外飘着雪花。”
“这幅画面暗示着孩童已长大成人,但记忆依然鲜活。”
创作一张圣诞贺卡插画。

场景:
{场景描述}

氛围:
温暖、怀旧、柔和、感性。

风格:
高端节日贺卡摄影风格,柔和电影质感光线,
真实质感纹理,浅景深效果,
雅致散景光晕,高印刷品质构图。

限制条件:
- 仅限原创作品
- 无商标
- 无水印
- 无标识

仅包含此贺卡文字(逐字):
“{short_copy}”

3. 收藏级玩具/周边概念图

适用场景:IP周边开发、提案。

Prompt 示例:

制作一款采用泡罩包装的{角色描述}收藏级动作人偶。

概念:
一款怀旧节日收藏品,灵感源自孩子们冬日假期玩耍的简易玩具飞机。
唤起温暖、想象力与童年奇幻。

风格要求:
高端玩具摄影,真实塑料与金属涂装质感,
影棚布光,浅景深效果,
标签印刷清晰锐利,高端零售陈列感。

限制条件:
- 仅限原创设计
- 禁止使用商标
- 禁止添加水印
- 禁止使用标识

包装文案仅包含以下内容(原文照录):
“{简短文案}”

4. 儿童绘本:角色一致性工作流 (Character Consistency)

这是目前最难的,OpenAI 给出了一个 “两步走” 的解决方案。

第一步:建立角色锚点 (Character Anchor)

Prompt:“创建一个儿童绘本插图,介绍主角。角色:一个童话风格的小英雄,受森林游侠启发,穿着简单的绿色连帽束腰外衣,棕色软靴。表情善良,眼神温柔。风格:手绘水彩外观,柔和的轮廓,温暖的大地色系。背景:简单的森林背景,清晰展示角色。”

第二步:推进叙事 (Story Continuation)

Prompt:“使用同一个角色继续儿童绘本故事。场景:同一个森林小英雄在暴风雪后,温柔地帮助一只受惊的松鼠从倒塌的树中出来。角色一致性必须穿着相同的绿色连帽外衣,保持相同的五官、比例和配色。风格:水彩插图,柔和光线,雪景森林。限制:不要重新设计角色。”(注:此步骤需引用第一步生成的图片作为参考)

这里只是OpenAI列出的几个价值场景,

其实还有很多创意来自民间,来自真实生产场景,

过去甲木也写了很多场景案例case,大家可以参考。


结语

这份指南,其实也是AI绘画的基础prompt,

这次借着GPT-Image-1.5的发布,也给大家分享一下,

GPT Image 1.5 或许在参数和某些硬指标上,

暂时没能把 NanoBanana Pro 打趴下,甚至在中文理解上还略逊一筹。

但 OpenAI 通过这份指南,

还是有一定参考意义的,

毕竟,AI 创作的逻辑:

不仅仅是随机抽卡,而是通过精准的约束、分层的逻辑、结构化的语言,将 AI 变成一个可控的生产力工具。

无论你用的是 GPT 还是 Banana,

可以试着把上面的这些 Prompt 思路应用到你的工作流中。

你会发现,AI 还是那个 AI,

但它出来的东西,变了。

等Lovart接入GPT-Image-1.5,再给大家分享它们的详细对比..

期待OpenAI再发点干货吧...

以上。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询