GPT Image 2
GPT Image 2 是 OpenAI 最新的图像生成模型,现已在 VidGen 上支持文生图和图生图两种工作流。它具备强力的提示词跟随能力、更出色的图中文字渲染,以及在提供参考图时精确的编辑控制。适用于品牌视觉、产品图、UI 样机、海报设计等各类创意需求。图生图模式下最多可上传 8 张参考图,提示词最长支持 20,000 字符。
用 GPT Image 2 生成创意场景
这个示例展示了 GPT Image 2 将一句轻松有趣的提示词转化为细节丰富、充满活力的图像的能力——3D 卡通角色、真实质感与直播间氛围浑然一体。
提示词输入
生成一张有趣男子正在 TikTok 直播的图片,周围有 3D 卡通角色,整体设计要幽默好玩。
生成结果

如何使用 GPT Image 2?
步骤 1
进入文生图或图生图页面
想从提示词生成新图像,进入文生图页面并选择 GPT Image 2;已有参考图想进行编辑或风格转化,进入图生图页面并选择 GPT Image 2。
步骤 2
写一份详细的提示词
描述主体、风格、光线、构图,以及需要在图中渲染的文字内容。GPT Image 2 支持最长 20,000 字符的提示词,可以写清楚场景细节、配色和输出格式。
步骤 3
查看结果并迭代
看到第一版输出后,根据构图、文字清晰度或风格调整提示词继续迭代。图生图模式下也可以更换或补充参考图来进一步引导方向。
常见问题
GPT Image 2 是什么?
GPT Image 2 是 OpenAI 最新的图像生成模型。在 VidGen 中,它支持文生图和图生图两种工作流,具备强力的提示词跟随、更出色的文字渲染以及精确的编辑能力。
GPT Image 2 和 GPT Image 1.5 相比有什么提升?
GPT Image 2 在图中文字渲染、复杂提示词的跟随能力以及 UI 样机生成质量上均有明显提升。此外图生图模式下最多支持 8 张参考图,为多参考图引导提供更大灵活性。
GPT Image 2 能在图片里渲染文字吗?
可以。GPT Image 2 相比早期 GPT 图像模型在文字渲染上有明显进步,适合海报设计、UI 截图、标签文案等需要清晰可读图中文字的创意场景。
GPT Image 2 图生图最多能上传几张参考图?
在 VidGen 中使用 GPT Image 2 图生图模式时,最多可以上传 8 张参考图,可以综合多张图的风格、主体和构图来引导生成结果。
GPT Image 2 适合哪些使用场景?
GPT Image 2 在品牌视觉、产品图、UI 样机、海报封面设计、社媒素材等需要一致性强、提示词驱动的创意场景中表现出色,文字渲染效果也很干净。
GPT Image 2 该选文生图还是图生图?
想从零开始生成新视觉时选文生图;已有参考图、想在保留关键要素的基础上进行编辑或风格转化时选图生图。
提示词必须用英文写吗?
不需要。GPT Image 2 在 VidGen 中支持多语言提示词,用中文、英文、日文或其他语言描述都可以。写清楚主体、风格、光线和构图,通常能带来更好的生成结果。
