Gemini 图片生成最佳实践

如需改善图片生成效果,请遵循以下最佳实践:

  • 具体化:提供更多细节,以便您更好地掌控输出结果。例如,与其使用“奇幻盔甲”,不如尝试“华丽的精灵板甲,蚀刻着银叶图案,带有高领和猎鹰翅膀形状的肩甲”。

  • 提供上下文和意图:说明图片的用途,帮助模型理解上下文。例如,“为高端极简护肤品牌设计徽标”的效果要好于“设计徽标”。

  • 迭代和优化:不要指望第一次尝试就能生成完美的图片。使用后续提示进行小幅更改,例如“让光线更暖一些”或“让角色的表情更严肃一些”。

  • 使用分步指令:对于复杂场景,将您的请求拆分为多个步骤。例如,“首先,创建一个宁静、薄雾弥漫的黎明森林的背景。然后,在前景中添加一个长满苔藓的古老石制祭坛。最后,将一把发光的剑放在祭坛顶部。”

  • 描述您想要的内容,而不是不想要的内容:不要说“没有汽车”,而是通过说“一条没有交通迹象的空旷、荒凉的街道”来正面描述场景。

  • 控制镜头:引导镜头视图。使用摄影和电影术语来描述构图,例如“广角镜头”“微距镜头”或“低角度视角”。

  • 图片提示:使用“创建一张…的图片”或“生成一张…的图片”之类的短语来描述意图。否则,多模态模型可能会以文本而非图片的形式做出回答。

  • 传递思维签名:使用 Gemini 3 Pro Image 时,我们建议您在多轮图片创建和修改期间将思维签名传递回模型。这样一来,您就可以在多次互动中保留推理上下文。如需查看使用 Gemini 3 Pro Image 进行多轮图片修改的相关代码示例,请参阅使用思考签名进行多轮图片修改的示例

后续步骤

如需详细了解 Gemini 图片生成功能,请参阅以下链接: