Gemini 画像生成のベストプラクティス

画像生成の結果を改善するには、次のベストプラクティスを参考にしてください。

具体的にする: 詳細に説明するほど、より細かく制御できます。たとえば、「ファンタジーアーマー」ではなく、「銀の葉の模様がエッチングされた、装飾的なエルフのプレートアーマー。ハイカラーとハヤブサの翼の形をした肩当て付き」とします。
コンテキストと意図を提供する: モデルがコンテキストを理解できるように、画像の目的を説明します。たとえば、「高級感のあるミニマリストのスキンケアブランドのロゴを作成して」は、「ロゴを作成して」よりも効果的です。
繰り返して改良: 最初の試行で完璧な画像が生成されるとは限りません。フォローアッププロンプトを使用して、小規模な変更を加えます（例: 「照明を暖色にして」、「キャラクターの表情をもっとシリアスにして」）。
手順ガイドを使用する: 複雑なシーンの場合は、リクエストを手順に分割します。たとえば、「まず、夜明けの静かで霧のかかった森の背景を作成して。次に、前景に苔むした古代の石の祭壇を追加して。最後に、祭壇の上に光る剣を 1 本置いて。」
含めたくないものではなく、含めたいものを説明する: 「車なし」ではなく、「交通の気配のない、空っぽの寂れた通り」のように、ポジティブな表現でシーンを説明します。
カメラを制御する: カメラのビューを操作します。構図を説明する際は、「広角ショット」、「マクロショット」、「ローアングル」などの写真や映画の用語を使用します。
画像のプロンプト: 「～の画像を作成して」や「～の画像を生成して」などのフレーズを使用して、意図を説明します。そうしないと、マルチモーダルモデルが画像ではなくテキストで応答する可能性があります。
思考シグネチャを渡す: Gemini 3 Pro Image を使用する場合は、マルチターンの画像作成および画像編集中に思考シグネチャをモデルに渡すことをおすすめします。これにより、インタラクション間で推論コンテキストを維持できます。Gemini 3 Pro Image を使用したマルチターンの画像編集に関連するコードサンプルについては、思考シグネチャを使用したマルチターンの画像編集の例をご覧ください。

次のステップ

Gemini の画像生成について詳しくは、以下のリンクをご覧ください。

Gemini 画像生成のベスト プラクティス コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

次のステップ

Gemini 画像生成のベストプラクティス