画像生成の結果を改善するには、次のベスト プラクティスを参考にしてください。
具体的にする: 詳細に説明するほど、より細かく制御できます。たとえば、「ファンタジー アーマー」ではなく、「銀の葉の模様がエッチングされた、装飾的なエルフのプレート アーマー。ハイカラーとハヤブサの翼の形をした肩当て付き」とします。
コンテキストと意図を提供する: モデルがコンテキストを理解できるように、画像の目的を説明します。たとえば、「高級感のあるミニマリストのスキンケア ブランドのロゴを作成して」は、「ロゴを作成して」よりも効果的です。
繰り返して改良: 最初の試行で完璧な画像が生成されるとは限りません。フォローアップ プロンプトを使用して、小規模な変更を加えます(例: 「照明を暖色にして」、「キャラクターの表情をもっとシリアスにして」)。
手順ガイドを使用する: 複雑なシーンの場合は、リクエストを手順に分割します。たとえば、「まず、夜明けの静かで霧のかかった森の背景を作成して。次に、前景に苔むした古代の石の祭壇を追加して。最後に、祭壇の上に光る剣を 1 本置いて。」
含めたくないものではなく、含めたいものを説明する: 「車なし」ではなく、「交通の気配のない、空っぽの寂れた通り」のように、ポジティブな表現でシーンを説明します。
カメラを制御する: カメラのビューを操作します。構図を説明する際は、「広角ショット」、「マクロショット」、「ローアングル」などの写真や映画の用語を使用します。
画像のプロンプト: 「~の画像を作成して」や「~の画像を生成して」などのフレーズを使用して、意図を説明します。そうしないと、マルチモーダル モデルが画像ではなくテキストで応答する可能性があります。
思考シグネチャを渡す: Gemini 3 Pro Image を使用する場合は、マルチターンの画像作成および画像編集中に思考シグネチャをモデルに渡すことをおすすめします。これにより、インタラクション間で推論コンテキストを維持できます。Gemini 3 Pro Image を使用したマルチターンの画像編集に関連するコードサンプルについては、思考シグネチャを使用したマルチターンの画像編集の例をご覧ください。
次のステップ
Gemini の画像生成について詳しくは、以下のリンクをご覧ください。