Ausgabeauflösung festlegen

Mit Imagen in Vertex AI können Sie die Ausgabeauflösung generierter Bilder festlegen, wenn Sie die folgenden Imagen 4-Modelle verwenden:

* {Console}

  1. Rufen Sie in der Google Cloud console die Seite Vertex AI > Vertex AI Studio auf.

    Zu Vertex AI Studio

  2. Klicken Sie auf Medien generieren.

  3. Klicken Sie auf Bild.

  4. Wählen Sie in der Liste Aufgabe die Option Text zu Bild aus.

  5. Wählen Sie in der Liste Modell das zu verwendende Imagen-Modell aus.

  6. Geben Sie im Feld Prompt einen Prompt ein, der beschreibt, wie das Bild bearbeitet werden soll.

  7. Klicken Sie auf chevron_forward Parameter und passen Sie dann die folgenden Optionen an:

    • Seitenverhältnis: Wählen Sie aus den verfügbaren Optionen ein Seitenverhältnis aus.
    • Anzahl der Ergebnisse: Ziehen Sie den Schieberegler, um 1 bis 4 generierte Bilder auszuwählen.
    • Ausgabeauflösung: Wählen Sie aus den verfügbaren Optionen eine Ausgabeauflösung aus.
  8. Klicken Sie auf Ausführen.

REST

Weitere Informationen zur Imagen API finden Sie hier:

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

  • REGION: Die Region, in der sich das Projekt befindet. Weitere Informationen zu unterstützten Regionen finden Sie unter Generative AI in Vertex AI-Standorten.
  • TEXT_PROMPT: Der Text-Prompt, der zum Generieren von Bildern verwendet werden soll.
  • PROJECT_ID: Ihre Google Cloud Projekt-ID.
  • MODEL_VERSION: Die zu verwendende Imagen-Modellversion. Die folgenden Werte sind zulässig, wenn Sie sampleImageSize verwenden:
    • imagen-4.0-generate-001
    • imagen-4.0-ultra-generate-001
  • IMAGE_RESOLUTION: Die Auflösung des Ausgabebildes. Folgendes ist zulässig:
    • "1K"
    • "2K"

    Die Standardeinstellung ist "1K".

  • IMAGE_COUNT: Die Anzahl der zu generierenden Bilder. Der zulässige Wertebereich ist 1 bis 4.

HTTP-Methode und URL:

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleImageSize": "IMAGE_RESOLUTION",
    "sampleCount": IMAGE_COUNT
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json, und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
Die Anfrage gibt Bildobjekte zurück. In diesem Beispiel werden zwei Bildobjekte mit zwei Vorhersageobjekten als base64-codierte Bilder zurückgegeben.
{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    },
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    }
  ]
}