Sie können Imagen für die Optimierungsfunktion von Vertex AI verwenden, um die Größe eines Bildes zu erhöhen, ohne die Qualität zu beeinträchtigen.
Modellversionen
Die Verfügbarkeit der Optimierung basiert auf der Modellversion:
Funktion | Imagen (v.002) | Imagen 2 (v.005) | Imagen 2 (v.006) |
---|---|---|---|
Auflösung wird erhöht | ✔ | Nicht unterstützt | Nicht unterstützt |
Bild optimieren
Verwenden Sie die folgenden Codebeispiele, um ein vorhandenes, generiertes oder bearbeitetes Bild hochzuskalieren.
Console
Folgen Sie der Anleitung unter Bild mit Text generieren, um Bilder zu generieren.
Wählen Sie das Bild aus, das hochskaliert werden soll.
Klicken Sie auf
Hochskalieren/Exportieren.Wählen Sie Bilder hochskalieren.
Wählen Sie einen Wert aus dem Skalierungsfaktor (
2x
or4x
).Klicken Sie auf
Exportieren, um das hochskalierte Bild zu speichern.
REST
Weitere Informationen zu imagegeneration
-Modellanfragen finden Sie in der API-Referenz des imagegeneration
-Modells.
Der Hochskalierungsmodus ist ein optionales Feld im parameters
-Objekt eines JSON-Anfragetexts. Wenn Sie ein Bild mit der API aktualisieren, geben Sie "mode": "upscale"
und upscaleConfig
an.
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- LOCATION: Die Region Ihres Projekts. Beispiel:
us-central1
,europe-west2
oderasia-northeast3
. Eine Liste der verfügbaren Regionen finden Sie unter Generative AI an Vertex AI-Standorten. - PROJECT_ID: Ihre Google Cloud Projekt-ID.
- B64_BASE_IMAGE: Das Basisbild, das bearbeitet oder hochskaliert werden soll. Das Bild muss als base64-codierter Bytestring angegeben werden. Größenbeschränkung: 10 MB.
- IMAGE_SOURCE: Der Cloud Storage-Speicherort des Bildes, das Sie bearbeiten oder hochskalieren möchten. Beispiel:
gs://output-bucket/source-photos/photo.png
- UPSCALE_FACTOR: Optional. Der Faktor, auf den das Bild hochskaliert werden soll. Wenn nicht angegeben, wird der Hochskalierungsfaktor von der längeren Seite des Eingabebilds und von
sampleImageSize
bestimmt. Verfügbare Werte:x2
oderx4
.
HTTP-Methode und URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict
JSON-Text der Anfrage:
{ "instances": [ { "prompt": "", "image": { // use one of the following to specify the image to upscale "bytesBase64Encoded": "B64_BASE_IMAGE" "gcsUri": "IMAGE_SOURCE" // end of base image input options }, } ], "parameters": { "sampleCount": 1, "mode": "upscale", "upscaleConfig": { "upscaleFactor": "UPSCALE_FACTOR" } } }
Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:
curl
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict"
PowerShell
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict" | Select-Object -Expand Content
Sie sollten eine JSON-Antwort ähnlich wie diese erhalten:
{ "predictions": [ { "mimeType": "image/png", "bytesBase64Encoded": "iVBOR..[base64-encoded-upscaled-image]...YII=" } ] }
Nächste Schritte
Artikel zu Imagen und anderen Produkten für generative KI in Vertex AI:
- Leitfaden für Entwickler zum Einstieg in Imagen 3 in Vertex AI
- Neue generative Medienmodelle und ‑tools, die von und für Creator entwickelt wurden
- Neu in Gemini: Benutzerdefinierte Gems und verbesserte Bildgenerierung mit Imagen 3
- Google DeepMind: Imagen 3 – unser bisher bestes Text-zu-Bild-Modell