Impostare la risoluzione di output

Imagen su Vertex AI consente di impostare la risoluzione di output delle immagini generate quando utilizzi i seguenti modelli di Imagen 4:

* {Console}

  1. Nella console Google Cloud , vai alla pagina Vertex AI > Vertex AI Studio .

    Vai a Vertex AI Studio

  2. Fai clic su Genera contenuti multimediali.

  3. Fai clic su Immagine.

  4. Dall'elenco Attività, seleziona Da testo a immagine.

  5. Dall'elenco Modello, seleziona il modello Imagen da utilizzare.

  6. Nella casella Prompt, inserisci un prompt che descriva come modificare l'immagine.

  7. Fai clic sulla chevron_forward Parametri, poi modifica le seguenti opzioni:

    • Proporzioni: scegli un formato tra le opzioni disponibili.
    • Numero di risultati: regola il cursore per selezionare da 1 a 4 immagini generate.
    • Risoluzione output: scegli una risoluzione output tra le opzioni disponibili.
  8. Fai clic su Esegui.

REST

Per saperne di più sull'API Imagen, consulta le seguenti risorse:

Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:

  • REGION: la regione in cui si trova il progetto. Per ulteriori informazioni sulle regioni supportate, consulta AI generativa su Vertex AI.
  • TEXT_PROMPT: il prompt di testo da utilizzare per generare immagini.
  • PROJECT_ID: il tuo ID progetto Google Cloud .
  • MODEL_VERSION: La versione del modello Imagen da utilizzare. Di seguito sono riportati i valori accettati quando utilizzi sampleImageSize:
    • imagen-4.0-generate-001
    • imagen-4.0-ultra-generate-001
  • IMAGE_RESOLUTION: La risoluzione dell'immagine di output. Sono accettati:
    • "1K"
    • "2K"

    L'impostazione predefinita è "1K".

  • IMAGE_COUNT: il numero di immagini da generare. L'intervallo di valori accettato è compreso tra 1 e 4.

Metodo HTTP e URL:

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict

Corpo JSON della richiesta:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleImageSize": "IMAGE_RESOLUTION",
    "sampleCount": IMAGE_COUNT
  }
}

Per inviare la richiesta, scegli una di queste opzioni:

curl

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
La richiesta restituisce oggetti immagine. In questo esempio, vengono restituiti due oggetti immagine, con due oggetti di previsione come immagini con codifica base64.
{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    },
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    }
  ]
}