La documentazione di Vertex AI non viene più aggiornata

I servizi di Vertex AI ora fanno parte di Gemini Enterprise Agent Platform. Per informazioni aggiornate, consulta la documentazione di Agent Platform.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Personalizzazione controllata

Attenzione:la tabella seguente descrive gli endpoint di generazione delle immagini ritirati e i relativi sostituti. Ti consigliamo di aggiornare gli endpoint del modello prima del 30 giugno 2026 per evitare interruzioni del servizio.

Endpoint ritirati	Migrazione degli endpoint consigliata
`imagegeneration@002`	`gemini-2.5-flash-image`
`imagegeneration@003`	`gemini-2.5-flash-image`
`imagegeneration@004`	`gemini-2.5-flash-image`
`imagegeneration@005`	`gemini-2.5-flash-image`
`imagegeneration@006`	`gemini-2.5-flash-image`
`imagetext@001`	`gemini-2.5-flash-image`
`imagen-3.0-capability-001`	`gemini-2.5-flash-image`
`imagen-3.0-capability-002`	`gemini-2.5-flash-image`
`imagen-3.0-fast-generate-001`	`gemini-2.5-flash-image`
`imagen-3.0-generate-001`	`gemini-2.5-flash-image`
`imagen-3.0-generate-002`	`gemini-2.5-flash-image`
`imagen-4.0-fast-generate-001`	`gemini-2.5-flash-image`
`imagen-4.0-generate-001`	`gemini-2.5-flash-image`
`imagen-4.0-ultra-generate-001`	`gemini-2.5-flash-image`

La personalizzazione controllata consente di creare nuove immagini in base a un'immagine di origine o a un segnale di immagine di origine (contorno di Canny o scarabocchio). Questa pagina mostra come inviare due tipi di richieste di personalizzazione controllata:

Personalizzazione controllata di Imagen 3 (funzionalità GA)

Visualizza la scheda del modello Imagen per la modifica e la personalizzazione
Personalizzazione controllata di Imagen 2: segnale dell'immagine di origine del bordo di Canny o dello scarabocchio (funzionalità di anteprima)

I seguenti modelli supportano la personalizzazione controllata:

imagen-3.0-capability-001

Casi d'uso

Imagen 3 Controlled Customization offre prompt in stile libero, che possono dare l'impressione che il modello possa fare più di quanto sia addestrato a fare. Le sezioni seguenti descrivono casi d'uso ed esempi per Imagen 3 Controlled Customization.

Il modello è stato addestrato su casi d'uso che forniamo e ci aspettiamo buoni risultati quando utilizzi la personalizzazione controllata di Imagen 3. Se spingi il modello a rispondere in modi inaspettati, non ci aspettiamo buoni risultati.

Esempi di casi d'uso previsti

Di seguito sono riportati i casi d'uso per cui è stato addestrato Imagen 3 Controlled Customization e per cui produce buoni risultati:

Genera un'immagine che segue il prompt e le immagini di controllo dei contorni.
Genera un'immagine che segua il prompt e le immagini con scarabocchi.
Stilizza una foto di una persona preservando l'espressione del viso.

Esempi di casi d'uso non previsti

Di seguito sono riportati i casi d'uso per cui Imagen 3 Controlled Customization non è addestrato e per cui produce risultati di scarsa qualità:

Genera un'immagine utilizzando uno stile specificato nel prompt.
Genera un'immagine da un testo che segue uno stile specifico fornito da un'immagine di riferimento, con un certo livello di controllo sulla composizione dell'immagine utilizzando un'immagine di controllo.
Genera un'immagine da un testo che segue uno stile specifico fornito da un'immagine di riferimento, con un certo livello di controllo sulla composizione dell'immagine utilizzando uno schizzo di controllo.
Genera un'immagine da un testo che segue uno stile specifico fornito dall'immagine di riferimento, con un certo livello di controllo sulla composizione dell'immagine utilizzando un'immagine di controllo. La persona nell'immagine ha un'espressione facciale specifica.
Stilizza una foto di due o più persone e preserva le loro espressioni facciali.
Stilizza la foto di un animale domestico e trasformala in un disegno. Preserva o specifica la composizione dell'immagine (ad esempio, acquerello).

Prima di iniziare

Accedi al tuo account Google Cloud . Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti senza costi per l'esecuzione, il test e il deployment dei workload.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

Configura l'autenticazione per il tuo ambiente.

Seleziona la scheda relativa a come intendi utilizzare i campioni in questa pagina:
Console

Quando utilizzi la console Google Cloud per accedere ai servizi Google Cloud e alle API, non devi configurare l'autenticazione.
REST

Per utilizzare gli esempi di API REST in questa pagina in un ambiente di sviluppo locale, utilizzi le credenziali che fornisci a gcloud CLI.
Per saperne di più, consulta Autenticati per usare REST nella documentazione sull'autenticazione di Google Cloud .

Scrittura di prompt di personalizzazione

Il prompt che utilizzi con la personalizzazione di Imagen 3 potrebbe influire sulla qualità delle immagini generate. Utilizza i seguenti modelli di prompt come punto di partenza per scrivere prompt di personalizzazione. Potresti dover inviare diverse richieste per ottenere l'output che ti interessa.

Caso d'uso	Immagini di riferimento	Modello di prompt	Esempio
Personalizzazione controllata	Mappa con scarabocchi (1)	Genera un'immagine in linea con `scribble map [1]` in modo che corrisponda alla descrizione: ${STYLE_PROMPT} ${PROMPT}.	Genera un'immagine in linea con `scribble map [1]` per corrispondere alla descrizione: l'immagine deve essere nello stile di una pittura a olio impressionista con pennellate rilassate. Presenta un'atmosfera illuminata naturalmente e pennellate evidenti. Una vista laterale di un'auto. L'auto è parcheggiata su una strada bagnata e riflettente, con le luci della città che si riflettono nelle pozzanghere.
Personalizzazione controllata	Immagine di controllo Canny (1)	Genera un'immagine in linea con `edge map [1]` per corrispondere alla descrizione: ${STYLE_PROMPT} ${PROMPT}	Genera un'immagine in linea con `edge map [1]` in modo che corrisponda alla descrizione: l'immagine deve essere nello stile di una pittura a olio impressionista, con pennellate rilassate. Presenta un'atmosfera illuminata naturalmente e pennellate evidenti. Una vista laterale di un'auto. L'auto è parcheggiata su una strada bagnata e riflettente, con le luci della città che si riflettono nelle pozzanghere.
Stilizzazione dell'immagine di una persona con input FaceMesh	Immagine del soggetto (1-3) Immagine di controllo FaceMesh (1)	Crea un'immagine di `SUBJECT_DESCRIPTION [1]` nella posa di `CONTROL_IMAGE [2]` in modo che corrisponda alla descrizione: un ritratto di `SUBJECT_DESCRIPTION [1]` ${PROMPT}	Crea un'immagine di `a woman with short hair [1]` nella posa di `control image [2]` in modo che corrisponda alla descrizione: un ritratto di `a woman with short hair [1]` in stile cartone animato 3D con uno sfondo sfocato. Un personaggio carino e adorabile, con un volto sorridente, rivolto verso la fotocamera, tonalità di colore pastello, alta qualità, 4K, capolavoro, super dettagli, texture della pelle, mappatura della texture, ombre morbide, morbida illuminazione realistica, colori vivaci
Stilizzazione dell'immagine di una persona con input FaceMesh	Immagine del soggetto (1-3) Immagine di controllo FaceMesh (1)	Crea un'immagine ${STYLE_PROMPT} di `SUBJECT_DESCRIPTION [1]` nella posa di `CONTROL_IMAGE [2]` in modo che corrisponda alla descrizione: un ritratto di `SUBJECT_DESCRIPTION [1]` ${PROMPT}	Crea un'immagine in stile cartone animato 3D di `a woman with short hair [1]` nella posa di `control image [2]` in modo che corrisponda alla descrizione: un ritratto di `a woman with short hair [1]` in stile cartone animato 3D con uno sfondo sfocato. Un personaggio carino e adorabile con un volto sorridente, rivolto verso la fotocamera, tonalità di colore pastello, alta qualità, 4K, capolavoro, super dettagli, texture della pelle, mappatura delle texture, ombre morbide, illuminazione morbida e realistica, colori vivaci

Inviare una richiesta di personalizzazione controllata di Imagen 3

Utilizza i seguenti esempi per inviare una richiesta di personalizzazione controllata di Imagen 3:

REST

Per saperne di più sull'API Imagen, consulta le seguenti risorse:

Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:

PROJECT_ID: il tuo Google Cloud ID progetto.
LOCATION: la regione del progetto. Ad esempio, us-central1, europe-west2 o asia-northeast3. Per un elenco delle regioni disponibili, consulta Località dell'AI generativa su Vertex AI. Quando viene utilizzato un endpoint API regionale, la regione dell'URL dell'endpoint determina dove viene elaborata la richiesta e questo LOCATION nel percorso della risorsa viene ignorato in caso di conflitto.
TEXT_PROMPT: il prompt di testo guida le immagini che il modello genera. Per utilizzare la personalizzazione controllata di Imagen 3, includi il referenceId dell'immagine di riferimento per il controllo che fornisci nel formato [$referenceId]. Ad esempio:
- Genera un'immagine in linea con la mappa abbozzata [1] in modo che corrisponda alla descrizione: [image description].
BASE64_CONTROL_IMAGE: l'immagine di controllo di base (schizzo). L'immagine deve essere specificata come stringa di byte con codifica base64.
Per CONTROL_TYPE_SCRIBBLE: l'immagine del controllo scarabocchio previsto ha uno sfondo nero e una linea di scarabocchio bianca.
Per CONTROL_TYPE_CANNY: l'immagine di controllo Canny Edge prevista ha sfondo nero e bordi bianchi.
CONTROL_TYPE: il tipo di segnale di controllo. Utilizza CONTROL_TYPE_CANNY per il rilevamento dei contorni. Usa CONTROL_TYPE_SCRIBBLE per scarabocchiare.
enableControlImageComputation: imposta su false se fornisci la tua immagine di controllo. In questo caso, B64_BASE_IMAGE deve essere l'immagine del segnale di controllo. Imposta true se vuoi che Imagen calcoli l'immagine di controllo dall'immagine di riferimento. In questo caso, B64_BASE_IMAGE deve essere l'immagine RGB non elaborata.
IMAGE_COUNT: il numero di immagini generate. Valori interi accettati: 1-4. Il valore predefinito è 4.

Metodo HTTP e URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict

Corpo JSON della richiesta:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      "referenceImages": [
        {
          "referenceType": "REFERENCE_TYPE_CONTROL",
          "referenceId": 1,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_CONTROL_IMAGE"
          },
          "controlImageConfig": {
            "controlType": "CONTROL_TYPE",
            "enableControlImageComputation": false
          }
        }
      ]
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

Per inviare la richiesta, scegli una di queste opzioni:

curl

Nota: il seguente comando presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login oppure utilizzando Cloud Shell, che consente di accedere automaticamente all'interfaccia a riga di comando gcloud. Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

PowerShell

Nota: il comando seguente presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login. Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content

La seguente risposta di esempio è per una richiesta con "sampleCount": 2. La risposta restituisce due oggetti di previsione, con i byte dell'immagine generata con codifica base64.

{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Python

Scarabocchia

from google import genai
from google.genai.types import (
    ControlReferenceConfig,
    ControlReferenceImage,
    EditImageConfig,
    Image,
)

client = genai.Client()

# TODO(developer): Update and un-comment below line
# output_gcs_uri = "gs://your-bucket/your-prefix"

# Create a reference image out of an existing scribble image signal
# using https://storage.googleapis.com/cloud-samples-data/generative-ai/image/car_scribble.png
control_reference_image = ControlReferenceImage(
    reference_id=1,
    reference_image=Image(gcs_uri="gs://cloud-samples-data/generative-ai/image/car_scribble.png"),
    config=ControlReferenceConfig(control_type="CONTROL_TYPE_SCRIBBLE"),
)

image = client.models.edit_image(
    model="imagen-3.0-capability-001",
    prompt="an oil painting showing the side of a red car[1]",
    reference_images=[control_reference_image],
    config=EditImageConfig(
        edit_mode="EDIT_MODE_CONTROLLED_EDITING",
        number_of_images=1,
        safety_filter_level="BLOCK_MEDIUM_AND_ABOVE",
        person_generation="ALLOW_ADULT",
        output_gcs_uri=output_gcs_uri,
    ),
)

# Example response:
# gs://your-bucket/your-prefix
print(image.generated_images[0].image.gcs_uri)

Canny edge

from google import genai
from google.genai.types import (
    ControlReferenceConfig,
    ControlReferenceImage,
    EditImageConfig,
    Image,
)

client = genai.Client()

# TODO(developer): Update and un-comment below line
# output_gcs_uri = "gs://your-bucket/your-prefix"

# Create a reference image out of an existing canny edge image signal
# using https://storage.googleapis.com/cloud-samples-data/generative-ai/image/car_canny.png
control_reference_image = ControlReferenceImage(
    reference_id=1,
    reference_image=Image(gcs_uri="gs://cloud-samples-data/generative-ai/image/car_canny.png"),
    config=ControlReferenceConfig(control_type="CONTROL_TYPE_CANNY"),
)

image = client.models.edit_image(
    model="imagen-3.0-capability-001",
    prompt="a watercolor painting of a red car[1] driving on a road",
    reference_images=[control_reference_image],
    config=EditImageConfig(
        edit_mode="EDIT_MODE_CONTROLLED_EDITING",
        number_of_images=1,
        safety_filter_level="BLOCK_MEDIUM_AND_ABOVE",
        person_generation="ALLOW_ADULT",
        output_gcs_uri=output_gcs_uri,
    ),
)

# Example response:
# gs://your-bucket/your-prefix
print(image.generated_images[0].image.gcs_uri)

Inviare una richiesta di personalizzazione controllata di Imagen 2

Immagine di input	Altri parametri	Immagine di output
Immagine di input. Fonte immagine: Alec Cutter su Unsplash.	Prompt: "versione di arte digitale" Prompt negativo: "bianco e nero" Tipo di immagine guida:RGB standard Condizione di controllo:rilevamento dei contorni Scala di controllo di Imagen:0,95
Immagine di input. Fonte immagine: Alec Cutter su Unsplash (rilevamento dei contorni di Canny applicato).	Prompt: "versione di arte digitale" Prompt negativo: "bianco e nero" Tipo di immagine guida: rilevamento dei contorni Scala di controllo di Imagen:0,95

Immagine di input

Altri parametri

Immagine di output

Immagine di input. Fonte immagine: Alec Cutter su Unsplash.

Prompt: "versione di arte digitale"

Prompt negativo: "bianco e nero"

Tipo di immagine guida:RGB standard

Condizione di controllo:rilevamento dei contorni

Scala di controllo di Imagen:0,95

Immagine di input. Fonte immagine: Alec Cutter su Unsplash
(rilevamento dei contorni di Canny applicato).

Prompt: "versione di arte digitale"

Prompt negativo: "bianco e nero"

Tipo di immagine guida: rilevamento dei contorni

Scala di controllo di Imagen:0,95

Utilizza i seguenti esempi per inviare una richiesta di personalizzazione controllata di Imagen 2:

REST

Per saperne di più sull'API Imagen, consulta le seguenti risorse:

Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:

PROJECT_ID: il tuo Google Cloud ID progetto.
TEXT_PROMPT: il prompt di testo che guida le immagini che il modello genera. Questo campo è obbligatorio sia per la generazione che per la modifica.
B64_BASE_IMAGE: L'immagine di base da modificare o di cui aumentare la risoluzione. L'immagine deve essere specificata come stringa di byte con codifica base64. Dimensioni massime: 10 MB.
EDIT_IMAGE_COUNT: il numero di immagini modificate. Valore predefinito: 4.
NEGATIVE_PROMPT: Un prompt negativo per facilitare la generazione delle immagini. Ad esempio: "animali" (rimuove gli animali), "sfocato" (rende l'immagine più nitida), "testo" (rimuove il testo) o "ritagliato" (rimuove le immagini ritagliate).
CONDITION: string. Il tipo di indicatore dell'immagine di controllo fornito. Valori: cannyEdges o scribble.
CONTROL_SCALE: float. L'intensità del segnale dell'immagine di controllo. Valori: 0.0 - 1.0. Valore predefinito: 0.95. Intervallo consigliato: 0.9 - 1.0.
SAMPLING_STEPS: integer. Il numero di passaggi di campionamento. Valori: 1 - 30. Valore predefinito: 16.
COMPUTE_CONDITION_MAP: boolean. Indica se calcolare una mappa delle condizioni dall'immagine di input di base. Se impostato su false, il servizio prevede che l'immagine di input sia uno scarabocchio o bordi di Canny e l'immagine viene fornita direttamente al modello. Se impostato su true, il servizio prevede che l'immagine di input sia un'immagine RGB e calcola i bordi di Canny o le informazioni sugli scarabocchi dall'immagine di input in base a conditionName. Il servizio fornisce quindi la mappa delle condizioni elaborata al modello per la modifica delle immagini. Quando fornisci immagini di scarabocchi, queste devono avere uno sfondo nero e linee bianche che raffigurano l'oggetto da generare. Valore predefinito: false.

Metodo HTTP e URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagen-2.0-edit-preview-0627:predict

Corpo JSON della richiesta:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      "image": {
        "bytesBase64Encoded": "B64_BASE_IMAGE"
      }
    }
  ],
  "parameters": {
    "sampleCount": EDIT_IMAGE_COUNT,
    "negativePrompt": "NEGATIVE_PROMPT",
    "controlPluginConfig":  {
      "conditions": [
        {
          "conditionName": "CONDITION",
          "controlScale": CONTROL_SCALE,
          "samplingSteps": SAMPLING_STEPS,
          "computeConditionMap": COMPUTE_CONDITION_MAP
        }
      ]
    }
  }
}

Per inviare la richiesta, scegli una di queste opzioni:

curl

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagen-2.0-edit-preview-0627:predict"

PowerShell

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagen-2.0-edit-preview-0627:predict" | Select-Object -Expand Content

La seguente risposta di esempio è per una richiesta con "sampleCount": 2. La risposta restituisce due oggetti di previsione, con i byte dell'immagine generata con codifica base64.

{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Utilizzo del prodotto

Per visualizzare gli standard di utilizzo e le limitazioni dei contenuti associati a Imagen su Vertex AI, consulta le linee guida sull'utilizzo.

Versioni modello

Esistono più modelli di generazione di immagini che puoi utilizzare. Per saperne di più, consulta la sezione Modelli Imagen.

Passaggi successivi

Leggi gli articoli su Imagen e altri prodotti di AI generativa su Vertex AI:

La documentazione di Vertex AI non viene più aggiornata

Personalizzazione controllata Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Casi d'uso

Esempi di casi d'uso previsti

Esempi di casi d'uso non previsti

Prima di iniziare

Console

REST

Scrittura di prompt di personalizzazione

Inviare una richiesta di personalizzazione controllata di Imagen 3

REST

curl

PowerShell

Python

Scarabocchia

Canny edge

Inviare una richiesta di personalizzazione controllata di Imagen 2

REST

curl

PowerShell

Utilizzo del prodotto

Versioni modello

Passaggi successivi

Personalizzazione controllata