Prova la generazione di immagini (Vertex AI Studio)
Prova Imagen in un blocco note Colab Imagen su Vertex AI offre uno strumento di riscrittura del prompt basato su LLM, noto anche come riscrittore di prompt. Il riscrittore di prompt ti aiuta a ottenere immagini di output di qualità superiore aggiungendo più dettagli al prompt.
Se disattivi il riscrittore di prompt, la qualità delle immagini e la somiglianza dell'output al prompt fornito potrebbero risentirne. Questa funzionalità è attivata per impostazione predefinita per le seguenti versioni del modello:
-
imagen-3.0-generate-002 -
imagen-4.0-generate-001 -
imagen-4.0-fast-generate-001 -
imagen-4.0-ultra-generate-001
Il prompt riscritto viene fornito dalla risposta dell'API solo se il prompt originale contiene meno di 30 parole.
Utilizzare il riscrittore di prompt
Per utilizzare il riscrittore di prompt:
Console
Nella Google Cloud console, vai alla pagina Vertex AI > Media Studio.
Fai clic su Imagen. Viene visualizzata la pagina di generazione di immagini di Imagen Media Studio.
Nel riquadro Impostazioni, modifica le seguenti opzioni:
Modello: scegli un modello tra le opzioni disponibili.
Per ulteriori informazioni sui modelli disponibili, consulta Modelli Imagen
Numero di risultati: regola il cursore o inserisci un valore compreso tra 1 e 4.
Nella casella Prompt negativo, inserisci un prompt che descriva ciò che non vuoi generare nell'immagine.
Nella casella Scrivi il prompt, fai clic su Aiutami a scrivere.
Viene visualizzata la finestra Migliora il mio prompt.
Nella casella Prompt attuale , scrivi il prompt e fai clic su Migliora.
Il prompt riscritto viene visualizzato nella casella Prompt migliorato. Puoi modificare il prompt migliorato o utilizzarlo così com'è.
Fai clic su Inserisci per utilizzare il prompt visualizzato.
Il prompt viene inserito nella casella Scrivi il prompt.
Fai clic su Genera.
REST
Per ulteriori informazioni sull'API Imagen, consulta:
- Metodo:
endpoints.predict VisionGenerativeModelInstanceVisionGenerativeModelParamsVisionGenerativeModelResult
Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:
- PROJECT_ID: il tuo Google Cloud ID progetto.
- MODEL_VERSION: la versione del modello di generazione di immagini da utilizzare.
Per ulteriori informazioni sulle versioni e sulle funzionalità dei modelli, consulta Versioni dei modelli.
- LOCATION: la regione del tuo progetto. Ad esempio,
us-central1,europe-west2oasia-northeast3. Per un elenco delle regioni disponibili, consulta Località dell'AI generativa su Vertex AI. Quando viene utilizzato un endpoint API regionale, la regione dell'URL dell'endpoint determina dove viene elaborata la richiesta e questoLOCATIONnel percorso della risorsa viene ignorato in caso di conflitto. - TEXT_PROMPT: il prompt di testo che guida le immagini che il modello genera. Prima della generazione delle immagini, questo prompt di base viene migliorato con maggiori dettagli e un linguaggio descrittivo utilizzando lo strumento di riscrittura del prompt basato su LLM tool.
-
IMAGE_COUNT: un numero intero che descrive il numero di immagini da
generare. I valori accettati sono
1-4. Il valore predefinito è4. -
PROMPT_SETTING: un valore booleano,
trueattiva i prompt avanzati efalseli disattiva. Il valore predefinito ètrue.
Metodo HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict
Corpo JSON della richiesta:
{
"instances": [
{
"prompt": "TEXT_PROMPT"
}
],
"parameters": {
"sampleCount": IMAGE_COUNT,
"enhancePrompt": PROMPT_SETTING
}
}
Per inviare la richiesta, scegli una di queste opzioni:
curl
Salva il corpo della richiesta in un file denominato request.json,
quindi esegui il comando seguente:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"
PowerShell
Salva il corpo della richiesta in un file denominato request.json,
e quindi esegui il comando seguente:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
prompt aggiuntivo che mostra il prompt migliorato e l'immagine generata associata:
{ "predictions": [ { "mimeType": "MIME_TYPE", "prompt": "ENHANCED_PROMPT_1", "bytesBase64Encoded": "BASE64_IMG_BYTES_1" }, { "mimeType": "MIME_TYPE", "prompt": "ENHANCED_PROMPT_2", "bytesBase64Encoded": "BASE64_IMG_BYTES_2" } ] }
Ad esempio, la seguente risposta di esempio si riferisce a una richiesta con
"sampleCount": 2 e "prompt": "A raccoon wearing formal
clothes, wearing a top hat. Oil painting in the style of Vincent Van
Gogh.". La risposta restituisce due oggetti di previsione, ognuno con il prompt migliorato e i byte dell'immagine generata codificati in base64.
{
"predictions": [
{
"mimeType": "image/png",
"prompt": "An oil painting in the style of Vincent van Gogh,
depicting a raccoon adorned in a finely tailored tuxedo, complete with a
crisp white shirt and a bow tie. The raccoon also sports a classic top
hat, perched jauntily on its head. The painting uses thick, swirling
brushstrokes characteristic of van Gogh, with vibrant hues of blue,
yellow, and green in the background, contrasting with the dark tones of
the raccoon's attire. The light source is subtly placed, casting a
dramatic shadow of the raccoon's attire onto the surface it sits upon,
further enhancing the depth and dimensionality of the composition. The
overall impression is one of a whimsical and sophisticated character, a
raccoon elevated to a higher class through its formal attire, rendered
in van Gogh's iconic style.",
"bytesBase64Encoded": "BASE64_IMG_BYTES"
},
{
"mimeType": "image/png",
"prompt": "An oil painting in the style of Vincent van Gogh featuring
a raccoon in a dapper suit, complete with a black jacket, crisp white
shirt, and a black bow tie. The raccoon is wearing a black top hat,
adding a touch of elegance to its ensemble. The painting is rendered
with characteristic van Gogh brushwork, utilizing thick, impasto strokes
of color. The background is a swirl of blues, greens, and yellows,
creating a vibrant yet slightly chaotic atmosphere that contrasts with
the raccoon's formal attire. The lighting is dramatic, casting sharp
shadows and highlighting the textures of the fabric and the raccoon's
fur, enhancing the sense of realism within the fantastical scene. The
composition focuses on the raccoon's proud posture, highlighting the
whimsical contrast of a wild animal dressed in formal attire, captured
in the unique artistic language of van Gogh. ",
"bytesBase64Encoded": "BASE64_IMG_BYTES"
}
]
}
Passaggi successivi
- Impostare la lingua del prompt di testo
- Configurare le proporzioni
- Omettere i contenuti utilizzando un prompt negativo
- Generare immagini deterministiche