Veo è il nome del modello che supporta la generazione di video. Veo genera un video da un prompt di testo o un prompt di immagine che fornisci. Per saperne di più su Veo, consulta la panoramica della generazione di video con Veo.
Per esplorare questo modello nella console, consulta la scheda del modello Video Generation
in
Model Garden.
Prova Veo su Vertex AI (Vertex AI Studio)
Modelli supportati
L'API Veo supporta i seguenti modelli:
veo-2.0-generate-001
veo-2.0-generate-exp
veo-2.0-generate-preview
veo-3.0-generate-001
veo-3.0-fast-generate-001
veo-3.0-generate-001
veo-3.0-fast-generate-001
veo-3.1-generate-preview
(anteprima)veo-3.1-fast-generate-preview
(anteprima)
Per maggiori informazioni, vedi Modelli Veo.
Richiesta HTTP
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:predictLongRunning \
-d '{
"instances": [
{
"prompt": string,
"image": {
// Union field can be only one of the following:
"bytesBase64Encoded": string,
"gcsUri": string,
// End of list of possible types for union field.
"mimeType": string
},
"lastFrame": {
// Union field can be only one of the following:
"bytesBase64Encoded": string,
"gcsUri": string,
// End of list of possible types for union field.
"mimeType": string
},
"video": {
// Union field can be only one of the following:
"bytesBase64Encoded": string,
"gcsUri": string,
// End of list of possible types for union field.
"mimeType": string
},
"mask": {
// Union field can be only one of the following:
"bytesBase64Encoded": string,
"gcsUri": string,
// End of list of possible types for union field.
"mimeType": string,
"maskMode": string
},
"referenceImages": [
// A list of up to three asset images or at most one style image for the
// model to use when generating videos.
//
// referenceImages is supported by the following models in Preview:
//
// * veo-2.0-generate-exp
// * veo-3.1-generate-preview
{
"image:" {
// Union field can be only one of the following:
"bytesBase64Encoded": string,
"gcsUri": string,
// End of list of possible types for union field.
"mimeType": string
},
"referenceType": string
}
]
}
],
"parameters": {
"aspectRatio": string,
"compressionQuality": string,
"durationSeconds": integer,
"enhancePrompt": boolean,
"generateAudio": boolean,
"negativePrompt": string,
"personGeneration": string,
"resizeMode": string, // Veo 3 image-to-video only
"resolution": string, // Veo 3 models only
"sampleCount": integer,
"seed": uint32,
"storageUri": string
}
}'
Istanze
Istanze | |
---|---|
|
Obbligatorio per la funzionalità da testo a video. Una stringa di testo per guidare i primi otto secondi del video. Ad esempio:
|
image |
Campo unione
Facoltativo. Un'immagine per guidare la generazione del video, che può essere una stringa |
lastFrame |
Campo unione
Facoltativo. Un'immagine del primo fotogramma di un video per riempire lo spazio
tra un video e l'altro.
|
video |
Campo unione
Facoltativo. Un video generato da Veo da estendere in lunghezza,
che può essere una stringa
|
mask |
Campo unione
Facoltativo. Un'immagine di una maschera da applicare a un video per aggiungere o rimuovere un
oggetto da un video.
|
referenceImages |
Facoltativo. Un elenco di massimo tre immagini di asset o al massimo un'immagine di stile che descrive lo
|
referenceImages.image |
Campo unione
Facoltativo. Contiene le immagini di riferimento per
|
referenceImages.referenceType |
Obbligatorio in un oggetto
|
bytesBase64Encoded |
Una stringa con codifica base64 di byte di un file immagine o video. Utilizzato con i seguenti oggetti: |
gcsUri |
Una stringa URI che indica la posizione di un bucket Cloud Storage. Utilizzato con i seguenti oggetti: |
mimeType |
Obbligatorio per i seguenti oggetti: Specifica il tipo MIME di un video o di un'immagine. Per le immagini, sono accettati i seguenti tipi MIME:
Per i video, sono accettati i seguenti tipi MIME:
|
Parametri
Parametri | |
---|---|
aspectRatio |
Facoltativo. Specifica le proporzioni dei video generati. I seguenti sono valori accettati:
Il valore predefinito è |
compressionQuality |
Facoltativo. Specifica la qualità di compressione dei video generati.
I valori accettati sono
Il valore predefinito è |
durationSeconds |
Obbligatorio. La durata in secondi dei file video che vuoi generare. I valori accettati sono i seguenti:
Per saperne di più, consulta Modelli Veo. |
enhancePrompt |
Facoltativo. Utilizza Gemini per migliorare i tuoi prompt. I valori
accettati sono |
generateAudio |
Obbligatorio per i modelli Veo 3. Genera l'audio per il video. I valori accettati sono
Per saperne di più sui modelli Veo disponibili, consulta Modelli Veo. |
negativePrompt |
Facoltativo. Una stringa di testo che descrive tutto ciò che vuoi scoraggiare il modello a generare. Ad esempio:
|
personGeneration |
Facoltativo. L'impostazione di sicurezza che controlla se è consentita la generazione di persone o volti. Il valore sarà uno dei seguenti:
|
resizeMode |
Facoltativo. Solo modelli Veo 3, utilizzati con |
resolution |
Facoltativo. Solo modelli Veo 3. La risoluzione del video generato. I valori accettati sono |
sampleCount |
Facoltativo. Il numero di video di output richiesti. I valori accettati sono
|
seed |
Facoltativo. Un numero da richiedere per rendere deterministici i video generati. Se aggiungi un numero seed alla richiesta senza modificare altri parametri, il modello produrrà gli stessi video.
L'intervallo accettato è |
storageUri |
Facoltativo. Un URI bucket Cloud Storage per archiviare il video di output, nel formato |
Richieste di esempio
Utilizza i seguenti esempi per creare la tua richiesta di video:
Richiesta di generazione di video da testo
REST
Per testare un prompt di testo utilizzando l'API Vertex AI Veo, invia una richiesta POST all'endpoint del modello del publisher.
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
-
PROJECT_ID
: Una stringa che rappresenta il tuo Google Cloud ID progetto. -
MODEL_ID
: una stringa che rappresenta l'ID modello da utilizzare. I seguenti sono valori accettati:- Veo 2:
"veo-2.0-generate-001"
- Veo 3:
"veo-3.0-generate-001"
- Veo 3:
"veo-3.0-fast-generate-001"
- Veo 3:
"veo-3.0-generate-preview"
(anteprima) - Veo 3:
"veo-3.0-fast-generate-preview"
(anteprima) - Veo 3.1:
"veo-3.1-generate-preview"
- Veo 3.1:
"veo-3.1-fast-generate-preview"
- Veo 2:
-
TEXT_PROMPT
: il prompt di testo utilizzato per guidare la generazione del video. -
OUTPUT_STORAGE_URI
: (Facoltativo) Una stringa che rappresenta il bucket Cloud Storage in cui archiviare i video di output. Se non vengono forniti, i byte video vengono restituiti nella risposta. Ad esempio:"gs://video-bucket/output/"
. -
RESPONSE_COUNT
: Il numero di file video da generare. L'intervallo di valori accettato è1
-4
. -
DURATION
: Un numero intero che rappresenta la durata dei file video generati. Di seguito sono riportati i valori accettati per ogni modello:- Modelli Veo 2:
5
-8
. Il valore predefinito è8
. - Modelli Veo 3:
4
,6
o8
. Il valore predefinito è8
.
- Modelli Veo 2:
-
Parametri facoltativi aggiuntivi
Utilizza le seguenti variabili facoltative a seconda del tuo caso d'uso. Aggiungi alcuni o tutti i seguenti parametri nell'oggetto
"parameters": {}
."parameters": { "aspectRatio": "ASPECT_RATIO", "negativePrompt": "NEGATIVE_PROMPT", "personGeneration": "PERSON_SAFETY_SETTING", // "resolution": RESOLUTION, // Veo 3 models only "sampleCount": RESPONSE_COUNT, "seed": SEED_NUMBER }
-
ASPECT_RATIO
: (Facoltativo) Un valore stringa che descrive le proporzioni dei video generati. Puoi utilizzare i seguenti valori:"16:9"
per l'orientamento orizzontale"9:16"
per il formato verticale
Il valore predefinito è
"16:9"
-
NEGATIVE_PROMPT
: (Facoltativo) un valore stringa che descrive i contenuti che vuoi impedire al modello di generare. -
PERSON_SAFETY_SETTING
: (Facoltativo) Un valore stringa che controlla l'impostazione di sicurezza per la generazione di persone o volti. Puoi utilizzare i seguenti valori:-
"allow_adult"
: consente solo la generazione di persone e volti adulti. -
"disallow"
: Non genera persone o volti.
Il valore predefinito è
"allow_adult"
. -
-
RESOLUTION
: (Facoltativo) Un valore stringa che controlla la risoluzione del video generato. Supportato solo dai modelli Veo 3. Puoi utilizzare i seguenti valori:"720p"
"1080p"
Il valore predefinito è
"720p"
. -
RESPONSE_COUNT
: Facoltativo. Un valore intero che descrive il numero di video da generare. L'intervallo di valori accettato è1
-4
. -
SEED_NUMBER
: Facoltativo. Un valore uint32 che il modello utilizza per generare video deterministici. Se specifichi un numero seed nella richiesta senza modificare altri parametri, il modello genererà gli stessi video. L'intervallo di valori accettati è0
-4294967295
.
-
Metodo HTTP e URL:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning
Corpo JSON della richiesta:
{ "instances": [ { "prompt": "TEXT_PROMPT" } ], "parameters": { "storageUri": "OUTPUT_STORAGE_URI", "sampleCount": "RESPONSE_COUNT" } }
Per inviare la richiesta, scegli una di queste opzioni:
curl
Salva il corpo della richiesta in un file denominato request.json
,
ed esegui questo comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning"
PowerShell
Salva il corpo della richiesta in un file denominato request.json
,
ed esegui questo comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning" | Select-Object -Expand Content
{ "name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/a1b07c8e-7b5a-4aba-bb34-3e1ccb8afcc8" }
Richiesta di generazione di video da immagini
REST
Per testare un prompt di testo utilizzando l'API Vertex AI Veo, invia una richiesta POST all'endpoint del modello del publisher.
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
-
PROJECT_ID
: Una stringa che rappresenta il tuo Google Cloud ID progetto. -
MODEL_ID
: una stringa che rappresenta l'ID modello da utilizzare. I seguenti sono valori accettati:- Veo 2:
veo-2.0-generate-001
- Veo 3:
veo-3.0-generate-001
- Veo 3.1:
veo-3.1-generate-preview
- Veo 3.1:
veo-3.1-fast-generate-preview
- Veo 2:
-
TEXT_PROMPT
: il prompt di testo utilizzato per guidare la generazione del video. -
INPUT_IMAGE
: una stringa codificata in base64 che rappresenta l'immagine di input. Per una qualità ottimale, ti consigliamo che la risoluzione dell'immagine di input sia 720p (1280 x 720 pixel) o superiore e che abbia proporzioni 16:9 o 9:16. Le immagini con altre proporzioni o dimensioni potrebbero essere ridimensionate o ritagliate centralmente al momento del caricamento. -
MIME_TYPE
: una stringa che rappresenta il tipo MIME dell'immagine di input. Sono supportate solo le immagini dei seguenti tipi MIME:"image/jpeg"
"image/png"
-
OUTPUT_STORAGE_URI
: (Facoltativo) Una stringa che rappresenta il bucket Cloud Storage in cui archiviare i video di output. Se non vengono forniti, i byte video vengono restituiti nella risposta. Ad esempio:"gs://video-bucket/output/"
. -
RESIZE_MODE
: una stringa che rappresenta la modalità di ridimensionamento da utilizzare. Sono accettati i seguenti valori:"crop"
: ritaglia il video in modo che si adatti alle nuove dimensioni."pad"
: Aggiungi un riempimento al video per adattarlo alle nuove dimensioni.
-
RESPONSE_COUNT
: Il numero di file video da generare. L'intervallo di valori accettato è1
-4
. -
DURATION
: Un numero intero che rappresenta la durata dei file video generati. Di seguito sono riportati i valori accettati per ogni modello:- Modelli Veo 2:
5
-8
. Il valore predefinito è8
. - Modelli Veo 3:
4
,6
o8
. Il valore predefinito è8
.
- Modelli Veo 2:
-
Parametri facoltativi aggiuntivi
Utilizza le seguenti variabili facoltative a seconda del tuo caso d'uso. Aggiungi alcuni o tutti i seguenti parametri nell'oggetto
"parameters": {}
."parameters": { "aspectRatio": "ASPECT_RATIO", "negativePrompt": "NEGATIVE_PROMPT", "personGeneration": "PERSON_SAFETY_SETTING", // "resolution": RESOLUTION, // Veo 3 models only "sampleCount": RESPONSE_COUNT, "seed": SEED_NUMBER }
-
ASPECT_RATIO
: (Facoltativo) Un valore stringa che descrive le proporzioni dei video generati. Puoi utilizzare i seguenti valori:"16:9"
per l'orientamento orizzontale"9:16"
per il formato verticale
Il valore predefinito è
"16:9"
-
NEGATIVE_PROMPT
: (Facoltativo) un valore stringa che descrive i contenuti che vuoi impedire al modello di generare. -
PERSON_SAFETY_SETTING
: (Facoltativo) Un valore stringa che controlla l'impostazione di sicurezza per la generazione di persone o volti. Puoi utilizzare i seguenti valori:-
"allow_adult"
: consente solo la generazione di persone e volti adulti. -
"disallow"
: Non genera persone o volti.
Il valore predefinito è
"allow_adult"
. -
-
RESOLUTION
: (Facoltativo) Un valore stringa che controlla la risoluzione del video generato. Supportato solo dai modelli Veo 3. Puoi utilizzare i seguenti valori:"720p"
"1080p"
Il valore predefinito è
"720p"
. -
RESPONSE_COUNT
: Facoltativo. Un valore intero che descrive il numero di video da generare. L'intervallo di valori accettato è1
-4
. -
SEED_NUMBER
: Facoltativo. Un valore uint32 che il modello utilizza per generare video deterministici. Se specifichi un numero seed nella richiesta senza modificare altri parametri, il modello genererà gli stessi video. L'intervallo di valori accettati è0
-4294967295
.
-
Metodo HTTP e URL:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning
Corpo JSON della richiesta:
{ "instances": [ { "prompt": "TEXT_PROMPT", "image": { "bytesBase64Encoded": "INPUT_IMAGE", "mimeType": "MIME_TYPE" } } ], "parameters": { "storageUri": "OUTPUT_STORAGE_URI", "sampleCount": RESPONSE_COUNT "resizeMode": "RESIZE_MODE" } }
Per inviare la richiesta, scegli una di queste opzioni:
curl
Salva il corpo della richiesta in un file denominato request.json
,
ed esegui questo comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning"
PowerShell
Salva il corpo della richiesta in un file denominato request.json
,
ed esegui questo comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning" | Select-Object -Expand Content
{ "name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/a1b07c8e-7b5a-4aba-bb34-3e1ccb8afcc8" }
Richiesta video che utilizza le immagini degli asset
REST
Per testare un prompt di testo utilizzando l'API Vertex AI Veo, invia una richiesta POST all'endpoint del modello del publisher.
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
-
PROJECT_ID
: il tuo Google Cloud ID progetto. -
MODEL_ID
: una stringa che rappresenta l'ID modello da utilizzare. I seguenti sono valori accettati:- Veo 2:
veo-2.0-generate-exp
- Veo 3:
veo-3.1-generate-preview
- Veo 2:
-
TEXT_PROMPT
: il prompt di testo utilizzato per guidare la generazione di video. -
BASE64_ENCODED_IMAGE
: un'immagine del soggetto codificata in byte Base64. Puoi ripetere questo campo emimeType
per specificare fino a tre immagini del soggetto. -
IMAGE_MIME_TYPE
: il tipo MIME dell'immagine di input. Solo uno dei seguenti documenti:image/jpeg
image/png
Puoi ripetere questo campo e
bytesBase64Encoded
per specificare fino a tre immagini del soggetto. -
OUTPUT_STORAGE_URI
: (Facoltativo) Il bucket Cloud Storage in cui archiviare i video di output. Se non fornito, nella risposta viene restituito un video codificato in byte Base64. Ad esempio:gs://video-bucket/output/
. -
RESPONSE_COUNT
: il numero di file video che vuoi generare. Valori interi accettati: 1-4. -
Parametri facoltativi aggiuntivi
Utilizza le seguenti variabili facoltative a seconda del tuo caso d'uso. Aggiungi alcuni o tutti i seguenti parametri nell'oggetto
"parameters": {}
."parameters": { "aspectRatio": "ASPECT_RATIO", "negativePrompt": "NEGATIVE_PROMPT", "personGeneration": "PERSON_SAFETY_SETTING", // "resolution": RESOLUTION, // Veo 3 models only "sampleCount": RESPONSE_COUNT, "seed": SEED_NUMBER }
-
ASPECT_RATIO
: (Facoltativo) Un valore stringa che descrive le proporzioni dei video generati. Puoi utilizzare i seguenti valori:"16:9"
per l'orientamento orizzontale"9:16"
per il formato verticale
Il valore predefinito è
"16:9"
-
NEGATIVE_PROMPT
: (Facoltativo) un valore stringa che descrive i contenuti che vuoi impedire al modello di generare. -
PERSON_SAFETY_SETTING
: (Facoltativo) Un valore stringa che controlla l'impostazione di sicurezza per la generazione di persone o volti. Puoi utilizzare i seguenti valori:-
"allow_adult"
: consente solo la generazione di persone e volti adulti. -
"disallow"
: Non genera persone o volti.
Il valore predefinito è
"allow_adult"
. -
-
RESOLUTION
: (Facoltativo) Un valore stringa che controlla la risoluzione del video generato. Supportato solo dai modelli Veo 3. Puoi utilizzare i seguenti valori:"720p"
"1080p"
Il valore predefinito è
"720p"
. -
RESPONSE_COUNT
: Facoltativo. Un valore intero che descrive il numero di video da generare. L'intervallo di valori accettato è1
-4
. -
SEED_NUMBER
: Facoltativo. Un valore uint32 che il modello utilizza per generare video deterministici. Se specifichi un numero seed nella richiesta senza modificare altri parametri, il modello genererà gli stessi video. L'intervallo di valori accettati è0
-4294967295
.
-
Metodo HTTP e URL:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning
Corpo JSON della richiesta:
{ "instances": [ { "prompt": "TEXT_PROMPT", // The following fields can be repeated for up to three total // images. "referenceImages": [ { "image": { "bytesBase64Encoded": "BASE64_ENCODED_IMAGE", "mimeType": "IMAGE_MIME_TYPE" }, "referenceType": "asset" } ] } ], "parameters": { "durationSeconds": 8, "storageUri": "OUTPUT_STORAGE_URI", "sampleCount": RESPONSE_COUNT } }
Per inviare la richiesta, scegli una di queste opzioni:
curl
Salva il corpo della richiesta in un file denominato request.json
,
ed esegui questo comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning"
PowerShell
Salva il corpo della richiesta in un file denominato request.json
,
ed esegui questo comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning" | Select-Object -Expand Content
{ "name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/a1b07c8e-7b5a-4aba-bb34-3e1ccb8afcc8" }
Richiesta video utilizzando un'immagine di stile
REST
Per testare un prompt di testo utilizzando l'API Vertex AI Veo, invia una richiesta POST all'endpoint del modello del publisher.
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
-
PROJECT_ID
: il tuo Google Cloud ID progetto. -
MODEL_ID
: una stringa che rappresenta l'ID modello da utilizzare. Utilizza il seguente valore:veo-2.0-generate-exp
. -
TEXT_PROMPT
: il prompt di testo utilizzato per guidare la generazione di video. -
BASE64_ENCODED_IMAGE
: un'immagine di stile codificata in byte Base64. -
IMAGE_MIME_TYPE
: il tipo MIME dell'immagine di input. Solo uno dei seguenti:image/jpeg
image/png
-
OUTPUT_STORAGE_URI
: (Facoltativo) Il bucket Cloud Storage in cui archiviare i video di output. Se non forniti, i byte del video vengono restituiti nella risposta. Ad esempio:gs://video-bucket/output/
. -
RESPONSE_COUNT
: il numero di file video che vuoi generare. Valori interi accettati: 1-4. -
Parametri facoltativi aggiuntivi
Utilizza le seguenti variabili facoltative a seconda del tuo caso d'uso. Aggiungi alcuni o tutti i seguenti parametri nell'oggetto
"parameters": {}
."parameters": { "aspectRatio": "ASPECT_RATIO", "negativePrompt": "NEGATIVE_PROMPT", "personGeneration": "PERSON_SAFETY_SETTING", // "resolution": RESOLUTION, // Veo 3 models only "sampleCount": RESPONSE_COUNT, "seed": SEED_NUMBER }
-
ASPECT_RATIO
: (Facoltativo) Un valore stringa che descrive le proporzioni dei video generati. Puoi utilizzare i seguenti valori:"16:9"
per l'orientamento orizzontale"9:16"
per il formato verticale
Il valore predefinito è
"16:9"
-
NEGATIVE_PROMPT
: (Facoltativo) un valore stringa che descrive i contenuti che vuoi impedire al modello di generare. -
PERSON_SAFETY_SETTING
: (Facoltativo) Un valore stringa che controlla l'impostazione di sicurezza per la generazione di persone o volti. Puoi utilizzare i seguenti valori:-
"allow_adult"
: consente solo la generazione di persone e volti adulti. -
"disallow"
: Non genera persone o volti.
Il valore predefinito è
"allow_adult"
. -
-
RESOLUTION
: (Facoltativo) Un valore stringa che controlla la risoluzione del video generato. Supportato solo dai modelli Veo 3. Puoi utilizzare i seguenti valori:"720p"
"1080p"
Il valore predefinito è
"720p"
. -
RESPONSE_COUNT
: Facoltativo. Un valore intero che descrive il numero di video da generare. L'intervallo di valori accettato è1
-4
. -
SEED_NUMBER
: Facoltativo. Un valore uint32 che il modello utilizza per generare video deterministici. Se specifichi un numero seed nella richiesta senza modificare altri parametri, il modello genererà gli stessi video. L'intervallo di valori accettati è0
-4294967295
.
-
Metodo HTTP e URL:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning
Corpo JSON della richiesta:
{ "instances": [ { "prompt": "TEXT_PROMPT", "referenceImages": [ { "image": { "bytesBase64Encoded": "BASE64_ENCODED_IMAGE", "mimeType": "IMAGE_MIME_TYPE" }, "referenceType": "style" } ] } ], "parameters": { "durationSeconds": 8, "storageUri": "OUTPUT_STORAGE_URI", "sampleCount": RESPONSE_COUNT } }
Per inviare la richiesta, scegli una di queste opzioni:
curl
Salva il corpo della richiesta in un file denominato request.json
,
ed esegui questo comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning"
PowerShell
Salva il corpo della richiesta in un file denominato request.json
,
ed esegui questo comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning" | Select-Object -Expand Content
{ "name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/a1b07c8e-7b5a-4aba-bb34-3e1ccb8afcc8" }
Estrai lo stato dell'operazione a lunga esecuzione di generazione video
Controlla lo stato dell'operazione a lunga esecuzione di generazione del video.
REST
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- PROJECT_ID: il tuo Google Cloud ID progetto.
- MODEL_ID: l'ID modello da utilizzare.
- OPERATION_ID: L'ID operazione univoco restituito nella richiesta di generazione video originale.
Metodo HTTP e URL:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:fetchPredictOperation
Corpo JSON della richiesta:
{ "operationName": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/OPERATION_ID" }
Per inviare la richiesta, scegli una di queste opzioni:
curl
Salva il corpo della richiesta in un file denominato request.json
,
ed esegui questo comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:fetchPredictOperation"
PowerShell
Salva il corpo della richiesta in un file denominato request.json
,
ed esegui questo comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:fetchPredictOperation" | Select-Object -Expand Content
Corpo della risposta (richiesta di generazione video)
L'invio di una richiesta di conversione da testo a video o da immagine a video restituisce la seguente risposta:
{
"name": string
}
Elemento di risposta | Descrizione |
---|---|
name |
Il nome completo dell'operazione a lunga esecuzione che inizia dopo l'invio di una richiesta di generazione di video. |
Esempio di risposta (richiesta di generazione video)
{
"name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/OPERATION_ID"
}
Corpo della risposta (polling su operazione a lunga esecuzione)
Il polling dello stato dell'operazione a lunga esecuzione di generazione del video originale restituisce una risposta simile alla seguente:
{
"name": string,
"done": boolean,
"response":{
"@type":"type.googleapis.com/cloud.ai.large_models.vision.GenerateVideoResponse",
"raiMediaFilteredCount": integer,
"videos":[
{
"gcsUri": string,
"mimeType": string
},
{
"gcsUri": string,
"mimeType": string
},
{
"gcsUri": string,
"mimeType": string
},
{
"gcsUri": string,
"mimeType": string
},
]
}
}
Elemento di risposta | Descrizione |
---|---|
bytesBase64Encoded |
Una stringa con codifica Base64 che rappresenta l'oggetto video. |
done |
Un valore booleano che indica se l'operazione è completata. |
encoding |
Il tipo di codifica video. |
gcsUri |
L'URI Cloud Storage del video generato. |
name |
Il nome completo dell'operazione a lunga esecuzione che inizia dopo l'invio di una richiesta di generazione di video. |
raiMediaFilteredCount |
Restituisce un conteggio dei video che Veo ha filtrato a causa di
norme sull'AI responsabile. Se non vengono filtrati video, il conteggio restituito è
0 .
|
raiMediaFilteredReasons |
Elenca i motivi per cui i video filtrati da Veo sono stati esclusi a causa delle norme sull'AI responsabile. Per ulteriori informazioni, consulta Categorie di codici del filtro di sicurezza. |
response |
Il corpo della risposta dell'operazione a lunga esecuzione. |
video |
Il video generato. |
Esempio di risposta (polling su operazione a lunga esecuzione)
{
"name": "projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/OPERATION_ID",
"done":true,
"response":{
"@type":"type.googleapis.com/cloud.ai.large_models.vision.GenerateVideoResponse",
"raiMediaFilteredCount": 0,
"videos":[
{
"gcsUri":"gs://STORAGE_BUCKET/TIMESTAMPED_SUBDIRECTORY/sample_0.mp4",
"mimeType":"video/mp4"
},
{
"gcsUri":"gs://STORAGE_BUCKET/TIMESTAMPED_SUBDIRECTORY/sample_1.mp4",
"mimeType":"video/mp4"
},
{
"gcsUri":"gs://STORAGE_BUCKET/TIMESTAMPED_SUBDIRECTORY/sample_2.mp4",
"mimeType":"video/mp4"
},
{
"gcsUri":"gs://STORAGE_BUCKET/TIMESTAMPED_SUBDIRECTORY/sample_3.mp4",
"mimeType":"video/mp4"
}
]
}
}
Ulteriori informazioni
- Per saperne di più sull'utilizzo di Veo su Vertex AI, consulta Generare video utilizzando prompt di testo e immagini con Veo.
Passaggi successivi
- Leggi le informazioni di Google DeepMind sul modello Veo.
- Leggi il post del blog "Veo e Imagen 3: annunciati nuovi modelli di generazione di video e immagini su Vertex AI".
- Leggi il post del blog "New generative media models and tools, built with and for creators".