Veo ti aiuta a generare video utilizzando prompt di testo. Questa guida fornisce le best practice per iniziare a generare video Veo di alta qualità.
Per ulteriori informazioni su come scrivere prompt efficaci, consulta la guida ai prompt per la generazione di video di Veo su Vertex AI.
Utilizzare prompt chiari e specifici
Prompt chiari e diretti che eliminano l'ambiguità aiutano a generare risultati video migliori.
Sconsigliato: "Immagino una scena in cui il protagonista è un po' triste, l'atmosfera è cupa e la videocamera è un po' dal basso, sai?"
Consigliato: "Primo piano dal basso di un uomo con un'espressione cupa. La scena è poco illuminata, trasmettendo un'atmosfera malinconica"
Evitare le virgolette
Per impedire al modello di eseguire il rendering del testo nel video, utilizza i due punti (:) dopo
l'azione dell'oratore per indicare il discorso ed evita di utilizzare le virgolette (").
Sconsigliato: una donna dice: "Mi chiamo Clara".
Consigliato: una donna dice: Mi chiamo Clara.
Utilizzare più proporzioni
Utilizza le proporzioni per aumentare il rendimento del tuo video su più piattaforme. Le diverse piattaforme sono ottimizzate per formati diversi. Comprendere le proporzioni delle tue piattaforme è fondamentale per il marketing e la pubblicità.
Di seguito sono riportati i principali formati e i relativi utilizzi principali:
16:9: chiamato anche "orizzontale" o "widescreen", considerato lo standard per televisori, monitor, la maggior parte dei display video, YouTube, presentazioni e cellulari in modalità orizzontale. Le proporzioni 16:9 sono utili anche per catturare una porzione più ampia dello sfondo, ad esempio paesaggi panoramici.
9:16: chiamato anche verticale o widescreen ruotato. Il formato 9:16 è essenziale per le piattaforme mobile-first come TikTok, Instagram Reels e YouTube Shorts. Le proporzioni 9:16 sono utili anche per ritratti o oggetti alti con un forte orientamento verticale, come edifici, alberi o cascate.
Concentrare i video brevi su una singola scena
Per i video brevi, dedica ogni prompt a un singolo momento specifico. Se provi a concatenare più eventi distinti (A poi B poi C) in un unico prompt per un video breve, spesso il risultato è un video confuso o incompleto.
Sconsigliato: "Un detective trova un indizio in una biblioteca, poi attraversa la città di notte e infine affronta un sospettato in un magazzino"
Consigliato: genera ogni parte come un clip separato:
Clip 1: "primo piano della mano guantata di un detective che spolvera un libro antico in una biblioteca buia, rivelando un simbolo nascosto"
Clip 2: "un'auto che guida di notte in una città illuminata al neon, con la pioggia che scorre sul parabrezza, in stile film noir"
Clip 3: "all'interno di un magazzino buio, un detective si trova di fronte a una figura in controluce, creando un'atmosfera tesa"
Migliorare il workflow con Gemini
Gemini può essere un partner efficace durante l'intero processo di creazione dei video, dall'ideazione alla valutazione.
Prima della creazione: usa Gemini come esperto di prompt
Anziché iniziare da zero, puoi chiedere a Gemini di fungere da suggeritore esperto. Chiedi di perfezionare le tue idee di base in prompt dettagliati pronti per Veo. Ad esempio, puoi dare un'istruzione come la seguente:
"Act as an expert prompter for a generative AI video generation model. Look at
this image, and write a prompt that INSTRUCTION. Ensure your
prompt is comprehensive and detailed."
Sostituisci INSTRUCTION con ulteriori istruzioni per il modello Veo.
Dopo la creazione: usa Gemini come "secondo paio di occhi"
Una volta generato il video, Gemini può valutare l'output finale, confrontarlo con le linee guida dell'azienda o del brand e segnalare eventuali aree potenzialmente problematiche che potrebbero richiedere una revisione umana.
Creare personaggi e voci coerenti
Crea una descrizione dettagliata del personaggio: la descrizione del personaggio è la base per la coerenza. Per garantire la riusabilità e la coerenza della voce, dai al tuo personaggio un nome e uno stile di voce specifico. Poi, crea la descrizione con un ricco insieme di caratteristiche immutabili: corporatura ed età, colore e stile dei capelli, struttura del viso, colore e forma degli occhi e qualsiasi segno distintivo. Puoi utilizzare Gemini per generare una descrizione verbale esaustiva dei tratti del viso del tuo personaggio.
Applica la descrizione in modo coerente: copia e incolla la descrizione completa e invariata del personaggio nel prompt per ogni nuova scena o azione. Modifica solo le parti che descrivono la nuova azione o impostazione. Per migliorare il tuo flusso di lavoro, puoi anche utilizzare Gemini come generatore di scene. Fornisci a Gemini la descrizione finale del personaggio e chiedigli di generare più prompt per le scene.
Utilizza lo stesso parametro seed: per garantire un output visivo, stilistico e vocale coerente in più scene, utilizza lo stesso parametro seed.
Esempio: il seguente video è stato generato utilizzando lo stesso parametro seed e i seguenti prompt. Le descrizioni del personaggio e della voce ripetuti sono in grassetto in ognuno dei seguenti prompt:
Prompt per la scena 1:
"A medium shot, with the camera slowly dollying forward in a dimly lit, grand
Parisian archive. Dust motes dance in a single beam of light from a high window.
Clara, a historian in her early 30s, with observant, dark brown
eyes that hold a quiet intensity. She has chin-length, black hair styled in a
classic bob. She is dressed in a sophisticated, dark navy-blue
wool coat, with a silk scarf patterned with subtle gold and cream designs tied
around her neck. She stands before a large, ancient wooden table, carefully
turning the fragile, yellowed page of a massive, leather-bound book. Her
expression is one of deep concentration. In a voice that is crisp
and clear, with a thoughtful, analytical tone and a standard American
accent, Clara says: It has to be here"
Prompt per la scena 2:
"A wide shot of the Pont des Arts in Paris at twilight, the sky a mix of deep
blue and soft orange. The lights of the city are beginning to twinkle on along
the Seine. Clara, a historian in her early 30s, with observant,
dark brown eyes that hold a quiet intensity. She has chin-length, black hair
styled in a classic bob. She is dressed in a sophisticated, dark
navy-blue wool coat, with a silk scarf patterned with subtle gold and cream
designs tied around her neck. She leans against the railing, looking out at the
water, a small, triumphant smile on her face. She pulls a folded, old map from
her coat pocket and looks down at it. In a voice that is crisp and
clear, with a thoughtful, analytical tone and a standard American
accent, Clara says: I knew it. The path starts from here"
Prompt per la scena 3:
"An eye-level shot in a small, hidden Parisian courtyard, overgrown with ivy and
lit by a single, warm gas lamp. Clara, a historian in her early
30s, with observant, dark brown eyes that hold a quiet intensity. She has
chin-length, black hair styled in a classic bob. She is dressed
in a sophisticated, dark navy-blue wool coat, with a silk scarf patterned with
subtle gold and cream designs tied around her neck. She kneels down and runs her
fingers over an ancient, carved symbol on a stone paver, almost completely
obscured by moss. Her eyes light up with discovery. In a voice
that is crisp and clear, with a thoughtful, analytical tone and a standard
American accent, Clara says: After all these years, I've found
it"
Da immagine a video
Le sezioni seguenti descrivono le best practice importanti da seguire quando utilizzi la funzionalità di conversione da immagine a video.
Utilizzare un'immagine sorgente di alta qualità
Quando utilizzi la funzionalità di conversione da immagine a video, la qualità dell'immagine sorgente è importante. Veo utilizza l'immagine di origine come base per tutto ciò che segue, inclusi i dettagli dei personaggi, l'illuminazione e lo stile artistico generale.
Una fotografia nitida, chiara e ben composta produce un video più coerente e di qualità superiore. Pensa all'immagine di origine come al primo fotogramma del tuo film: più è forte l'inizio, migliore sarà la fine.
Richiedi solo il movimento
L'immagine di origine fornisce già il soggetto, la scena e lo stile. Concentra il prompt sul movimento che vuoi vedere.
Azione non consigliata: descrivi di nuovo il personaggio, lo sfondo o l'illuminazione raffigurati nell'immagine. I prompt ridondanti confondono il modello e portano a risultati scadenti.
Consigliato: richiede il movimento della fotocamera, l'animazione del soggetto e le modifiche ambientali.
Utilizzare termini generali per i personaggi nell'immagine di origine
Nel prompt di movimento, fai riferimento al personaggio con termini generali come "il soggetto", "la donna", "lui", "lei" o "loro".
Dirigere il movimento della videocamera
Puoi dirigere tre tipi di movimento, singolarmente o in combinazione.
Movimento della videocamera: la videocamera si muove, ma la scena è statica. È il modo più semplice e affidabile per aggiungere dinamicità.
- Esempio: "Lento avvicinamento del soggetto."
Animazione del soggetto: il personaggio o l'oggetto principale si muove. Ideale per azioni sottili e realistiche.
- Esempio: "I capelli e i vestiti del personaggio svolazzano leggermente al vento".
Animazione ambientale: lo sfondo o l'atmosfera prendono vita.
- Esempio: "La nebbia si diffonde lentamente nel paesaggio".
Esempio: il seguente video e prompt mostrano l'animazione del soggetto utilizzando un'immagine generata da Imagen 4:

"A sweeping drone-like aerial view starting from ground level and rising to
reveal the entire landscape in epic proportions"
Riepilogo delle best practice
La tabella seguente riepiloga le best practice consigliate in questo documento:
| Argomento | Attività |
|---|---|
| Prompt | |
| Generazione di video | |
| Da immagine a video |
Passaggi successivi
Generare video con Veo su Vertex AI utilizzando i fotogrammi del primo e dell'ultimo video
Comprendere l'AI responsabile e le linee guida per l'utilizzo di Veo su Vertex AI