Veo in Vertex AI: Leitfaden für Prompts zur Videogenerierung

Mit Veo können Sie durch Text-Prompts unzählige Anpassungen vornehmen. In diesem Leitfaden wird erläutert, wie Sie Ihre Veo-Prompts ändern können, um unterschiedliche Ergebnisse und Effekte zu erzielen.

Weitere Informationen zu Best Practices finden Sie unter Best Practices für Veo in Vertex AI.

Sicherheitsfilter

Veo wendet Sicherheitsfilter in Vertex AI an, um sicherzustellen, dass generierte Videos und hochgeladene Fotos keine anstößigen Inhalte enthalten. Prompts, die gegen die Richtlinien für verantwortungsbewusste KI verstoßen, werden beispielsweise blockiert.

Wenn Sie einen mutmaßlichen Missbrauch von Veo oder eine generierte Ausgabe mit unangemessenen oder ungenauen Informationen vermuten, verwenden Sie das Formular Einen mutmaßlichen Missbrauch in Google Cloudmelden.

Aufbau eines Veo-Prompts

Wenn Sie mit Veo Videos generieren, helfen die richtigen Keywords und die richtige Prompt-Struktur dem Modell, die gewünschten Inhalte zu generieren. Wenn Sie Ihre Idee in Schlüsselkomponenten unterteilen, können Sie Veo am effektivsten in die gewünschte Richtung lenken.

In den folgenden Abschnitten wird erläutert, wie Sie Schlüsselelemente und ‑wörter in Ihren Prompts verwenden, um Veo beim Generieren von Videos zu unterstützen.

Sie müssen nicht alle Elemente in jedem Prompt verwenden. Wenn Sie jedoch wissen, wie die einzelnen Elemente funktionieren, können Sie sie effektiv in Ihren Veo-Prompts einsetzen.

Betreff

Das Subjekt ist das „Wer“ oder „Was“, um das sich die Handlung des generierten Videos dreht. Spezifität hilft, allgemeine Ausgaben zu vermeiden.

Hier sind einige Beispiele für Themen, die Sie verwenden können:

  • Personen:

    • Generische Begriffe: Mann, Frau, ältere Person

    • Bestimmte Berufe: „ein erfahrener Detektiv“, „ein fröhlicher Bäcker“, „ein futuristischer Astronaut“

    • Historische Persönlichkeiten

    • Fabelwesen: „eine schelmische Fee“, „ein stoischer Ritter“

  • Tiere oder Lebewesen:

    • Bestimmte Tierrassen: „ein verspielter Golden Retriever-Welpe“, „ein majestätischer Weißkopfseeadler“, „ein schlanker schwarzer Panther“

    • Fabelwesen: „ein Miniaturdrache mit schillernden Schuppen“, „ein weiser, uralter sprechender Baum“

  • Objekte:

    • Alltagsgegenstände: „eine alte Schreibmaschine“, „eine dampfende Tasse Kaffee“, „ein abgenutztes ledergebundenes Buch“

    • Fahrzeuge: „ein klassisches Muscle Car aus den 1960er-Jahren“, „ein futuristisches Luftkissenfahrzeug“, „ein verwittertes Piratenschiff“

    • Abstrakte Formen: „leuchtende Kugeln“, „kristalline Strukturen“

Sie können Personen, Tiere, Objekte oder eine beliebige Kombination davon im selben Video kombinieren, z. B. „Eine Gruppe verschiedener Freunde lacht am Lagerfeuer, während ein neugieriger Fuchs aus dem Schatten zusieht“ oder „Eine geschäftige Marktszene mit Verkäufern und Käufern“.

Beispiel: Im folgenden Video und Prompt werden komplexe Details mit mehreren Motiven demonstriert:

"A hyper-realistic, cinematic portrait of a wise, androgynous shaman of
indeterminate age. Their weathered skin is etched with intricate, bioluminescent
circuit-like tattoos that pulse with a soft, cyan light. They are draped in
ceremonial robes woven from dark moss and shimmering, metallic fiber-optic
threads. In one hand, they hold a gnarled wooden staff entwined with glowing
energy conduits and topped with a floating, crystalline artifact. Perched on
their shoulder is a small, mechanical owl with holographic wings and camera-lens
eyes that blink with a soft, red light. Their expression is serene and ancient,
eyes holding a deep, knowing look"

Aktion

Aktionen beschreiben das „Verb“ deines Videos, also was passiert. Action erweckt das Motiv zum Leben und beschreibt Bewegungen, Interaktionen und subtile Ausdrücke.

Hier sind einige Beispiele für Aktionen, die Sie verwenden können:

  • Grundlegende Bewegungen: Gehen, Laufen, Springen, Fliegen, Schwimmen, Tanzen, Drehen, Fallen, Stehen, Sitzen

  • Interaktionen: Sprechen, Lachen, Streiten, Umarmen, Kämpfen, Spielen, Kochen, Bauen, Schreiben, Lesen, Beobachten

  • Emotionale Ausdrücke: Lächeln, Stirnrunzeln, Überraschung, tiefe Konzentration, Nachdenklichkeit, Aufregung, Weinen

  • Subtile Aktionen: Eine sanfte Brise, die das Haar zerzaust, raschelnde Blätter, ein dezentes Nicken, ungeduldig klopfende Finger, langsam blinzelnde Augen

  • Transformationen oder Prozesse: eine Blume, die im Zeitraffer blüht, Eis, das schmilzt, eine Stadt, die sich im Laufe der Zeit entwickelt (beachten Sie jedoch die Clip-Länge bei Ereignissen, die über einen längeren Zeitraum stattfinden)

Beispiel Im folgenden Video und Prompt wird gezeigt, wie eine Geschichte durch die Abfolge von Aktionen und emotionalen Veränderungen inszeniert wird:

"A gloved hand carefully slices open the spine of an ancient, leather-bound book
with a scalpel. The hand then delicately extracts a tiny, metallic data chip
hidden within the binding. The character's eyes, previously focused and calm,
widen in a flash of alarm as a floorboard creaks off-screen. They quickly palm
the chip, their head snapping up to scan the dimly lit room, their body tense
and listening for any other sound"

Szene oder Kontext

Die Szene oder der Kontext beschreibt das „Wo“ und das „Wann“ Ihres Videos. Das ist die Umgebung, in der sich das Motiv befindet und die die Stimmung und Atmosphäre des Videos bestimmt.

Hier sind einige Beispiele für Szenen oder Kontext, die Sie verwenden können:

  • Ort (Innenbereich): ein gemütliches Wohnzimmer mit knisterndem Kamin, ein steriles futuristisches Labor, ein unaufgeräumtes Künstleratelier, ein großer Ballsaal, ein staubiger Dachboden

  • Ort (außen): ein sonnenverwöhnter tropischer Strand, ein nebliger alter Wald, eine geschäftige futuristische Stadtlandschaft bei Nacht, ein ruhiger Berggipfel bei Sonnenaufgang, ein einsamer fremder Planet

  • Tageszeit: Goldene Stunde, Mittagssonne, Dämmerung, tiefe Nacht, vor Sonnenaufgang

  • Wetter: klarer blauer Himmel, bewölkt und trüb, leichter Nieselregen, schweres Gewitter mit sichtbaren Blitzen, leichter Schneefall, wirbelnder Nebel

  • Historische oder fantastische Epoche: ein mittelalterlicher Burghof, ein Jazzclub aus den 1920er-Jahren, eine Cyberpunk-Gasse, eine Lichtung in einem verwunschenen Wald

  • Atmosphärische Details: schwebende Staubpartikel in einem Sonnenstrahl, flimmernde Hitzewelle, Spiegelungen auf nassem Pflaster, vom Wind verstreute Blätter

Beispiel: Im folgenden Video wird gezeigt, wie eine immersive Welt erstellt wird:

"The scene is a rain-slicked, crumbling street in a forgotten city, shrouded in
perpetual twilight. Giant, bioluminescent mushrooms have sprouted from the
cracked asphalt, casting an eerie, pulsating green and purple glow onto the
decaying facades of skeletal skyscrapers. A gentle, constant rain creates
shimmering reflections in the puddles below, and the only sounds are the soft
patter of rain and a low, otherworldly hum from the glowing fungi"

Kameraperspektiven

Kamerawinkel bestimmen den Blickwinkel der Aufnahme und beeinflussen direkt, wie das Publikum das Motiv wahrnimmt.

Wichtig:Einige erweiterte Kameraeinstellungen werden nicht offiziell unterstützt. Die Ergebnisse und die Zuverlässigkeit können je nach dem gesamten Prompt und Ihrem spezifischen Anwendungsfall variieren.

Hier sind einige Beispiele für Kameraeinstellungen, die Sie verwenden können:

  • Aufnahme auf Augenhöhe: Bietet eine neutrale, gängige Perspektive, als würde man aus menschlicher Höhe schauen. Beispiel: „Auf Augenhöhe aufgenommenes Foto einer Frau, die Tee trinkt.“

  • Aufnahme aus der Froschperspektive: Die Kamera wird unter dem Motiv positioniert und nach oben gerichtet, wodurch das Motiv mächtig oder imposant wirkt. Beispiel: „Tracking-Aufnahme aus der Froschperspektive von einem Superhelden, der landet.“

  • Aufnahme aus der Vogelperspektive: Die Kamera wird über dem Motiv positioniert und blickt nach unten. Das Motiv kann dadurch klein, verletzlich oder Teil eines größeren Musters wirken. Beispiel: „Aufnahme aus der Vogelperspektive eines Kindes, das sich in einer Menschenmenge verirrt hat.“

  • Vogelperspektive oder Aufnahme von oben: Eine Aufnahme, die direkt von oben gemacht wird und eine kartenähnliche Perspektive der Szene bietet. Zum Beispiel: „Vogelperspektive einer belebten Kreuzung in einer Stadt“.

  • Froschperspektive: Eine Aufnahme aus einem sehr niedrigen Winkel, bei der direkt nach oben fotografiert wird. Dadurch werden Höhe und Erhabenheit betont. Zum Beispiel: „Froschperspektive von hoch aufragenden Wolkenkratzern“.

  • Schräger Winkel: Die Kamera ist zur Seite geneigt, wodurch eine schiefe Horizontlinie entsteht. Dies wird häufig verwendet, um Unbehagen, Orientierungslosigkeit oder Dynamik zu vermitteln. Beispiel: „Kameraeinstellung im Dutch Angle einer Figur, die einen Flur entlangläuft.“

  • Nahaufnahme: Das Motiv wird eng eingerahmt, wobei der Fokus in der Regel auf dem Gesicht liegt, um Emotionen oder ein bestimmtes Detail hervorzuheben. Beispiel: „Nahaufnahme der entschlossenen Augen einer Figur“.

  • Extreme Nahaufnahme: Hier wird ein sehr kleines Detail des Motivs isoliert, z. B. ein Auge oder ein Wassertropfen. Beispiel: „Extreme Nahaufnahme eines Wassertropfens, der auf einem Blatt landet.“

  • Halbnahaufnahme: Das Motiv wird etwa ab der Hüfte aufwärts gezeigt. Dabei wird ein Gleichgewicht zwischen Detail und Umgebungskontext geschaffen. Wird häufig für Dialoge verwendet. Zum Beispiel: „Halbnahaufnahme von zwei Personen, die sich unterhalten.“

  • Ganzkörperaufnahme oder Weitwinkelaufnahme: Das gesamte Motiv ist von Kopf bis Fuß zu sehen, wobei auch ein Teil der Umgebung sichtbar ist. Beispiel: „Ganzkörperaufnahme eines Tänzers bei einer Aufführung“.

  • Weitwinkelaufnahme oder Einstellungsaufnahme: Das Motiv wird in seiner Umgebung gezeigt. Diese Aufnahme wird oft verwendet, um zu Beginn einer Sequenz den Ort und den Kontext zu verdeutlichen. Beispiel: „Weitwinkelaufnahme einer einsamen Hütte in einer verschneiten Landschaft“.

  • Über-die-Schulter-Aufnahme: Die Aufnahme wird hinter einer Person gefilmt, wobei über ihre Schulter auf eine andere Person oder ein anderes Objekt geblickt wird. Diese Aufnahme ist bei Gesprächen üblich. Beispiel: „Über-die-Schulter-Aufnahme während einer angespannten Verhandlung.“

  • Subjektive Kameraeinstellung: Die Szene wird aus der direkten visuellen Perspektive einer Figur gezeigt, als würde das Publikum durch ihre Augen sehen. Beispiel: „POV-Aufnahme von jemandem, der Achterbahn fährt.“

Beispiel: Im folgenden Video und Prompt wird ein Kamerawinkel aus der Vogelperspektive demonstriert:

"A bird's-eye view of a vast, intricate maze made of high green hedges. A lone
figure in a red coat is visible, moving through the labyrinthine paths below"

Beispiel: Im folgenden Video und Prompt wird ein extremer Nahaufnahmewinkel demonstriert:

"An extreme close-up of a single, glistening drop of rain as it lands on the
petal of a vibrant red rose, causing the petal to tremble slightly"

Kamerabewegungen

Die Kamerabewegungen sorgen für mehr Dynamik und ein kinoreifes Erlebnis.

Im Folgenden finden Sie Beispiele für Kamerabewegungen, die Sie verwenden können:

  • Statische Aufnahme: Die Kamera bleibt vollkommen still, es gibt keine Bewegung. Beispiel: „Statisches Bild einer ruhigen Landschaft“.

  • Schwenken (links/rechts): Die Kamera wird horizontal nach links oder rechts gedreht. Beispiel: „Langsame Schwenkung nach links über eine Skyline bei Sonnenuntergang.“

  • Neigen (hoch/runter): Die Kamera wird vertikal nach oben oder unten gedreht. Beispiel: „Kamera schwenkt vom schockierten Gesicht der Figur nach unten zum Brief in ihren Händen.“

  • Dolly (in/out) (Kamerafahrt): Die Kamera wird physisch näher an das Motiv herangeführt oder davon weg bewegt. Beispiel: „Fahre mit der Kamera von der Figur weg, um ihre Isolation zu betonen.“

  • Kamerafahrt (links/rechts): Die Kamera wird horizontal (seitwärts) nach links oder rechts bewegt, oft parallel zum Motiv oder zur Szene. Beispiel: „Kamerafahrt nach rechts, die einer Person folgt, die auf einem belebten Bürgersteig geht.“

  • Sockel (auf/ab): Die Kamera wird vertikal nach oben oder unten bewegt, wobei die Perspektive beibehalten wird. Beispiel: „Kamera schwenkt nach oben, um die volle Höhe eines uralten, hoch aufragenden Baums zu zeigen.“

  • Zoomen (ein/aus): Das Objektiv der Kamera ändert seine Brennweite, um das Motiv zu vergrößern oder zu verkleinern. Das unterscheidet sich von einem Dolly, da sich die Kamera selbst nicht bewegt. Beispiel: „Langsame Vergrößerung eines mysteriösen Artefakts auf einem Tisch.“

  • Kranaufnahme: Die Kamera ist auf einem Kran montiert und bewegt sich vertikal (nach oben oder unten) oder in weiten Bögen. Sie wird häufig für dramatische Enthüllungen oder Perspektiven aus der Vogelperspektive verwendet. Beispiel: „Kranaufnahme eines riesigen mittelalterlichen Schlachtfelds“.

  • Luftaufnahme oder Drohnenaufnahme: Eine Aufnahme aus großer Höhe, in der Regel mit einem Flugzeug oder einer Drohne, oft mit sanften, fließenden Bewegungen. „Weitläufige Luftaufnahme einer tropischen Inselkette.“

  • Handkamera oder Shaky Cam: Die Kamera wird vom Kameramann gehalten, was zu weniger stabilen, oft ruckartigen Bewegungen führt, die Realismus, Unmittelbarkeit oder Unbehagen vermitteln können. Beispiel: „Mit einer Handkamera aufgenommene Szene einer chaotischen Verfolgungsjagd auf einem Marktplatz.“

  • Schwenk: Ein extrem schneller Schwenk, der das Bild verschwimmen lässt. Er wird häufig als Übergang oder zur Darstellung von schnellen Bewegungen oder Desorientierung verwendet. Zum Beispiel: „Schwenk von einem streitenden Charakter zum anderen.“

  • Bogenaufnahme: Die Kamera bewegt sich in einem kreisförmigen oder halbkreisförmigen Pfad um das Motiv herum. Beispiel: „Bogenförmige Aufnahme eines Paares, das sich im Regen umarmt.“

Beispiel: Das folgende Video und der Prompt zeigen eine Zoom-in-Kamerabewegung:

"A slow, dramatic zoom in on a mysterious, ancient compass lying on a dusty map.
The camera starts wide, showing the map and a flickering candle, then smoothly
zooms in until the intricate, glowing symbols on the compass face fill the
entire frame"

Beispiel: Im folgenden Video und Prompt wird eine Luftaufnahme mit einer Drohnenkamera gezeigt:

"Sweeping aerial drone shot flying over a tropical island chain"

Objektiv- und optische Effekte

Objektive und optische Effekte verändern die Art und Weise, wie die Kamera die Welt „sieht“. Mit Objektiv- und optischen Effekten können Sie Ihren Videos einen professionellen Touch und stilistischen Flair verleihen.

Wichtig:Einige fortschrittliche Kameraobjektive werden nicht offiziell unterstützt. Die Ergebnisse und die Zuverlässigkeit können je nach dem gesamten Prompt und Ihrem spezifischen Anwendungsfall variieren.

Hier sind einige Beispiele für Objektiv- und optische Effekte, die Sie verwenden können:

  • Weitwinkelobjektiv: Erfasst ein breiteres Sichtfeld als ein Standardobjektiv. Sie kann die Perspektive übertreiben, sodass Elemente im Vordergrund größer erscheinen und ein Gefühl von Größe oder, bei näheren Entfernungen, Verzerrung entsteht. Beispiel: „Weitwinkelaufnahme des Inneren einer prächtigen Kathedrale, die die hohen Bögen hervorhebt.“

  • Teleobjektiv: Verengt das Sichtfeld und komprimiert die Perspektive, sodass entfernte Motive näher erscheinen. Außerdem wird das Motiv oft durch eine geringe Schärfentiefe isoliert. Beispiel: „Mit einem Teleobjektiv aufgenommenes Bild eines Adlers, der vor einer Bergkette in der Ferne fliegt.“

  • Geringe Schärfentiefe: Ein optischer Effekt, bei dem nur eine schmale Ebene des Bildes scharf fokussiert ist, während der Vordergrund oder der Hintergrund verschwommen ist. Die ästhetische Qualität dieser Unschärfe wird als „Bokeh“ bezeichnet. Beispiel: „Porträt eines Mannes mit geringer Schärfentiefe, dessen Gesicht scharf vor einem weich verschwommenen Parkhintergrund mit schönem Bokeh zu sehen ist.“

  • Große Schärfentiefe: Die meisten oder alle Teile des Bildes, vom Vorder- bis zum Hintergrund, sind scharf fokussiert. Ein Beispiel: „Landschaftsszene mit großer Schärfentiefe, die scharfe Details von den Wildblumen im unmittelbaren Vordergrund bis zu den fernen Bergen zeigt.“

  • Blendenflecken: Ein Effekt, der entsteht, wenn eine helle Lichtquelle direkt auf das Kameraobjektiv trifft und Streifen, Sternchen oder Lichtkreise im Bild erscheinen. Wird oft für dramatische oder filmische Effekte verwendet. Beispiel: „Cinematic lens flare as the sun dips below the horizon behind a silhouetted couple.“ (Cinematic Lens Flare, wenn die Sonne hinter einem Paar in Silhouette untergeht.)

  • Fokusverlagerung: Das Verfahren, bei dem der Fokus des Objektivs in einer einzigen, kontinuierlichen Aufnahme von einem Motiv oder einer Tiefenebene auf ein anderes Motiv oder eine andere Tiefenebene verlagert wird. Beispiel: „Fokus von einem nachdenklichen Gesicht im Vordergrund auf ein wichtiges Foto an der Wand dahinter verlagern.“

  • Fisheye-Objektiv: Ein Ultraweitwinkelobjektiv, das eine extreme tonnenförmige Verzeichnung erzeugt und ein kreisförmiges oder stark konvexes, breites Panoramabild erzeugt. Beispiel: „Fischaugenobjektiv-Ansicht aus dem Inneren eines Autos, die den Fahrer und das gesamte gewölbte Armaturenbrett und die Windschutzscheibe zeigt.“

  • Vertigo-Effekt (Dolly-Zoom): Ein Kameraeffekt, der erzielt wird, indem die Kamera auf ein Motiv zu- oder von ihm weg bewegt wird, während das Objektiv gleichzeitig in die entgegengesetzte Richtung gezoomt wird. Das Motiv bleibt dabei ungefähr gleich groß, aber die Perspektive des Hintergrunds ändert sich drastisch, was oft ein Gefühl der Desorientierung oder Unruhe vermittelt. Beispiel: „Vertigo-Effekt (Dolly-Zoom) bei einer Figur, die am Rande einer Klippe steht, der Hintergrund rast davon.“

Beispiel: Das folgende Video und der folgende Prompt zeigen einen optischen Effekt mit geringer Schärfentiefe:

A cinematic close-up portrait of a woman sitting in a café at night, with a very
shallow depth of field. Her face is in sharp focus, while the city lights
outside the window behind her are transformed into soft, beautiful bokeh circles

Beispiel: Im folgenden Video und Prompt wird ein Rack-Fokus-Effekt demonstriert:

"A medium shot of a detective's hand in the foreground, holding a single, spent
bullet casing. The camera then performs a slow rack focus, shifting from the
casing to reveal the anxious face of a witness in the background, now in sharp
focus"

Visueller Stil und Ästhetik

Der visuelle Stil und die Ästhetik beschreiben die künstlerische Atmosphäre Ihres Videos. Sie sind eines der wichtigsten Elemente, um einen einzigartigen Stil zu schaffen.

Diese Kategorie lässt sich in vier Hauptkomponenten unterteilen:

  • Beleuchtung
  • Ton oder Stimmung
  • Künstlerischer Stil
  • Ambiance

Beleuchtung

Lichteffekte verändern, wie das Motiv und die Umgebung von der Kamera aufgenommen werden. Mit Lichteffekten können Sie einen bestimmten Stil erzielen.

Hier sind einige Beispiele für Beleuchtungseffekte, die Sie verwenden können:

  • Natürliches Licht: „weiches Morgenlicht, das durch ein Fenster fällt“, „Tageslicht bei bewölktem Himmel“, „Mondlicht“

  • Künstliches Licht: „warmes Licht eines Kamins“, „flackerndes Kerzenlicht“, „grelles Neonlicht im Büro“, „pulsierende Neonschilder“

  • Filmische Beleuchtung: „Rembrandt-Beleuchtung für ein Porträt“, „Film-Noir-Stil mit tiefen Schatten und starken Lichtern“, „High-Key-Beleuchtung für eine helle, fröhliche Szene“, „Low-Key-Beleuchtung für eine dunkle, geheimnisvolle Stimmung“

  • Spezifische Effekte: „volumetrische Beleuchtung mit sichtbaren Lichtstrahlen“, „Gegenlicht für eine Silhouette“, „Goldene Stunde“, „dramatische Seitenbeleuchtung“

Ton oder Stimmung

Effekte für Ton und Stimmung beschreiben die Atmosphäre oder das Gesamtgefühl des Videos.

Hier einige Beispiele für Effekte, die Sie verwenden können, um den Ton oder die Stimmung zu beeinflussen:

  • Fröhlich: Hell, lebendig, heiter, erhebend, verspielt.

  • Traurig/melancholisch: Düster, gedeckte Farben, langsames Tempo, ergreifend, wehmütig.

  • Spannungsvoll/angespannt: Dunkel, schattig, schnelle Schnitte (wenn Bearbeitung angedeutet wird), Gefühl der Unruhe, aufregend.

  • Friedlich/ruhig: Ruhig, sanft, meditativ.

  • Episch/grandios: Weitläufig, majestätisch, dramatisch, beeindruckend.

  • Futuristisch/Science-Fiction: elegant, metallisch, Neon, technologisch, dystopisch, utopisch.

  • Vintage/Retro: Sepiaton, körniger Film, Ästhetik einer bestimmten Epoche (z. B. „1950s Americana“, „1980s Vaporwave“).

  • Romantisch: Weichzeichner, warme Farben, intim.

  • Horror: Dunkel, beunruhigend, unheimlich, blutig (achten Sie jedoch auf Inhaltsfilter).

Künstlerischer Stil

Sie können einen künstlerischen Stil für das Video beschreiben, an dem sich die KI bei der Generierung des Videos orientieren soll.

Im Folgenden finden Sie Beispiele für Effekte für den künstlerischen Stil, die Sie verwenden können:

  • Fotorealistisch: „ultrareale Darstellung“, „mit 8K-Kamera aufgenommen“

  • Kinoreif: „cinematic film look“ (kinoreifer Filmlook), „shot on 35mm film“ (auf 35-mm-Film gedreht), „anamorphic widescreen“ (anamorphes Breitbild)

  • Animationsstile: „Japanischer Anime-Stil“, „klassischer Disney-Animationsstil“, „3D-Animation im Pixar-Stil“, „Knetanimation“, „Stop-Motion-Animation“, „Cel-Shading-Animation“

  • Kunstrichtungen/Künstler: „im Stil von Van Gogh“, „surrealistisches Gemälde“, „impressionistisch“, „Art-déco-Design“, „Bauhaus-Ästhetik“

  • Spezifische Looks: „düstere Graphic Novel-Illustration“, „Aquarellgemälde, das zum Leben erwacht“, „Animation einer Kohlezeichnung“, „Blaupausen-Schema“.

Beispiel: Das folgende Video und der folgende Prompt zeigen einen japanischen Anime-Animationsstil:

"A dynamic scene in a vibrant Japanese anime style. A magical girl with silver
hair and glowing blue eyes walks in a forest. The style features sharp lines,
bright, saturated colors, and expressive"

Beispiel:Im folgenden Video und Prompt wird ein künstlerischer Vintage-Stil demonstriert:

"A vintage 1920s street scene, sepia toned, film grain, with characters in
period attire"

Ambiance

Die Atmosphäre beschreibt den Charakter eines Ortes oder einer Umgebung, in der das Video spielt.

Hier sind einige Beispiele für Ambiente-Effekte, die Sie verwenden können:

  • Farbpaletten: „monochromatisch schwarz und weiß“, „leuchtende und gesättigte tropische Farben“, „gedämpfte Erdtöne“, „kühle blaue und silberne futuristische Palette“, „warme herbstliche Oranges und Brauns“

  • Atmosphärische Effekte: „dichter Nebel, der über ein Moor zieht“, „wirbelnder Wüstensand“, „sanft fallender Schnee, der eine weiche Decke bildet“, „Hitzeflimmern über Asphalt“, „magische, leuchtende Partikel in der Luft“, „Untergrundstreuung auf einem durchscheinenden Objekt“

  • Textur: „grobe Natursteinwände“, „glatte, polierte Chromoberflächen“, „weicher, samtiger Stoff“, „Tautropfen an einem Spinnennetz“

Zeitliche Elemente

Zeitliche Elemente wirken sich auf den Zeitablauf in einem Video aus. Damit lassen sich Änderungen auch in kurzen Clips hervorheben.

Im Folgenden finden Sie Beispiele für temporale Elemente, die Sie verwenden können:

  • Pacing: „Zeitlupe“, „schnelle Action“, „Zeitraffer“

  • Entwicklung (subtil bei kurzen Clips): „Eine Blütenknospe, die sich langsam entfaltet“, „Eine Kerze, die langsam abbrennt“, „Die Morgendämmerung, der Himmel, der sich allmählich aufhellt“

  • Rhythmus: „pulsierendes Licht“, „rhythmische Bewegung“

Beispiel: Das folgende Video und der folgende Prompt zeigen einen zeitlichen Evolutionseffekt:

"A close-up of a single red rose bud, its petals tightly closed. The camera
remains static as the flower slowly and gracefully unfurls over the course of
the shot, revealing its vibrant inner layers. The evolution is subtle, showing a
clear but gradual change"

Beispiel: Im folgenden Video und Prompt wird ein Zeitraffer-Effekt demonstriert:

"A time-lapse of a bustling city skyline as day transitions to night. The camera
is static. Watch as the sun sets, casting long shadows, and the city lights
begin to twinkle on, with streaks of car headlights moving along the streets
below"

Audio

Audio-Prompts helfen dabei, die visuellen Elemente des Videos auf den Ton abzustimmen. Die Audio-Regie kann die Handlung, das Pacing und die Stimmung des Videos maßgeblich beeinflussen.

Audio wird von veo-3.0-generate-001 in der Vorabversion unterstützt.

Geben Sie deutlich an, ob Sie Audio wünschen. Wir empfehlen, die Audiobeschreibung in Ihrem Prompt in separaten Sätzen zu formulieren. Hier sind einige Beispiele für gängige Audioelemente, die Sie verwenden können:

  • Soundeffekte: einzelne, deutliche Geräusche, die in der Szene vorkommen. Beispiele: „Das Klingeln eines Telefons“, „Wasser, das im Hintergrund spritzt“, „leise Geräusche im Haus, das Knarren einer Schranktür und das Ticken einer Uhr“.

  • Umgebungsgeräusche: Die allgemeinen Hintergrundgeräusche, die einen Ort realistisch wirken lassen. Beispiele: „Geräusche des Stadtverkehrs und ferne Sirenen“, „Wellen, die an der Küste brechen“, „das leise Summen eines Büros“.

  • Dialog: Gesprochene Worte von Charakteren oder einem Erzähler. Beispiel: „Der Mann mit dem roten Hut sagt: Wo ist das Kaninchen?“ „ein Voiceover mit einem gepflegten britischen Akzent spricht in einem ernsten, dringenden Ton“, „zwei Personen unterhalten sich über einen Film“.

Beispiel: Im folgenden Video und Prompt wird die Verwendung von Dialogen demonstriert:

"A medium shot in a dimly lit interrogation room. The seasoned detective says:
Your story has holes. The nervous informant, sweating under a single bare bulb,
replies: I'm telling you everything I know. The only other sounds are the slow,
rhythmic ticking of a wall clock and the faint sound of rain against the window"

Filmbegriffe

Sie können filmische Begriffe für den Bearbeitungsstil und bestimmte Techniken verwenden. Zum Beispiel „Match Cut“, „Jump Cut“, „Einstellungssequenz“, „Montage“, „Split Diopter Effect“.

Beispiel: Im folgenden Video und Prompt wird ein Jump Cut verwendet:

"A person sitting in the same position but wearing different outfits, with sharp
jump cuts between each outfit change. The background should stay static and the
person should reappear instantly in the new outfit, creating a fast-paced,
rhythmic jump cut effect. The lighting and framing should remain consistent to
emphasize the sudden changes"

Negative Prompts

Mit negativen Prompts können Sie angeben, welche Elemente nicht in Ihrem Video generiert werden sollen. Wenn Sie einen negativen Prompt verwenden, beschreiben Sie die Elemente, die das Modell beim Generieren des Videos nicht einfügen soll.

Wir empfehlen folgende Einstellung:

  • Nicht empfohlen:Vermeiden Sie Formulierungen oder Wörter wie „keine“ oder „Nicht“. Vermeiden Sie beispielsweise Prompts wie „keine Wände“ oder „Wände nicht anzeigen“.

  • Empfohlen:Beschreiben Sie, was Sie nicht sehen möchten. Beispiel: „Wand, Rahmen“. Das bedeutet, dass Sie keine Wand oder keinen Rahmen im Video sehen möchten.

Eingabeaufforderung Generierte Ausgabe
Erstelle eine kurze, stilisierte Animation einer großen, einzelnen Eiche, deren Blätter im starken Wind wehen. Der Baum sollte eine leicht übertriebene, skurrile Form mit dynamischen, fließenden Ästen haben. Die Blätter sollten eine Vielzahl von Herbstfarben aufweisen und sich im Wind drehen und tanzen. Die Animation sollte einen sanften, atmosphärischen Soundtrack haben und eine warme, einladende Farbpalette verwenden. Baum mit Wörtern.

Erstelle eine kurze, stilisierte Animation einer großen, einzelnen Eiche, deren Blätter im starken Wind wehen. Der Baum sollte eine leicht übertriebene, skurrile Form mit dynamischen, fließenden Ästen haben. Die Blätter sollten eine Vielzahl von Herbstfarben aufweisen und sich im Wind drehen und tanzen. Die Animation sollte einen sanften, atmosphärischen Soundtrack und eine warme, einladende Farbpalette haben.

Mit dem negativen Prompt „urban background, man-made structures, dark, stormy, or threatening atmosphere“ (städtischer Hintergrund, von Menschen geschaffene Strukturen, dunkel, stürmisch oder bedrohliche Atmosphäre).

Baum ohne negative Wörter.

Nächste Schritte