Veo 可通过文本提示实现无限的自定义。本指南介绍了如何修改 Veo 提示,以生成不同的结果和效果。
如需详细了解最佳实践,请参阅 Veo on Vertex AI 最佳实践。
安全过滤器
Veo 会在整个 Vertex AI 中应用安全过滤条件,以帮助确保生成的视频和上传的照片不包含冒犯性内容。例如,违反Responsible AI 准则的提示会被屏蔽。
如果您怀疑有人滥用 Veo 或任何包含不当材料或不准确信息的生成输出,请使用在 Google Cloud上举报疑似滥用行为表单。
Veo 提示的构成
使用 Veo 生成视频时,使用正确的关键字和提示结构有助于模型生成您想要的内容。 将想法分解为关键组成部分,是引导 Veo 实现预期结果的最有效方法。
以下部分介绍了如何在提示中使用关键元素和关键字来引导 Veo 生成视频。
您不必在每个提示中都使用所有元素,但了解每个元素的作用有助于您在 Veo 提示中有效地应用它们。
主题
主题是指生成的视频中的动作围绕的“谁”或“什么”。具体性有助于避免生成宽泛的输出。
以下是一些可供您使用的主题示例:
人员:
通用描述符:男性、女性、老年人
特定职业:“经验丰富的侦探”“快乐的面包师”“未来的宇航员”
历史人物
神话人物:“淘气的仙女”“坚忍的骑士”
动物或生物:
特定动物品种:“一只爱玩耍的金毛猎犬幼犬”“一只雄伟的秃鹰”“一只光滑的黑豹”
奇幻生物:“一条鳞片闪闪发光的迷你龙”“一棵会说话的古老智慧树”
物体:
日常用品:“复古打字机”“冒着热气的咖啡杯”“磨损的皮面装订书”
车辆:“一辆 20 世纪 60 年代的经典肌肉车”“一艘未来主义风格的悬浮气垫船”“一艘饱经风霜的海盗船”
抽象形状:“发光的球体”“晶体结构”
您可以在同一视频中组合人物、动物、物体或它们的任意组合(例如,“一群不同种族的朋友围着篝火大笑,一只好奇的狐狸在阴影中观看”“一个繁忙的市场场景,有摊贩和购物者”)。
示例:以下视频和提示展示了包含多个主题的复杂细节:
"A hyper-realistic, cinematic portrait of a wise, androgynous shaman of
indeterminate age. Their weathered skin is etched with intricate, bioluminescent
circuit-like tattoos that pulse with a soft, cyan light. They are draped in
ceremonial robes woven from dark moss and shimmering, metallic fiber-optic
threads. In one hand, they hold a gnarled wooden staff entwined with glowing
energy conduits and topped with a floating, crystalline artifact. Perched on
their shoulder is a small, mechanical owl with holographic wings and camera-lens
eyes that blink with a soft, red light. Their expression is serene and ancient,
eyes holding a deep, knowing look"
操作
动作描述的是视频的“动词”,即正在发生的事情。动作可让拍摄对象栩栩如生,并描述动作、互动和细微表情。
以下是一些可使用的动作示例:
基本动作:走路、跑步、跳跃、飞行、游泳、跳舞、旋转、跌倒、静止站立、坐下
互动:交谈、欢笑、争论、拥抱、打架、玩游戏、烹饪、建造、写作、阅读、观察
情绪表达:微笑、皱眉、惊讶、全神贯注、若有所思、兴奋、哭泣
细微动作:微风吹拂头发、树叶沙沙作响、轻轻点头、手指不耐烦地敲击、眼睛缓慢眨动
转变或过程:鲜花快速绽放、冰块融化、城市天际线随时间推移而变化(不过,请注意,对于持续时间较长的事件,剪辑片段的时长应适当缩短)
示例:以下视频和提示演示了如何通过安排动作和情绪变化来指导故事:
"A gloved hand carefully slices open the spine of an ancient, leather-bound book
with a scalpel. The hand then delicately extracts a tiny, metallic data chip
hidden within the binding. The character's eyes, previously focused and calm,
widen in a flash of alarm as a floorboard creaks off-screen. They quickly palm
the chip, their head snapping up to scan the dimly lit room, their body tense
and listening for any other sound"
场景或情境
场景或背景信息描述了视频的“地点”和“时间”。也就是说,衬托主题并奠定视频情调和氛围的环境。
以下是一些可用的场景或情境示例:
地点(室内):舒适的客厅(带噼啪作响的壁炉)、无菌的未来实验室、杂乱的艺术家工作室、宏伟的宴会厅、布满灰尘的阁楼
地点(外部):阳光明媚的热带海滩、雾气缭绕的古老森林、夜晚喧嚣的未来主义城市景观、黎明时分宁静的山峰、荒凉的外星球
一天中的时间:黄金时段、正午阳光、黄昏、深夜、黎明前
天气:晴朗的蓝天、阴沉而阴暗、小雨、雷暴(有明显的闪电)、小雪、雾气缭绕
历史或奇幻时期:中世纪城堡庭院、20 世纪 20 年代喧闹的爵士俱乐部、赛博朋克风格的巷道、魔法森林中的空地
大气细节:阳光中的漂浮尘埃、闪烁的热雾、湿路面上的反光、被风吹散的树叶
示例:以下视频演示了如何构建沉浸式世界:
"The scene is a rain-slicked, crumbling street in a forgotten city, shrouded in
perpetual twilight. Giant, bioluminescent mushrooms have sprouted from the
cracked asphalt, casting an eerie, pulsating green and purple glow onto the
decaying facades of skeletal skyscrapers. A gentle, constant rain creates
shimmering reflections in the puddles below, and the only sounds are the soft
patter of rain and a low, otherworldly hum from the glowing fungi"
摄像头角度
拍摄角度决定了镜头的视角,直接影响观众对拍摄对象的感知。
重要提示:某些高级拍摄角度不受官方支持。结果和可靠性可能会因整体提示和您的具体使用场景而异。
以下是一些可用的拍摄角度示例:
平视镜头:提供中立的常见视角,仿佛是从人的高度观看。例如,“一位女性在喝茶的平视镜头”。
低角度拍摄:将相机放置在拍摄对象下方,向上拍摄,使拍摄对象显得强大或气势磅礴。例如,“超级英雄着陆的低角度跟拍镜头”。
俯拍:将相机置于拍摄对象上方,向下拍摄,这样可使拍摄对象显得渺小、脆弱或成为更大图案的一部分。例如,“一个孩子迷失在人群中的俯拍镜头”。
鸟瞰图或俯拍镜头:直接从上方拍摄的镜头,可提供类似地图的场景视角。例如,“鸟瞰繁忙的城市十字路口”。
虫眼视角:从地面向上直拍的极低角度镜头,强调高度和宏伟感。例如,“从虫眼视角仰望高耸入云的摩天大楼。”
倾斜角度:相机向一侧倾斜,形成倾斜的地平线,通常用于传达不安、迷失方向或动感。例如,“一个角色在走廊上奔跑的倾斜角度镜头”。
特写:紧凑地对拍摄对象进行拍摄,通常聚焦于面部,以强调情绪或特定细节。例如,“特写镜头:角色坚定的眼神”。
极近特写:突出显示拍摄对象非常小的细节,例如眼睛或一滴水。例如,“一滴水落在叶子上的超近特写”。
中景:显示拍摄对象从腰部到头部的部分,在细节和环境背景之间取得平衡。通常用于对话。例如,“两人交谈的中景镜头”。
全身镜头或远景镜头:显示从头到脚的整个拍摄对象,并显示部分周围环境。例如,“一位舞蹈演员表演的全景镜头”。
广角镜头或场景设定镜头:显示主体所处的广阔环境,通常用于在序列开头设定位置和背景。例如,“广角照片:雪景中的一间孤零零的小木屋”。
肩部视角:从一个人的身后取景,透过其肩部看向另一个人或物体,常用于对话场景。 例如,“紧张谈判期间的肩部以上镜头”。
主观镜头:从角色的直接视觉角度展示场景,仿佛观众正在通过角色的眼睛观看。例如,“某人乘坐过山车的 POV 镜头”。
示例:以下视频和提示展示了鸟瞰视角:
"A bird's-eye view of a vast, intricate maze made of high green hedges. A lone
figure in a red coat is visible, moving through the labyrinthine paths below"
示例:以下视频和提示展示了极近的特写镜头角度:
"An extreme close-up of a single, glistening drop of rain as it lands on the
petal of a vibrant red rose, causing the petal to tremble slightly"
摄像头移动
摄像头的移动有助于为拍摄画面注入活力,打造更具电影感的体验。
以下是一些可用的镜头移动示例:
静态镜头(或固定镜头):相机完全保持不动,没有移动。例如,“宁静风景的静态镜头”。
平移(左/右):摄像头从固定位置水平向左或向右旋转。例如,“黄昏时分,镜头缓慢向左平移,拍摄城市天际线。”
倾斜(向上/向下):相机从固定位置垂直向上或向下旋转。例如,“从角色震惊的表情向下倾斜到他们手中的揭秘信件。”
推轨(推近/推远):相机实际靠近或远离拍摄对象。例如,“从角色向外推镜头,以强调其孤立无援。”
平移(左右):相机在水平方向(侧向)左右移动,通常与拍摄对象或场景平行。例如,“卡车右侧,跟随角色在繁忙的人行道上行走。”
升降(上/下):摄影机在保持水平视角的同时,在垂直方向上实际向上或向下移动。例如,“将镜头从低角度抬升,以显示一棵古老而高耸的树的完整高度。”
变焦(放大/缩小):相机镜头改变焦距以放大或缩小拍摄对象。这与轨道拍摄不同,因为相机本身不会移动。例如,“缓慢放大桌子上的神秘文物”。
摇臂镜头:摄影机安装在摇臂上,可垂直(向上或向下)移动或以弧形扫动,通常用于戏剧性的揭示或高角度视角。例如,“起重机拍摄的镜头,展现了广阔的中世纪战场。”
航拍或无人机拍摄:从高海拔高度拍摄的镜头,通常使用飞机或无人机拍摄,通常涉及平稳的飞行运动。 “无人机拍摄的广角航拍镜头,飞越热带岛屿链。”
手持或晃动镜头:摄影师手持相机,导致画面不太稳定,经常出现抖动,可营造真实感、即时感或不安感。例如,“在混乱的市场追逐场景中拍摄的手持相机镜头”。
快速摇摄:一种极快的摇摄,会模糊图像,通常用作转场或表达快速移动或迷失方向。例如,“从一个争吵的角色快速摇摄到另一个角色”。
弧形拍摄:相机围绕拍摄对象沿圆形或半圆形路径移动。例如,“围绕一对在雨中拥抱的情侣拍摄的弧形镜头”。
示例:以下视频和提示演示了放大摄像头移动:
"A slow, dramatic zoom in on a mysterious, ancient compass lying on a dusty map.
The camera starts wide, showing the map and a flickering candle, then smoothly
zooms in until the intricate, glowing symbols on the compass face fill the
entire frame"
示例:以下视频和提示展示了航拍无人机拍摄的画面:
"Sweeping aerial drone shot flying over a tropical island chain"
镜头和光学效果
镜头和光学效果会改变相机“看到”世界的方式。使用镜头和光学效果有助于提升专业质感和风格。
重要提示:某些高级相机镜头不受正式支持。结果和可靠性可能会因整体提示和您的具体使用场景而异。
以下是您可以使用的镜头和光学效果示例:
广角镜头:可拍摄比标准镜头更广的视野。 它可以夸大透视效果,使前景元素显得更大,营造出宏大的规模感,或者在较近的距离处产生失真效果。 例如,“广角镜头拍摄的宏伟教堂内部,突出其高耸的拱门。”
长焦镜头:缩小视野并压缩透视效果,使远处的拍摄对象看起来更近,并且通常通过创建浅景深来突出拍摄对象。例如,“长焦镜头拍摄的画面:一只老鹰在远处飞翔,背景是山脉。”
浅景深:一种光学效果,只有图像的狭窄平面处于清晰对焦状态,而前景或背景则处于模糊状态。这种模糊效果的美学质量称为“散景”。例如,“浅景深人像,面部清晰,背景为柔和模糊的公园,具有漂亮的散景效果”。
景深大:使图片的大部分或全部内容(从前景到背景)都清晰对焦。例如,“具有深景深的风景场景,从近处前景中的野花到远处的山脉,都呈现出清晰的细节。”
镜头光晕:当明亮的光源直接照射到相机镜头时产生的一种效果,会导致图像中出现条纹、星爆或圆形光晕。通常用于营造戏剧性或电影效果。例如,“电影般的镜头光晕,一对剪影情侣身后的太阳正缓缓落入地平线。”
移焦:在单个连续镜头中,将镜头焦点从一个拍摄对象或景深平面移到另一个拍摄对象或景深平面的技巧。例如,“将焦点从前景中人物若有所思的表情转移到其身后墙上的一张重要照片。”
鱼眼镜头效果:一种超广角镜头,可产生极大的桶形畸变,从而生成圆形或强凸的广角全景图像。例如,“从车内拍摄的鱼眼镜头视图,捕捉到驾驶员以及整个弯曲的仪表板和挡风玻璃。”
眩晕效果(轨道变焦):一种相机效果,通过将相机朝向或远离拍摄对象移动,同时以相反方向缩放镜头来实现。这样一来,拍摄对象在画面中的大小大致保持不变,但背景透视效果会发生巨大变化,通常会营造出迷失方向或不安的感觉。例如,“悬崖边站立的人物出现眩晕效果(轨道变焦),背景快速后退。
示例:以下视频和提示演示了浅景深光学效果:
A cinematic close-up portrait of a woman sitting in a café at night, with a very
shallow depth of field. Her face is in sharp focus, while the city lights
outside the window behind her are transformed into soft, beautiful bokeh circles
示例:以下视频和提示演示了跟焦拍摄效果:
"A medium shot of a detective's hand in the foreground, holding a single, spent
bullet casing. The camera then performs a slow rack focus, shifting from the
casing to reveal the anxious face of a witness in the background, now in sharp
focus"
视觉风格与美学
视觉风格和美学描述了视频的整体艺术氛围,是打造独特风格的最具影响力的元素之一。
这一大类可以细分为四个关键组成部分:
- 照明
- 语气或情绪
- 艺术风格
- 氛围
照明
光效会改变相机拍摄主体和周围区域的方式。使用灯光效果有助于营造特定风格。
以下是一些可使用的灯效示例:
自然光:“透过窗户洒进来的柔和晨光”“阴天时的日光”“月光”
人造光:“壁炉的暖光”“闪烁的烛光”“刺眼的荧光办公室照明”“闪烁的霓虹灯”
电影级光效:“人像伦勃朗光效”“具有深阴影和鲜明高光的黑色电影风格”“用于营造明亮欢快场景的高调光效”“用于营造黑暗神秘氛围的低调光效”
特定效果:“营造可见光线的体积光”“营造轮廓的逆光”“黄金时段的光芒”“戏剧性的侧光”
语气或情绪
色调和氛围效果用于描述视频的氛围或整体感觉。
以下是一些可用的语气或情绪效果示例:
快乐/欢快:明快、活泼、欢快、振奋、奇趣。
悲伤/忧郁:阴沉、柔和的色彩、缓慢的节奏、凄凉、惆怅。
悬念/紧张:黑暗、阴影、快速剪辑(如果暗示编辑)、不安感、惊险。
平和/宁静:平静、宁静、柔和、舒缓、冥想。
史诗/宏大:气势磅礴、雄伟壮丽、戏剧性强、令人敬畏。
未来主义/科幻:时尚、金属感、霓虹灯、科技感、反乌托邦、乌托邦。
复古/怀旧:棕褐色调、颗粒感胶片、特定时代的美学风格(例如“20 世纪 50 年代的美国风”“20 世纪 80 年代的蒸汽波”)。
浪漫:柔焦、暖色调、亲密。
恐怖:阴暗、令人不安、诡异、血腥(但请注意内容过滤条件)。
艺术风格
您可以描述视频要借鉴的艺术风格,以便在生成视频时获得灵感。
以下是一些可用的艺术风格效果示例:
照片级真实感:“超逼真渲染”“8K 摄像头拍摄”
电影效果:“电影胶片效果”“35 毫米胶片拍摄”“变形宽屏”
动画风格:“日式动漫风格”“经典迪士尼动画风格”“皮克斯风格的 3D 动画”“黏土动画风格”“定格动画”“赛璐珞着色动画”
艺术运动/艺术家:“梵高风格”“超现实主义绘画”“印象派”“装饰艺术风格设计”“包豪斯美学”
特定外观:“粗犷的图文小说插图”“栩栩如生的水彩画”“炭笔素描动画”“蓝图示意图风格”。
示例:以下视频和提示展示了日式动漫动画风格:
"A dynamic scene in a vibrant Japanese anime style. A magical girl with silver
hair and glowing blue eyes walks in a forest. The style features sharp lines,
bright, saturated colors, and expressive"
示例:以下视频和提示展示了复古艺术风格:
"A vintage 1920s street scene, sepia toned, film grain, with characters in
period attire"
氛围
氛围是指视频拍摄地点或环境的特征。
以下是一些可用的氛围效果示例:
配色方案:“单色黑白”“鲜艳饱和的热带色彩”“柔和的大地色调”“冷色调的蓝色和银色未来主义配色方案”“暖色调的秋季橙色和棕色”
大气效果:“浓雾在荒原上翻滚”“沙漠沙尘飞扬”“雪花缓缓飘落,形成柔软的覆盖层”“热雾在沥青上方闪烁”“空气中闪耀着神奇的光粒子”“半透明物体上的次表面散射”
纹理品质:“粗凿的石墙”“光滑的抛光镀铬表面”“柔软的天鹅绒面料”“附着在蜘蛛网上的露珠”
时间元素
时间元素会影响视频中的时间流逝,您可以使用它来突出显示变化,即使是在短视频片段中也是如此。
以下是您可以使用的时间元素的示例:
节奏:“慢动作”“快节奏动作”“延时拍摄”
演变(对于短片来说,这种演变可能很细微):“花苞缓缓绽放”“蜡烛逐渐燃尽”“黎明破晓,天空逐渐变亮”
节奏:“闪烁的光”“有节奏的运动”
示例:以下视频和提示展示了演变时间效果:
"A close-up of a single red rose bud, its petals tightly closed. The camera
remains static as the flower slowly and gracefully unfurls over the course of
the shot, revealing its vibrant inner layers. The evolution is subtle, showing a
clear but gradual change"
示例:以下视频和提示展示了延时拍摄的时间效果:
"A time-lapse of a bustling city skyline as day transitions to night. The camera
is static. Watch as the sun sets, casting long shadows, and the city lights
begin to twinkle on, with streaks of car headlights moving along the streets
below"
音频
音频提示有助于引导视频的视觉效果与声音相关联。音频方向可以有力地塑造视频的动作、节奏和氛围。
veo-3.0-generate-001 在预览版中支持音频。
明确指定是否需要音频。我们建议您在提示中使用单独的句子来描述音频。以下是一些可使用的常见音频元素示例:
音效:场景中出现的单个、独特的音响。 例如,“电话铃声”“背景中的水花声”“柔和的室内声音,例如衣柜门的吱呀声和时钟的滴答声”。
环境噪音:使位置感觉真实的普通背景噪音。例如,“城市交通的声音和远处警笛的声音”“海浪拍打海岸的声音”“办公室里安静的嗡嗡声”。
对话:角色或旁白的口头语言。例如,“戴红帽子的男人说:兔子在哪里?”“旁白采用纯正的英式口音,语气严肃而急迫”“两个人讨论一部电影。”
示例:以下视频和提示演示了如何使用对话:
"A medium shot in a dimly lit interrogation room. The seasoned detective says:
Your story has holes. The nervous informant, sweating under a single bare bulb,
replies: I'm telling you everything I know. The only other sounds are the slow,
rhythmic ticking of a wall clock and the faint sound of rain against the window"
电影术语
您可以使用电影术语来描述剪辑风格和具体技巧。例如,“匹配剪辑”“跳切”“场景建立镜头序列”“蒙太奇”“分光镜效果”。
示例:以下视频和提示演示了如何使用跳切技巧:
"A person sitting in the same position but wearing different outfits, with sharp
jump cuts between each outfit change. The background should stay static and the
person should reappear instantly in the new outfit, creating a fast-paced,
rhythmic jump cut effect. The lighting and framing should remain consistent to
emphasize the sudden changes"
否定提示
反向提示是一种工具,可帮助您指定不希望在视频中生成的元素。使用负面提示时,您需要描述模型在生成视频时不应包含的元素。
我们建议您执行以下操作:
不建议:使用指令语言或“没有”或“不”等字词。例如,避免使用“没有墙”或“不要显示墙”等提示。
推荐:描述您不想看到的内容。例如,“墙、框架”,表示您不希望视频中出现墙或框架。
| 提示 | 生成的输出 |
|---|---|
| 生成一段简短的风格化动画,内容是一棵巨大的孤零零的橡树,树叶在强风中剧烈摇摆。树的形状应略微夸张,充满奇思妙想,枝条应富有动感,呈流动状。树叶应呈现出各种秋季色彩,在风中旋转飞舞。动画应采用柔和的背景音乐,营造出温馨的氛围,并使用暖色调,营造出温馨的氛围。 |
|
|
生成一段简短的风格化动画,内容是一棵巨大的孤零零的橡树,树叶在强风中剧烈摇摆。树的形状应略微夸张,充满奇思妙想,枝条应富有动感,呈流动状。 树叶应呈现出各种秋季色彩,在风中旋转飞舞。动画应采用柔和的氛围配乐,并使用暖色调的配色方案。 使用负面提示 - 城市背景、人造结构、黑暗、暴风雨或威胁性氛围。 |
|