Veo를 사용하면 텍스트 프롬프트를 사용하여 동영상을 생성할 수 있습니다. 이 가이드에서는 고화질 Veo 동영상을 생성하는 데 도움이 되는 권장사항을 제공합니다.
효과적인 프롬프트를 작성하는 방법에 대한 자세한 내용은 Vertex AI의 Veo 동영상 생성 프롬프트 가이드를 참조하세요.
명확하고 구체적인 프롬프트 사용
모호함을 없앤 명확하고 직접적인 프롬프트는 생성되는 동영상 결과물의 품질을 높이는 데 도움이 됩니다.
권장하지 않음: "제가 생각하는 장면은, 그러니까 좀 슬퍼 보이는 어떤 남자에 초점이 맞춰져 있는데, 좀 어둡고 카메라는 아래에서 위로 올려다보는 구도라고 할까요?"
권장: "침울한 표정을 짓고 있는 남자, 로우 앵글 클로즈업 샷. 장면은 은은하게 어두운 조명으로, 우울한 분위기를 전달합니다."
따옴표 사용하지 않기
모델이 동영상에 텍스트를 렌더링하지 않도록 하려면 화자의 동작 뒤에 콜론(:)을 사용하여 음성을 나타내고 따옴표(")는 사용하지 마세요.
권장하지 않음: 한 여성이 말합니다: "제 이름은 클라라입니다"
권장: 한 여성이 말합니다: 제 이름은 클라라입니다.
다양한 가로세로 비율 사용
가로세로 비율을 활용하여 여러 플랫폼에서 동영상 성과를 높이세요. 플랫폼마다 최적화된 가로세로 비율이 다릅니다. 마케팅 및 광고를 위해서는 플랫폼의 가로세로 비율을 파악하는 것이 중요합니다.
다음은 주요 가로세로 비율과 기본 사용 사례입니다.
16:9: '가로 모드' 또는 '와이드스크린'이라고도 하며, 텔레비전, 모니터, 대부분의 동영상 디스플레이, YouTube, 프레젠테이션, 휴대전화의 가로 모드 표준으로 간주됩니다. 16:9 가로세로 비율은 풍경과 같은 배경을 더 많이 캡처하는 데도 유용합니다.
9:16: 세로 모드, 세로 또는 와이드스크린 회전형이라고도 합니다. 9:16은 TikTok, Instagram Reels, YouTube Shorts와 같은 모바일 중심 플랫폼에 필수적입니다. 9:16 가로세로 비율은 인물 사진이나 건물, 나무, 폭포와 같이 수직 방향이 두드러진 긴 물체에도 유용합니다.
짧은 동영상은 단일 장면에 집중
짧은 동영상의 경우 각 프롬프트가 하나의 집중된 순간을 나타내도록 합니다. 짧은 동영상을 만들기 위해 하나의 프롬프트에 여러 개의 개별 이벤트(A, 그 다음 B, 그 다음 C)를 이어서 나열하려고 하면 혼란스럽거나 불완전한 동영상이 만들어지는 경우가 많습니다.
권장하지 않음: '한 형사가 도서관에서 단서를 찾은 후 밤에 도시를 가로질러 운전한 다음 창고에서 용의자와 대면함'
권장: 각 부분을 별도의 클립으로 생성:
클립 1: '어두운 도서관에서 형사가 장갑 낀 손으로 오래된 책에서 먼지를 털어내자 숨겨진 상징이 드러나는 클로즈업'
클립 2: '밤에 네온 불빛이 켜진 도시를 달리는 자동차, 앞유리를 가로지르는 빗줄기, 필름 누아르 스타일'
클립 3: '그림자가 드리워진 창고 안에서 형사가 실루엣으로 처리된 인물과 마주 서 있어 긴장된 분위기 조성'
Gemini로 워크플로 개선하기
Gemini는 아이디어 구상부터 평가에 이르기까지 동영상 제작 전 과정에서 강력한 파트너가 될 수 있습니다.
제작 전: Gemini를 전문 프롬프트 작성기로 사용
처음부터 시작하지 않고, Gemini에게 전문 프롬프터 역할을 해 달라고 요청할 수 있습니다. 기본 아이디어를 Veo에 적합한 상세한 프롬프트로 다듬어 보세요. 예를 들어 다음과 같은 지침을 제시할 수 있습니다.
"Act as an expert prompter for a generative AI video generation model. Look at
this image, and write a prompt that INSTRUCTION. Ensure your
prompt is comprehensive and detailed."
INSTRUCTION을 Veo 모델에 대한 추가 지침으로 바꿉니다.
제작 후: Gemini를 '두 번째 검토자'로 사용
동영상이 생성되면 Gemini가 최종 결과물을 평가하고, 회사 또는 브랜드 가이드라인에 맞춰 점검하고, 사람의 검토가 필요할 수 있는 잠재적인 문제 영역을 표시할 수 있습니다.
캐릭터 및 음성 일관성 유지
자세한 캐릭터 설명 만들기: 캐릭터 설명은 일관성을 위한 기반입니다. 재사용성과 음성 일관성을 보장하기 위해, 캐릭터에 이름과 특정 음성 스타일을 지정하세요. 그런 다음, 변경할 수 없는 다양한 특징(신체 구조와 나이, 머리 색상 및 스타일, 얼굴형, 눈 색상 및 모양, 특징적인 표시)을 활용하여 설명을 작성합니다. Gemini를 사용하여 캐릭터의 얼굴 특징에 대한 자세한 설명을 생성할 수 있습니다.
설명을 일관되게 적용: 변경되지 않은 전체 캐릭터 설명을 새 장면이나 동작의 프롬프트에 복사하여 붙여넣습니다. 새로운 동작 또는 설정을 설명하는 부분만 수정하세요. 워크플로를 개선하기 위해 Gemini를 장면 생성기로 사용할 수도 있습니다. Gemini에 최종 캐릭터 설명을 제공하고 여러 장면 프롬프트를 생성해 달라고 요청하세요.
동일한 시드 파라미터 사용: 여러 장면에서 시각적, 스타일, 음성 출력이 일관되도록 하려면 동일한 시드 파라미터를 사용하세요.
예: 다음 동영상은 동일한 시드 파라미터와 다음과 같은 프롬프트를 사용하여 생성되었습니다. 다음 각 프롬프트에서 반복되는 캐릭터와 음성 설명은 굵게 표시됩니다.
장면 1 프롬프트:
"A medium shot, with the camera slowly dollying forward in a dimly lit, grand
Parisian archive. Dust motes dance in a single beam of light from a high window.
Clara, a historian in her early 30s, with observant, dark brown
eyes that hold a quiet intensity. She has chin-length, black hair styled in a
classic bob. She is dressed in a sophisticated, dark navy-blue
wool coat, with a silk scarf patterned with subtle gold and cream designs tied
around her neck. She stands before a large, ancient wooden table, carefully
turning the fragile, yellowed page of a massive, leather-bound book. Her
expression is one of deep concentration. In a voice that is crisp
and clear, with a thoughtful, analytical tone and a standard American
accent, Clara says: It has to be here"
장면 2 프롬프트:
"A wide shot of the Pont des Arts in Paris at twilight, the sky a mix of deep
blue and soft orange. The lights of the city are beginning to twinkle on along
the Seine. Clara, a historian in her early 30s, with observant,
dark brown eyes that hold a quiet intensity. She has chin-length, black hair
styled in a classic bob. She is dressed in a sophisticated, dark
navy-blue wool coat, with a silk scarf patterned with subtle gold and cream
designs tied around her neck. She leans against the railing, looking out at the
water, a small, triumphant smile on her face. She pulls a folded, old map from
her coat pocket and looks down at it. In a voice that is crisp and
clear, with a thoughtful, analytical tone and a standard American
accent, Clara says: I knew it. The path starts from here"
장면 3 프롬프트:
"An eye-level shot in a small, hidden Parisian courtyard, overgrown with ivy and
lit by a single, warm gas lamp. Clara, a historian in her early
30s, with observant, dark brown eyes that hold a quiet intensity. She has
chin-length, black hair styled in a classic bob. She is dressed
in a sophisticated, dark navy-blue wool coat, with a silk scarf patterned with
subtle gold and cream designs tied around her neck. She kneels down and runs her
fingers over an ancient, carved symbol on a stone paver, almost completely
obscured by moss. Her eyes light up with discovery. In a voice
that is crisp and clear, with a thoughtful, analytical tone and a standard
American accent, Clara says: After all these years, I've found
it"
이미지 동영상 변환
다음 섹션은 이미지 동영상 변환 기능을 사용할 때 중요한 권장사항입니다.
고화질 소스 이미지 사용
이미지 동영상 변환 기능을 사용할 때는 소스 이미지의 화질이 중요합니다. Veo는 소스 이미지를 캐릭터 세부정보, 조명, 전반적인 예술적 스타일을 비롯한 모든 후속 작업의 기반으로 사용합니다.
선명하고 또렷하며 구도가 잘 잡힌 사진을 사용하면 보다 일관된 고화질 동영상을 만들 수 있습니다. 소스 이미지를 영화의 첫 번째 프레임이라고 생각하세요. 시작이 강력할수록 결과물이 좋아집니다.
동작만을 위한 프롬프트
소스 이미지에는 이미 주제, 장면, 스타일이 포함되어 있습니다. 프롬프트는 만들고 싶은 동작에 초점을 맞추세요.
권장하지 않음: 이미지에 묘사된 캐릭터나 배경, 조명을 다시 설명하는 경우입니다. 중복된 프롬프트는 모델에게 혼란을 주기 때문에 좋지 않은 결과를 초래합니다.
권장: 카메라 움직임, 피사체 애니메이션, 환경 변화를 요청하는 프롬프트를 작성합니다.
소스 이미지의 캐릭터에 대해 일반적인 용어 사용
동작 프롬프트에서 '피사체', '여성', '그', '그녀', '그들'과 같은 일반적인 용어로 캐릭터를 언급합니다.
카메라 움직임 지시
단독으로 또는 조합을 통해 세 가지 유형의 움직임을 연출할 수 있습니다.
카메라 움직임: 카메라가 움직이지만 장면은 정적입니다. 역동성을 더하는 가장 간단하고 안정적인 방법입니다.
- 예: "피사체를 향해 천천히 돌리 인(dolly in) 하세요."
피사체 애니메이션: 주인공 또는 개체가 움직입니다. 미묘하고 사실적인 동작에 가장 적합합니다.
- 예: "캐릭터의 머리카락과 옷이 바람에 부드럽게 흩날립니다."
환경 애니메이션: 배경이나 분위기를 생생하게 표현합니다.
- 예: "안개가 풍경 위로 천천히 밀려옵니다."
예: 다음 동영상과 프롬프트는 Imagen 4로 생성된 이미지를 사용한 피사체 애니메이션을 보여줍니다.

"A sweeping drone-like aerial view starting from ground level and rising to
reveal the entire landscape in epic proportions"
권장사항 요약
다음 표에서는 이 문서에 설명된 권장사항을 요약해서 보여줍니다.
| 주제 | 작업 |
|---|---|
| 프롬프트 | |
| 동영상 생성 | |
| 이미지 동영상 변환 |