데이터 상주

고객이 선택한 위치에 저장 중인 데이터는 해당 고객의 요청에 의해 호출되는 Vertex AI의 생성형 AI 엔드포인트와 관계없이 해당 위치에 저장 중 상태로 유지됩니다.

ML 처리

Vertex AI의 생성형 AI 서비스에 대한 머신러닝(ML) 처리는 요청이 전달된 특정 리전이나 멀티 리전 내에서 발생합니다.

중동의 엔드포인트와 같이 다음 표에 명시적으로 나열되지 않은 리전 엔드포인트의 경우 특정 위치에서 ML 처리가 수행된다고 보장되지 않습니다. 이러한 엔드포인트는 ML 처리가 보장되지 않는 이전 모델을 지원합니다.

Google Cloud 모델 지원

데이터 상주를 지원하는 기능을 알아보려면 지원되는 기능을 참조하세요.

멀티 리전

모델 미국 멀티 리전 EU 멀티 리전
Gemini 2.5 Flash, 128k(gemini-2.5-flash)
Gemini 2.5 Flash, 1M(gemini-2.5-flash)
Gemini 2.5 Flash Image(gemini-2.5-flash-image)
Gemini 2.5 Flash-Lite(gemini-2.5-flash-lite)
Gemini 2.5 Pro, 1M(gemini-2.5-pro)
Gemini 2.5 Pro, 128k(gemini-2.5-pro)
Gemini 2.5 Flash(gemini-2.5-flash)조정
Gemini 2.5 Flash-Lite(gemini-2.5-flash-lite)조정
Gemini 2.5 Pro(gemini-2.5-pro)조정
Gemini 2.0 Flash(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite(gemini-2.0-flash-lite-001)
Gemini 2.0 Flash(gemini-2.0-flash-001)조정
Gemini 2.0 Flash-Lite(gemini-2.0-flash-lite-001)조정
Gemini 임베딩(gemini-embedding-001)
Chirp 2: 스크립트 작성(chirp_2)
Chirp 3: 스크립트 작성(chirp_3)
Chirp 3: HD 음성
Chirp 3: 즉석 커스텀 음성
Imagen 2(imagegeneration@005)
멀티모달 임베딩
텍스트용 임베딩(text-embedding-004)
텍스트용 임베딩(text-embedding-005)
텍스트용 임베딩(text-multilingual-embedding-002)

미주

모델 캐나다(northamerica-northeast1)
Gemini 2.5 Flash, 128k(gemini-2.5-flash)
Gemini 2.5 Flash, 1M(gemini-2.5-flash)
Gemini 2.5 Flash Image(gemini-2.5-flash-image)
Gemini 2.5 Flash-Lite(gemini-2.5-flash-lite)
Gemini 2.5 Pro, 1M(gemini-2.5-pro)
Gemini 2.5 Pro, 128k(gemini-2.5-pro)
Gemini 2.5 Flash(gemini-2.5-flash)조정
Gemini 2.5 Flash-Lite(gemini-2.5-flash-lite)조정
Gemini 2.5 Pro(gemini-2.5-pro)조정
Gemini 2.0 Flash(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite(gemini-2.0-flash-lite-001)
Gemini 2.0 Flash(gemini-2.0-flash-001)조정
Gemini 2.0 Flash-Lite(gemini-2.0-flash-lite-001)조정
Gemini 임베딩(gemini-embedding-001)
Chirp 2: 스크립트 작성(chirp_2)
Chirp 3: 스크립트 작성(chirp_3)
Chirp 3: HD 음성
Chirp 3: 즉석 커스텀 음성
Imagen 2(imagegeneration@005)
멀티모달 임베딩
텍스트용 임베딩(text-embedding-004)
텍스트용 임베딩(text-embedding-005)
텍스트용 임베딩(text-multilingual-embedding-002)

유럽

모델 프랑스(europe-west9) 영국(europe-west2) 독일(europe-west3) 네덜란드(europe-west4)
Gemini 2.5 Flash, 128k(gemini-2.5-flash)
Gemini 2.5 Flash, 1M(gemini-2.5-flash)
Gemini 2.5 Flash Image(gemini-2.5-flash-image)
Gemini 2.5 Flash-Lite(gemini-2.5-flash-lite)
Gemini 2.5 Pro, 1M(gemini-2.5-pro)
Gemini 2.5 Pro, 128k(gemini-2.5-pro)
Gemini 2.5 Flash(gemini-2.5-flash)조정
Gemini 2.5 Flash-Lite(gemini-2.5-flash-lite)조정
Gemini 2.5 Pro(gemini-2.5-pro)조정
Gemini 2.0 Flash(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite(gemini-2.0-flash-lite-001)
Gemini 2.0 Flash(gemini-2.0-flash-001)조정
Gemini 2.0 Flash-Lite(gemini-2.0-flash-lite-001)조정
Gemini 임베딩(gemini-embedding-001)
Chirp 2: 스크립트 작성(chirp_2)
Chirp 3: 스크립트 작성(chirp_3)
Chirp 3: HD 음성
Chirp 3: 즉석 커스텀 음성
Imagen 2(imagegeneration@005)
멀티모달 임베딩
텍스트용 임베딩(text-embedding-004)
텍스트용 임베딩(text-embedding-005)
텍스트용 임베딩(text-multilingual-embedding-002)

아시아 태평양

모델 일본(asia-northeast1) 오스트레일리아(australia-southeast1) 인도(asia-south1) 싱가포르(asia-southeast1) 대한민국(asia-northeast3)
Gemini 2.5 Flash, 128k(gemini-2.5-flash)
Gemini 2.5 Flash, 1M(gemini-2.5-flash)
Gemini 2.5 Flash Image(gemini-2.5-flash-image)
Gemini 2.5 Flash-Lite(gemini-2.5-flash-lite)
Gemini 2.5 Pro, 1M(gemini-2.5-pro)
Gemini 2.5 Pro, 128k(gemini-2.5-pro)
Gemini 2.5 Flash(gemini-2.5-flash)조정
Gemini 2.5 Flash-Lite(gemini-2.5-flash-lite)조정
Gemini 2.5 Pro(gemini-2.5-pro)조정
Gemini 2.0 Flash(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite(gemini-2.0-flash-lite-001)
Gemini 2.0 Flash(gemini-2.0-flash-001)조정
Gemini 2.0 Flash-Lite(gemini-2.0-flash-lite-001)조정
Gemini 임베딩(gemini-embedding-001)
Chirp 2: 스크립트 작성(chirp_2)
Chirp 3: 스크립트 작성(chirp_3)
Chirp 3: HD 음성
Chirp 3: 즉석 커스텀 음성
Imagen 2(imagegeneration@005)
멀티모달 임베딩
텍스트용 임베딩(text-embedding-004)
텍스트용 임베딩(text-embedding-005)
텍스트용 임베딩(text-multilingual-embedding-002)

Google Cloud 파트너 모델 지원

멀티 리전

모델 미국 멀티 리전 EU 멀티 리전
Anthropic의 Claude Haiku 4.5
Anthropic의 Claude Opus 4
Anthropic의 Claude Opus 4.1
Anthropic의 Claude Sonnet 4
Anthropic의 Claude Sonnet 4.5
Anthropic의 Claude 3.5 Haiku
Anthropic의 Claude 3 Haiku
Anthropic의 Claude 3.7 Sonnet(지원 중단됨)
Codestral(24.05)
Codestral 2
Mistral Large(24.07)
Mistral Medium 3
Mistral OCR(25.05)
Mistral Small 3.1(25.03)

유럽

모델 벨기에(europe-west1) 네덜란드(europe-west4)
Anthropic의 Claude Haiku 4.5
Anthropic의 Claude Opus 4
Anthropic의 Claude Opus 4.1
Anthropic의 Claude Sonnet 4
Anthropic의 Claude Sonnet 4.5
Anthropic의 Claude 3.5 Haiku
Anthropic의 Claude 3 Haiku
Anthropic의 Claude 3.7 Sonnet(지원 중단됨)
Codestral(24.05)
Codestral 2
Mistral Large(24.07)
Mistral Medium 3
Mistral OCR(25.05)
Mistral Small 3.1(25.03)

아시아 태평양

모델 싱가포르(asia-southeast1) 타이완(asia-east1)
Anthropic의 Claude Haiku 4.5
Anthropic의 Claude Opus 4
Anthropic의 Claude Opus 4.1
Anthropic의 Claude Sonnet 4
Anthropic의 Claude Sonnet 4.5
Anthropic의 Claude 3.5 Haiku
Anthropic의 Claude 3 Haiku
Anthropic의 Claude 3.7 Sonnet(지원 중단됨)
Codestral(24.05)
Codestral 2
Mistral Large(24.07)
Mistral Medium 3
Mistral OCR(25.05)
Mistral Small 3.1(25.03)

Google Cloud 개방형 모델 지원

멀티 리전

모델 미국 멀티 리전 EU 멀티 리전
DeepSeek-OCR
DeepSeek R1(0528)
DeepSeek-V3.1
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 70B(프리뷰)
Llama 3.1 8B(프리뷰)
Llama 3.2 90B(프리뷰)
Llama 3.3 70B(프리뷰)
Llama 3.1 405B
Llama 4 Maverick 17B-128E(프리뷰)
Llama 4 Scout 17B-16E(프리뷰)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

유럽

모델 벨기에(europe-west1) 네덜란드(europe-west4)
DeepSeek-OCR
DeepSeek R1(0528)
DeepSeek-V3.1
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 70B(프리뷰)
Llama 3.1 8B(프리뷰)
Llama 3.2 90B(프리뷰)
Llama 3.3 70B(프리뷰)
Llama 3.1 405B
Llama 4 Maverick 17B-128E(프리뷰)
Llama 4 Scout 17B-16E(프리뷰)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

아시아 태평양

모델 싱가포르(asia-southeast1) 타이완(asia-east1)
DeepSeek-OCR
DeepSeek R1(0528)
DeepSeek-V3.1
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 70B(프리뷰)
Llama 3.1 8B(프리뷰)
Llama 3.2 90B(프리뷰)
Llama 3.3 70B(프리뷰)
Llama 3.1 405B
Llama 4 Maverick 17B-128E(프리뷰)
Llama 4 Scout 17B-16E(프리뷰)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

다음 단계