Vertex AI는 생성형 AI 및 머신러닝(ML) 모델과 AI 애플리케이션을 빌드, 배포, 확장하기 위한 통합 개방형 플랫폼입니다. 이 플랫폼은 Model Garden에 대한 액세스를 제공하며, 여기에는 Gemini와 같은 Google의 파운데이션 모델을 비롯해 200개 이상의 모델로 구성된 엄선된 카탈로그와 파트너 및 개방형 모델의 포괄적인 선택, 그리고 기본 TPU/GPU 인프라가 포함되어 있습니다. Vertex AI는 최첨단 생성형 AI 워크플로와 MLOps용 AI 추론 워크플로를 지원합니다. 거버넌스, 보안, 규정 준수를 위한 엔드 투 엔드 MLOps 도구와 엔터프라이즈급 제어 기능을 제공합니다.
Vertex AI의 주요 기능
Vertex AI에는 생성형 AI는 물론 AI 추론 및 머신러닝 워크플로를 지원하는 도구와 서비스가 포함되어 있습니다.
생성형 AI 기능
Vertex AI는 다음과 같이 프로덕션에 즉시 사용 가능한 생성형 AI 에이전트와 애플리케이션을 빌드하는 데 사용할 수 있는 Google의 고급 파운데이션 모델 도구와 함께 포괄적인 도구 세트를 제공합니다.
프롬프트: Vertex AI Studio에서 프롬프트 설계로 시작합니다. Vertex AI Studio에는 프롬프트 설계 및 모델 관리 도구가 포함되어 있어 이를 사용하여 생성형 AI 애플리케이션을 프로토타입으로 제작하고, 빌드하고, 배포할 수 있습니다.
모델: Vertex AI Model Garden은 Google, 주요 서드 파티 파트너(예: Anthropic의 Claude), 인기 오픈소스 옵션(예: Llama)에서 제공하는 200개 이상의 엔터프라이즈 지원 모델을 한데 모아 제공하는 중앙 집중식 허브입니다.
이 모델 선택에는 다음이 포함됩니다.
Google의 기본 생성형 AI 모델:
- Gemini: 텍스트, 이미지, 동영상, 오디오를 위한 멀티모달 기능과 Gemini 3 Flash, Gemini 3 Pro(Nano Banana 포함)와 같은 모델의 사고 능력을 제공합니다.
- Vertex AI의 Imagen: 이미지를 생성하고 편집합니다.
- Vertex AI의 Veo: 텍스트와 이미지로부터 동영상을 생성합니다.
파트너 및 오픈소스 모델: Anthropic의 Claude, Mistral AI 모델, Llama와 같이 엄선된 주요 모델을 우수한 가격 대비 성능으로 이용할 수 있습니다. 이러한 모델은 완전 관리형 서비스형 모델(MaaS) API로 제공됩니다.
모델 맞춤설정: 비즈니스에 맞게 모델을 맞춤설정하여 자체 AI 애셋을 만듭니다. 이는 할루시네이션을 줄이기 위한 기업 데이터 또는 Google 검색 기반 그라운딩부터 Gemini와 같은 모델의 지도 미세 조정(SFT) 또는 Parameter-Efficient Fine-Tuning(PEFT)을 위한 Vertex AI Training 활용에 이르기까지 다양합니다. 모델 맞춤설정에 대한 자세한 내용은 조정 소개를 참조하세요.
생성형 AI 평가: Gen AI Evaluation Service를 사용하여 모델 및 에이전트 성능을 객관적으로 평가하고 비교합니다. Model Armor와 같은 런타임 방어 기능을 배포하여 프롬프트 인젝션, 데이터 무단 반출과 같은 새로운 위협을 사전에 검사하고 보호하여 안전성과 규정 준수를 보장합니다.
에이전트 빌더: Vertex AI Agent Builder는 AI 에이전트를 만들고, 관리하고, 배포하는 데 도움이 되는 풀 스택 에이전트 변환 시스템입니다. 오픈소스 에이전트 개발 키트(ADK)를 사용하여 에이전트를 빌드하고 조정한 다음 관리형 서버리스 Vertex AI Agent Engine에 배포하여 대규모 프로덕션에 사용합니다. 각 에이전트에는 보안 및 명확한 감사 추적을 위해 에이전트 ID(Identity and Access Management 주 구성원)가 할당됩니다.
외부 정보 액세스: 그라운딩으로 신뢰할 수 있는 소스에 연결하고, 함수 호출을 통해 외부 API와 상호작용하며, RAG로 기술 자료에서 정보를 검색하여 모델 응답을 향상시킵니다.
책임감 있는 AI 및 안전: 내장된 안전 기능을 사용하여 유해한 콘텐츠를 차단하고 책임감 있는 AI 사용을 보장합니다.
Vertex AI의 생성형 AI에 대한 자세한 내용은 Vertex AI의 생성형 AI 문서를 참조하세요.
AI 추론 기능
Vertex AI는 ML 워크플로의 각 단계에 매핑되는 도구와 서비스를 제공합니다.
데이터 준비: 데이터를 수집, 정리, 변환합니다.
- Vertex AI Workbench 노트북을 사용하여 탐색적 데이터 분석(EDA)을 수행합니다.
- 데이터 액세스를 위해 Cloud Storage 및 BigQuery와 통합합니다.
- 대규모 데이터 처리를 위해 Dataproc Serverless Spark를 사용합니다.
모델 학습: ML 모델을 학습시킵니다.
- 코드 없이 학습할 수 있는 AutoML과 완전한 제어를 위한 커스텀 학습 중에서 선택하세요.
- Vertex AI Experiments를 사용하여 학습 실행을 관리하고 비교합니다.
- 학습된 모델을 Vertex AI Model Registry에 등록합니다.
- Vertex AI Training은 서버리스 학습과 학습 클러스터 모두를 제공합니다.
- Vertex AI 서버리스 학습을 사용하여 완전 관리형 환경에서 주문형으로 커스텀 학습 코드를 실행합니다. [Vertex AI 서버리스 학습 개요][서버리스]를 참조하세요.
- 전용으로 예약된 액셀러레이터 클러스터에서 보장된 용량이 필요한 대규모 작업에 Vertex AI 학습 클러스터를 사용합니다. Vertex AI 학습 클러스터 개요를 참조하세요.
- Vertex AI 기반 Ray를 사용하여 관리형 대화형 클러스터에서 오픈소스 Ray 프레임워크를 사용해 Python 및 ML 워크로드를 확장합니다. Vertex AI 기반 Ray 개요를 참조하세요.
- Vertex AI Vizier를 사용하여 복잡한 ML 모델에서 모델 초매개변수를 조정합니다.
모델 평가 및 반복: 모델 성능을 평가하고 개선합니다.
- 모델 평가 측정항목을 사용하여 모델을 비교합니다.
- Vertex AI Pipelines 워크플로 내에서 평가를 통합합니다.
모델 서빙: 모델을 배포하고 모델로부터 추론을 가져옵니다.
- 사전 빌드된 컨테이너 또는 커스텀 컨테이너를 사용하여 온라인 추론을 위해 배포합니다.
- 대규모 데이터 세트에 대해 일괄 추론을 실행합니다.
- 효율적인 TensorFlow 서빙을 위해 최적화된 TensorFlow 런타임을 사용합니다.
- Vertex Explainable AI를 사용하여 모델 추론을 이해합니다.
- Vertex AI Feature Store에서 특성을 제공합니다.
- BigQuery ML로 학습된 모델을 배포합니다.
모델 모니터링: 배포된 모델의 성능을 시간에 따라 추적합니다.
- Vertex AI Model Monitoring을 사용하여 학습-서빙 편향과 추론 드리프트를 감지합니다.
MLOps 도구
ML 프로젝트 자동화, 관리, 모니터링:
- Vertex AI Pipelines: 재사용 가능한 파이프라인으로 ML 워크플로를 조정하고 자동화합니다.
- Vertex AI Model Registry: 버전 관리 및 배포를 비롯한 ML 모델의 수명 주기를 관리합니다.
- Vertex AI 서버리스 학습: 완전 관리형 환경에서 주문형으로 커스텀 학습 코드를 실행합니다.
- Vertex AI Model Monitoring: 배포된 모델을 대상으로 데이터 편향 및 드리프트를 모니터링하여 성능을 유지합니다.
- Vertex AI Experiments: 다양한 모델 아키텍처와 하이퍼파라미터를 추적하고 분석합니다.
- Vertex AI Feature Store: 모델 학습이나 실시간 예측에 사용되는 특성 데이터를 관리하고 제공합니다.
- Vertex ML Metadata: ML 아티팩트에 대한 메타데이터를 추적하고 관리합니다.
- Vertex AI Training 클러스터: 보장된 용량이 필요한 대규모 작업을 전용으로 예약된 액셀러레이터 클러스터에서 훈련합니다.
- Vertex AI 기반 Ray: 관리형 대화형 클러스터에서 오픈소스 Ray 프레임워크를 사용해 Python 및 ML 워크로드를 확장합니다.
다음 단계
- Vertex AI의 생성형 AI 자세히 알아보기
- Vertex AI의 MLOps 기능 알아보기
- Vertex AI와 상호작용하는 데 사용할 수 있는 인터페이스 살펴보기