배포 옵션 개요

인공지능 (AI), 머신러닝 (ML), 고성능 컴퓨팅 (HPC) 워크로드를 실행하려면 AI 최적화 VM과 A4X, A4, A3 Ultra, A3 Mega, A3 High (GPU 8개) 머신 클러스터를 배포하면 됩니다. 대규모 AI/ML 클러스터를 실행할 수 있는 이러한 머신의 기능에 관한 자세한 내용은 클러스터 관리 개요를 참고하세요.

Compute Engine에서 직접 또는 Compute Engine 인스턴스에서 실행되는 다른 서비스(예: Cluster Toolkit 또는 Google Kubernetes Engine)를 통해 A4X, A4, A3 Ultra, A3 Mega, A3 High(GPU 8개) VM을 만들 수 있습니다.

사용 사례에 맞는 VM 또는 클러스터를 만드는 데 가장 적합한 옵션을 선택하려면 다음 중 하나를 선택하세요.

옵션 사용 사례
Cluster Director Slurm 클러스터의 설정 및 구성을 자동화하는 완전 관리형 서비스를 원하는 경우 Cluster Director를 사용하면 클러스터의 컴퓨팅, 네트워킹, 스토리지 리소스를 구성하여 성능을 극대화하고 다운타임을 최소화할 수 있습니다. 자세한 내용은 템플릿을 기반으로 AI에 최적화된 클러스터 만들기를 참고하세요.
Cluster Toolkit

Slurm 및 GKE 클러스터를 모두 배포하는 프로세스를 간소화하는 오픈소스 소프트웨어를 사용하고 싶습니다. Cluster Toolkit은 맞춤설정 가능성과 확장성이 매우 높게 설계되었습니다. 자세한 내용은 다음을 참고하세요.

GKE 워크로드의 요구사항에 따라 Google Kubernetes Engine 클러스터를 최대한 유연하게 구성하고 싶습니다. 자세한 내용은 맞춤 AI 최적화 Google Kubernetes Engine 클러스터 만들기를 참고하세요.
Compute Engine 사용

자체 오케스트레이터를 설정할 수 있도록 인프라 레이어를 완전히 제어하고 싶습니다. 자세한 내용은 다음을 참조하세요.