인공지능 (AI), 머신러닝 (ML), 고성능 컴퓨팅 (HPC) 워크로드를 실행하려면 AI 최적화 VM과 A4X, A4, A3 Ultra, A3 Mega, A3 High (GPU 8개) 머신 클러스터를 배포하면 됩니다. 대규모 AI/ML 클러스터를 실행할 수 있는 이러한 머신의 기능에 관한 자세한 내용은 클러스터 관리 개요를 참고하세요.
Compute Engine에서 직접 또는 Compute Engine 인스턴스에서 실행되는 다른 서비스(예: Cluster Toolkit 또는 Google Kubernetes Engine)를 통해 A4X, A4, A3 Ultra, A3 Mega, A3 High(GPU 8개) VM을 만들 수 있습니다.
사용 사례에 맞는 VM 또는 클러스터를 만드는 데 가장 적합한 옵션을 선택하려면 다음 중 하나를 선택하세요.
| 옵션 | 사용 사례 |
|---|---|
| Cluster Director | Slurm 클러스터의 설정 및 구성을 자동화하는 완전 관리형 서비스를 원하는 경우 Cluster Director를 사용하면 클러스터의 컴퓨팅, 네트워킹, 스토리지 리소스를 구성하여 성능을 극대화하고 다운타임을 최소화할 수 있습니다. 자세한 내용은 템플릿을 기반으로 AI에 최적화된 클러스터 만들기를 참고하세요. |
| Cluster Toolkit | Slurm 및 GKE 클러스터를 모두 배포하는 프로세스를 간소화하는 오픈소스 소프트웨어를 사용하고 싶습니다. Cluster Toolkit은 맞춤설정 가능성과 확장성이 매우 높게 설계되었습니다. 자세한 내용은 다음을 참고하세요. |
| GKE | 워크로드의 요구사항에 따라 Google Kubernetes Engine 클러스터를 최대한 유연하게 구성하고 싶습니다. 자세한 내용은 맞춤 AI 최적화 Google Kubernetes Engine 클러스터 만들기를 참고하세요. |
| Compute Engine 사용 | 자체 오케스트레이터를 설정할 수 있도록 인프라 레이어를 완전히 제어하고 싶습니다. 자세한 내용은 다음을 참조하세요.
|