예약 유형 선택

이 문서에서는 Compute Engine 인스턴스의 용량을 예약하는 데 사용할 수 있는 다양한 예약 유형을 설명합니다. 인스턴스를 만드는 데 사용할 수 있는 리소스에 대해 자세히 알아보려면 Compute Engine 인스턴스를 참조하세요.

예약을 하면 필요할 때마다 동일한 하드웨어(메모리 및 vCPU)와 선택적 리소스(GPU, TPU 또는 로컬 SSD 디스크)를 사용하여 인스턴스를 만들 수 있는 리소스를 확보할 수 있습니다. 예약은 다음과 같은 이점을 제공합니다.

  • 신뢰도 높은 용량: 다음과 같은 향후 수요 증가에 대비해 리소스를 예약합니다.

    • 성장

    • 계획되거나 계획되지 않은 사용량 급증

    • 대규모 마이그레이션

    • 백업 및 재해 복구

  • 독점 액세스: 예약하면 다른 사용자가 예약된 리소스를 사용할 수 없습니다.

  • 상속된 속성: 예약이 선택된 머신 계열과 동일한 속성을 상속합니다.

용량을 예약한 후 이를 사용하여 예약과 일치하는 인스턴스를 만들 수 있습니다. 이러한 인스턴스를 만들 때는 추가 비용이 청구되지 않습니다. 디스크나 IP 주소와 같이 예약에 포함되지 않은 리소스에 대해서만 비용을 지불합니다.

제한사항

모든 예약 유형에는 다음과 같은 제한사항이 있습니다.

  • 예약은 영역별 리소스입니다.

  • 예약된 용량은 다음 Compute Engine 리소스를 만드는 데 사용할 수 없습니다.

    • 스팟 VM 또는 선점형 인스턴스

    • 단독 테넌트 노드

예약 유형 선택

다음 다이어그램은 워크로드의 요구사항에 가장 적합한 Compute Engine 예약 유형을 선택하는 데 도움이 됩니다.

Compute Engine에서 사용할 수 있는 다양한 예약 방법을 보여주는 플로우 차트

위 다이어그램의 질문은 다음과 같습니다.

  1. 지금 바로 용량이 필요한가요?

    • : 다음 질문으로 이동합니다.

    • 아니요: 질문 3으로 이동합니다.

  2. 용량 유지 기간을 유연하게 조정해야 하나요?

  3. GPU와 같이 수요가 많은 리소스가 필요한가요?

  4. 90일 이상 리소스가 필요하신가요?

온디맨드 예약 사용

온디맨드 예약을 사용하면 컴퓨팅 인스턴스의 용량을 예약하고 예약하는 즉시 사용할 수 있습니다. 온디맨드 예약을 만든 후 필요할 때마다 사용하거나 수정하거나 삭제할 수 있습니다.

자세한 내용은 예약 정보를 참고하세요.

미래용 예약 사용

설정된 기간 동안 인스턴스를 예약하려면 미래용 예약을 사용하면 됩니다. 예약 요청을 만든 후에는 검토를 위해 Google Cloud 에 제출해야 합니다.Google Cloud 에서 요청을 검토하는 데는 일반적으로 5일이 걸립니다. 요청이 승인되면 Compute Engine은 선택된 날짜와 시간에 요청된 용량으로 온디맨드 예약을 만듭니다. 이러한 예약을 사용하려면 예약을 사용하는 컴퓨팅 인스턴스를 만듭니다. 예약 기간이 종료된 후에는 예약을 수정하거나 삭제할 수 있습니다.

자세한 내용은 미래용 예약 요청 정보를 참고하세요.

캘린더 모드에서 미래용 예약 사용

최대 90일 동안 GPU 인스턴스 또는 TPU를 예약하려면 캘린더 모드에서 미래용 예약을 사용하면 됩니다. 이 유형의 예약을 만들려면 먼저 선택한 수와 유형의 리소스를 리전에서 사용할 수 있는 시점을 확인합니다. 그런 다음 사용 가능한 것으로 확인된 속성으로 예약 요청을 만들어 제출합니다. 요청을 성공적으로 생성할 수 있으면Google Cloud 에서 1분 이내에 승인합니다. 요청이 승인되면 Compute Engine에서 다음을 수행합니다.

  • Compute Engine에서 온디맨드 예약을 만듭니다.

  • Compute Engine에서 네트워크 지연 시간을 최소화하기 위해 요청된 리소스를 최대한 서로 가까운 위치에 예약합니다.

예약 기간이 시작되면 GPU 또는 TPU 인스턴스를 만들어 예약을 사용할 수 있습니다. 예약 기간이 끝나면 Compute Engine은 예약을 삭제하고 인스턴스에 지정된 종료 작업을 기반으로 예약을 사용하는 모든 인스턴스를 중지하거나 삭제합니다.

자세한 내용은 캘린더 모드의 미래용 예약 요청 정보를 참고하세요.

AI 하이퍼컴퓨터에서 미래용 예약 사용

계정팀에 문의하여 대규모 인공지능(AI) 및 머신러닝(ML) 워크로드용 GPU 인스턴스를 예약해 달라고 요청합니다. Google에서 예약 요청 초안을 만든 후 모든 항목이 올바른지 확인하고 검토를 위해 제출합니다. Google Cloud 에서 즉시 요청을 승인한 후 Compute Engine은 다음을 수행합니다.

  • Compute Engine에서 온디맨드 예약을 만듭니다.

  • Compute Engine에서 네트워크 지연 시간을 최소화하기 위해 요청된 리소스를 최대한 서로 가까운 위치에 예약합니다.

  • Compute Engine은 토폴로지 인식 예약과 향상된 모니터링 및 유지보수를 통해 리소스를 예약합니다.

예약 기간이 시작되면 GPU 인스턴스를 만들어 예약을 사용할 수 있습니다. 예약 기간이 끝나면 Compute Engine은 예약을 삭제하고 인스턴스에 지정된 종료 작업을 기반으로 예약을 사용하는 모든 인스턴스를 중지하거나 삭제합니다.

자세한 내용은 AI 하이퍼컴퓨터 문서의 용량 예약을 참조하세요.