가용성 권장사항

이 페이지에서는 Google Distributed Cloud connected 설치의 고가용성을 보장하기 위한 권장사항을 설명합니다. Distributed Cloud connected는 서비스수준계약 (SLA)을 제공하지 않으며 이 페이지에 설명된 서비스 수준 목표 (SLO)만 제공합니다.

가용성 수준 선택 및 구현

비즈니스 요구사항에 가장 적합한 Distributed Cloud connected 워크로드의 가용성 수준을 선택해야 합니다. 예를 들어 소매점의 셀프 체크아웃 애플리케이션은 모바일 네트워크 이동통신사의 에지 RAN 배포보다 가용성 위험이 훨씬 낮습니다.

대상 가용성은 비상사태를 위해 예약하는 Distributed Cloud 예비 리소스 용량에 정비례합니다. 다음 표에서는 이 관계를 설명합니다. 이러한 추정치에는 유지보수 기간에 예약된 다운타임이 포함되지 않습니다.

Distributed Cloud connected 소프트웨어는 각 물리적 머신에서 일부 리소스를 사용합니다. 양은 Distributed Cloud connected 배포의 특정 구성에 따라 다릅니다. Google은 이 양을 측정하고 워크로드 배포를 계획할 때 이를 고려하기 위해 Distributed Cloud connected 배포를 벤치마킹하는 것이 좋습니다.

사용 중인 용량 예약된 용량 대상 가용성
66.6% 33.3% 99.9%

하드웨어 장애 또는 다시 시작해야 하는 노드로 인해 용량이 갑자기 손실될 수 있습니다. 이를 대비하려면 선택한 가용성 수준을 충족하는 Distributed Cloud connected 노드에서 항상 사용 가능한 용량을 확보할 수 있도록 리소스 할당량을 고려하여 워크로드를 설계해야 합니다.

Distributed Cloud 영역을 지리적으로 다양화

잠재적인 관리 영역 오류의 영향을 최소화하려면 Distributed Cloud 영역을 여러 인접 리전에 분산하는 것이 좋습니다.

생존 가능성 모드 사용

Distributed Cloud 클러스터는 Distributed Cloud connected 하드웨어에서 실행되는 로컬 제어 영역을 사용합니다. 에 대한 연결이 끊어져도 워크로드는 계속 실행됩니다. Google Cloud 자세한 내용은 Distributed Cloud connected 생존 가능성 모드를 참조하세요.

소프트웨어 업데이트 및 유지보수 기간 이해

Google은 Distributed Cloud connected 소프트웨어를 정기적으로 업데이트합니다. 이러한 소프트웨어 업데이트는 필수이며 선택 해제할 수 없습니다. Distributed Cloud connected를 사용하면 각 Distributed Cloud connected 클러스터에 개별 유지보수 기간을 지정할 수 있습니다.

워크로드의 잠재적인 일시적 중단을 완화하기 위해 유지보수 기간을 통해 제어 영역과 노드의 자동 업그레이드 수행 시기를 제어할 수 있습니다. 유지보수 기간은 다음과 같은 상황에서 유용합니다.

  • 사용량이 적은 시간대: 트래픽이 줄어드는 사용량이 적은 시간대에 자동 업그레이드를 예약하여 다운타임 발생 가능성을 최소화할 수 있습니다.
  • 업무 시간 중: 누군가 업그레이드를 모니터링하고 예상치 못한 문제를 관리할 수 있도록 업무 시간 중 업그레이드가 실시되도록 할 수 있습니다.
  • 다중 클러스터 업그레이드: 지정된 간격으로 한 번에 하나씩 여러 지역에 있는 여러 클러스터에 업그레이드를 출시할 수 있습니다.

Distributed Cloud connected는 다음 유형의 유지보수 기간을 지원합니다.

  • 유지보수 기간. Google이 Distributed Cloud connected 클러스터에서 유지보수 및 소프트웨어 업그레이드를 수행할 수 있는 기간을 지정합니다.
  • 유지보수 제외 기간. Google이 Distributed Cloud connected 클러스터에서 유지보수 또는 소프트웨어 업그레이드를 수행할 수 없는 기간을 지정합니다. 유지보수 제외 기간을 구성하려면 먼저 유지보수 기간을 구성해야 합니다. 유지보수 제외 기간은 클러스터의 유지보수 기간보다 우선 적용됩니다.

자동 업그레이드 외에도 Google은 경우에 따라 다른 유지보수 작업을 수행해야 할 수 있습니다. 이러한 경우 가능한 경우 클러스터의 유지보수 기간을 적용합니다.

소프트웨어 업그레이드 또는 유지보수 작업이 유지보수 기간이 끝나기 전에 완료되지 않으면 Distributed Cloud connected는 업그레이드 또는 작업을 일시중지하고 다음 예약된 유지보수 기간 중에 다시 시작합니다. 소프트웨어 업그레이드가 실패하면 Distributed Cloud connected는 업그레이드를 중지합니다. 이 경우 Google 지원팀에 문의하여 소프트웨어 설치를 복구해야 합니다.

Distributed Cloud connected는 유지보수 기간 외에도 계획되지 않은 긴급 업그레이드를 출시할 수 있는 권리가 있습니다. 또한 지원 중단되었거나 오래된 소프트웨어의 필수 업그레이드는 유지보수 기간이 아닐 때에도 자동으로 진행될 수 있습니다.

언제든지 클러스터를 수동으로 업그레이드할 수도 있습니다. 수동으로 시작한 업그레이드는 즉시 시작되고 유지보수 기간은 무시됩니다.

새 클러스터 또는 기존 클러스터에 유지보수 기간을 설정하는 방법은 유지보수 기간 구성을 참조하세요.

소프트웨어 업데이트 스테거링

워크로드 다운타임을 줄이기 위해 Distributed Cloud connected 소프트웨어 업데이트가 스테거링됩니다. 즉, Google은 각 Distributed Cloud connected 클러스터의 작업자 노드를 단계별로 업그레이드합니다. 소프트웨어 업그레이드 단계의 모든 작업자 노드가 동시에 다운됩니다.

자체 소프트웨어 업그레이드 단계 크기를 설정할 수도 있습니다. 즉, Distributed Cloud connected 클러스터에서 소프트웨어 업그레이드를 위해 동시에 다운될 수 있는 노드 수를 지정할 수 있습니다. 안내는 소프트웨어 업그레이드 중 노드 다운타임 관리를 참조하세요.

제한사항

유지보수 기간에는 다음과 같은 제한사항이 있습니다.

  • 클러스터당 유지보수 기간 하나. 클러스터당 유지보수 기간을 하나만 구성할 수 있습니다. 새 유지보수 기간을 구성하면 이전 유지보수 기간을 덮어씁니다.

  • 유지보수 기간 표준 시간대. 유지보수 기간을 구성 및 확인할 때 사용 중인 도구에 따라 시간이 다르게 표시됩니다. 자세한 내용은 다음 섹션을 참조하세요.

유지보수 기간을 구성할 경우

보다 일반적인 --maintenance-window 플래그를 사용하여 유지보수 기간을 구성할 때는 표준 시간대를 지정할 수 없습니다. Google Cloud CLI 또는 API를 사용할 때는 UTC가 시간을 표시하는 데 사용됩니다. 콘솔은 현지 표준 시간대를 사용하여 시간을 표시합니다. Google Cloud

--maintenance-window-start와 같이 더욱 세분화된 플래그를 사용하면 값의 일부로 표준 시간대를 지정할 수 있습니다. 표준 시간대를 생략하면 현지 표준 시간대가 사용됩니다. 시간은 항상 UTC로 저장됩니다.

유지보수 기간을 확인할 경우

클러스터 정보를 확인할 경우 정보 확인 방법에 따라 유지보수 기간의 타임스탬프가 UTC 또는 현지 표준 시간대로 표시될 수 있습니다.

  • 콘솔을 사용하여 클러스터의 정보를 확인할 경우 시간은 항상 현지 표준 시간대로 표시됩니다. Google Cloud
  • gcloud CLI를 사용하여 클러스터에 대한 정보를 보는 경우 시간은 항상 UTC로 표시됩니다.

두 경우 모두 RRULE은 항상 UTC입니다. 즉, 예를 들어 요일을 지정하면 해당 요일은 UTC로 표시됩니다.

클러스터 유지보수 기간 구성

Distributed Cloud connected를 사용하면 각 Distributed Cloud connected 클러스터에 유지보수 기간을 지정할 수 있습니다. 이 기간은 Google에 지정한 시간과 빈도로만 Distributed Cloud 소프트웨어를 업데이트하도록 지시합니다.

다음 규칙은 Distributed Cloud connected 클러스터 유지보수 기간을 관리합니다.

자세한 내용은 클러스터의 유지보수 기간 구성을 참조하세요.

실패한 하드웨어 복구

Google은 Distributed Cloud connected 하드웨어의 장애를 감지하면 다음 중 하나를 수행합니다.

  • Google 소유의 Distributed Cloud 하드웨어의 경우 Google은 영업일 기준 3일 이내에 현장 방문을 예약하려고 시도합니다. Google 공인 기술자가 필요한 진단 및 수리를 수행하려면 Distributed Cloud connected 하드웨어에 대한 액세스 권한을 부여해야 합니다.

  • 고객 소유의 Distributed Cloud 하드웨어의 경우 Google은 고객과 Google 공인 SI에 문제를 알립니다. Distributed Cloud connected 하드웨어를 제공한 SI와 협력하여 기술자 방문을 예약하고 필요한 진단 및 수리를 수행해야 합니다.

Distributed Cloud connected 하드웨어에 장애가 발생하면 Google 또는 Google 공인 SI가 전체 머신을 교체합니다. Google은 머신이 사용자의 시설에서 제거되기 전에 모든 드라이브에서 데이터가 안전하게 삭제되었는지 확인합니다.

기타 장애점

Google의 제어 범위를 벗어나 Distributed Cloud connected의 가용성에 영향을 미칠 수 있는 Distributed Cloud 설치의 다음 측면을 유지할 책임은 사용자에게 있습니다.

  • Distributed Cloud connected 하드웨어에 저장하기로 선택한 모든 데이터. 여기에는 작동하는 중복 백업과 Distributed Cloud connected 하드웨어를 Google에 반환하기 전에 데이터 내보내기가 포함됩니다.
  • 전원 공급 장치.
  • 주변 온도, 습도, 냉각.
  • 물리적 하드웨어 보안.
  • 로컬 네트워크 보안.
  • 로컬 네트워크 및 인터넷 연결. Distributed Cloud connected는 보안 토큰, 암호화 키를 새로고침하고 로깅 및 관리 데이터를 동기화하기 위해 7일마다에 다시 연결해야 합니다. Google Cloud

다음 단계