이 페이지에서는 실패 컴퓨팅 결함 유형을 사용하는 실험 중에 발생하는 상황과 결함 주입 테스트로 실험을 중지할 수 없는 경우 취해야 하는 조치를 설명합니다.
Fail Compute 결함은 어떻게 작동하나요?
실패한 컴퓨팅 결함은 리소스 태그를 사용하여 VM을 표시하고 해당 태그를 타겟팅하는 규칙이 있는 방화벽 정책을 사용하여 모든 인그레스 및 이그레스 트래픽을 차단합니다. 이 설정을 사용하면 타겟 리소스가 작동 중단된 것처럼 표시되지만 손상되지 않고 신속하게 복구할 수 있습니다.
이 결함의 타겟은 다음일 수 있습니다.
- 가상 머신 인스턴스
- 지정된 리소스 태그를 기반으로 하는 VM
- 지정된 영역 또는 리전 관리형 인스턴스 그룹 (MIG) 내의 VM
- 영역의 비MIG VM 및 영역 MIG의 VM
- 리전의 비MIG 및 모든 MIG의 VM
실험 실행 중에 발생하는 상황
실험이 상태를 거치면서 관련 리소스에 다음과 같은 변경사항이 적용됩니다.
리소스 |
|
|
|
VM |
없음 |
리소스 태그 바인딩 |
리소스 태그 바인딩 해제 |
MIG / RMIG |
없음 |
자동 복구 및 자동 확장 사용 중지 (활성 상태인 경우) |
자동 복구 및 자동 확장 설정 복원 |
Tag |
실험을 위한 고유한 TagValue 리소스 만들기 |
없음 |
태그 값 삭제 |
방화벽 정책 |
시스템 수준 FirewallPolicy 리소스 만들기 |
DENY 규칙으로 채우고 정책을 관련 VPC에 바인딩 |
VPC에서 바인딩 해제하고 FirewallPolicy 삭제 |
긴급 수동 복구
Fault Injection Testing에서 실험을 자동으로 중지할 수 없는 심각한 백엔드 오류가 발생한 경우 영향을 받는 VM에 바인딩된 리소스 태그를 수동으로 삭제하여 VM 리소스에 대한 연결을 수동으로 복원할 수 있습니다. 이러한 태그를 타겟팅하는 시스템 방화벽 정책이 더 이상 적용되지 않아 VM이 격리 오류에서 효과적으로 분리됩니다.
필수 권한
다음 IAM 권한이 필요합니다.
- VM 인스턴스를 보려면 다음이 필요합니다.
compute.instances.getcompute.instances.list
- 태그 바인딩을 보고 삭제하는 데 필요합니다.
resourcemanager.tagValueBindings.listresourcemanager.tagValueBindings.delete
Google Cloud 콘솔 UI를 사용한 수동 복구
Google Cloud 콘솔을 사용하여 복구를 수행하려면 다음 안내를 따르세요.
- Google Cloud 콘솔에서 VM 인스턴스 페이지로 이동합니다.
- 격리 오류의 영향을 받는 특정 VM 인스턴스를 선택합니다.
- 인스턴스 세부정보 페이지에서 태그를 관리하는 섹션으로 이동합니다.
- 실험별 태그 바인딩을 식별합니다. 이는 Fault Injection Testing Fail Compute 결함과 연결되어 있습니다.
- VM에서 태그 바인딩을 삭제합니다.
태그가 삭제되면 연결된 방화벽 정책이 더 이상 VM을 타겟팅하지 않으며 연결이 복원됩니다.
gcloud CLI를 사용한 수동 복구
Google Cloud CLI를 사용하여 VM에서 실험 태그 바인딩을 수동으로 삭제할 수 있습니다. 다음 명령어에서 TAG_VALUE_NAME,
PROJECT_NUMBER, ZONE 및 VM_NAME를 환경에 맞는 특정 값으로 바꿉니다.
먼저 VM의 현재 태그 바인딩을 나열하여 실험별 태그 값 이름을 가져옵니다.
gcloud resource-manager tag bindings list --resource=//compute.googleapis.com/projects/PROJECT_NUMBER/zones/ZONE/instances/VM_NAME
이전 명령어의 출력을 사용하여 삭제 단계에 필요한 TAG_VALUE_NAME를 확인합니다.
gcloud resource-manager tag bindings delete --tag-value=TAG_VALUE_NAME --resource=//compute.googleapis.com/projects/PROJECT_NUMBER/zones/ZONE/instances/VM_NAME
태그가 삭제되면 연결된 방화벽 정책이 더 이상 VM을 타겟팅하지 않으며 연결이 복원됩니다.