Google Distributed Cloud Connected를 모니터링하고 유지하는 것은 사용자와 Google의 공동 책임입니다. 이 페이지에서는 이러한 책임을 설명합니다.
개요
다음 표에는 Distributed Cloud 연결 관리 작업의 책임이 요약되어 있습니다.
| 문제 | 나 | |
|---|---|---|
| Google Cloud와의 연결이 끊어지면 감지하여 알림을 보냅니다. | X | |
| 전원, 냉각, 환경 문제 감지 및 해결 | X | |
| 로컬 네트워크 문제 감지 및 해결 | X | X |
| 배스천 호스트 및 경계 프록시 인스턴스 관련 문제 식별 및 해결 | X | |
| Google Cloud 컨트롤 플레인 모니터링 | X | |
| Kubernetes 컨트롤 플레인, 워커 노드, 시스템 서비스 모니터링 | X | |
| Google에서 제공하는 서드 파티 솔루션(예: Symcloud Storage) 모니터링 | X | |
| Google에서 직접 조달한 하드웨어 모니터링 및 문제 해결 | X | |
| Google 인증 서드 파티 SI에서 조달한 하드웨어 모니터링 및 문제 해결 | X | |
| 로컬 네트워크 모니터링 및 문제 해결 | X | |
| 업스트림 네트워크 연결 모니터링 | X | |
| 네트워크, 전원 또는 냉각 문제의 공동 진단에 참여 | X | |
| 측정항목 및 로그를 포함한 플랫폼 관측 가능성 | X | |
| 측정항목 및 로그를 포함한 애플리케이션 관측 가능성 | X | |
| 담당하는 문제 진단 및 해결 | X |
Google의 책임
Google은 Distributed Cloud Connected 배포의 다음 측면을 담당합니다.
- Google에서 직접 조달한 Distributed Cloud(연결형) 하드웨어. Google 파트너 서드 파티 시스템 통합업체(SI)에서 조달한 하드웨어는 Google에서 책임지지 않습니다.
- Google Cloud 컨트롤 플레인
- Distributed Cloud(연결형) 하드웨어에서 실행되는 Kubernetes 컨트롤 플레인, 작업자 노드, 내장 시스템 서비스
- Google 제공 소프트웨어 부가기능 및 제품
Google은 이러한 측면의 상태와 성능을 지속적으로 모니터링합니다. 문제가 감지되면 알림을 보내고 시정 조치를 취합니다.
개발자 책임
Distributed Cloud Connected 배포의 다음 측면에 대한 책임은 사용자에게 있습니다.
- Google 인증 서드 파티 시스템 통합업체 (SI)에서 조달한 Distributed Cloud 연결 하드웨어. Google에서 직접 조달한 하드웨어는 책임지지 않습니다.
- 로컬 네트워크 및 구성
- 인터넷 연결
- 배포 사이트의 전력, 냉각, 주변 온도, 습도
- Distributed Cloud connected 배포에 설치한 서드 파티 소프트웨어 솔루션
- 배스천 호스트 인스턴스 및 경계 프록시 배포(해당하는 경우)
- 워크로드
Google은 이러한 측면을 모니터링하지 않으며 발생하는 문제를 사용자에게 알리지 않습니다. 워크로드 문제가 Distributed Cloud Connected로 인해 발생한다고 생각되면 Google 지원팀에 문의하세요.
공동 책임
경우에 따라 Google에서 귀하의 책임에 속한다고 판단되는 문제를 감지할 수 있습니다. 예를 들어 Distributed Cloud에 연결된 하드웨어 내에서 온도가 상승한 후 Google Cloud에 대한 연결이 끊어지는 것을 감지할 수 있으며, 이는 냉각 실패를 나타낼 수 있습니다. 이러한 상황에서 Google은 공동으로 문제를 해결하고 해결하기 위해 고객에게 연락합니다. 문제를 제대로 진단하기 위해 문제에 관한 추가 정보가 필요할 수 있습니다. 이 정보를 제공할 수 없는 경우 해결이 어려울 수 있습니다.
연결 실패
Google Cloud 와의 연결이 끊어지면 클러스터가 생존 가능성 모드로 전환되고 워크로드가 최대 7일 동안 계속 실행됩니다. 이 연결을 복원하기 전에는 Google에서 문제를 모니터링, 진단, 해결할 수 없습니다. Google에서는 연결 해제의 원인을 파악해 드릴 수 없습니다.
분산 클라우드에 연결된 전체 배포가 동시에 오프라인 상태가 되면 문제가 자동으로 해결될 수 있는지 확인할 때까지 알림이 전송되지 않을 수 있습니다. 예를 들어 배포 사이트의 ISP 중단은 합리적인 시간 내에 자동으로 해결될 수 있습니다.
배스천 호스트 및 경계 프록시 배포
Distributed Cloud 연결 배포에 배스천 호스트 인스턴스 또는 경계 프록시 인스턴스를 구성한 경우 Google에서 이러한 인스턴스의 연결을 모니터링합니다. Google에서 로컬 네트워크로 인해 발생할 수 있다고 판단되는 문제를 감지하면 적절한 작동을 복원하기 위해 문제를 해결하고 수정하도록 요청할 수 있습니다.
진단에 필요한 정보
Google에서 감지한 Distributed Cloud 연결 배포의 문제를 진단하기 위해 다음 정보를 요청할 수 있습니다.
- 스위치, 라우터, 방화벽 등 로컬 네트워크에 적용한 구성 변경사항(초 단위 타임스탬프 포함)
- 초 단위로 정확한 타임스탬프가 있는 방화벽 거부 로그
- 소프트웨어 또는 펌웨어 업그레이드, 비정상 종료, 기타 오류와 같은 기기 다시 시작 또는 전원 껐다 켜기의 이유와 정확한 시간
- 정전이 발생한 정확한 시간
- 라우터 또는 방화벽 로그의 초 단위 정확한 타임스탬프를 포함한 지역 네트워크 중단 시간
서드 파티 상호 운용성 문제
서드 파티 솔루션과의 상호 운용성 문제의 경우 진단을 위해 해당 공급업체를 참여시킬 수 있습니다. 여기에는 로그 파일 공유 및 진단 옵션 구성이 포함될 수 있습니다. 가능한 경우 Google에서는 실험실 환경에서 문제를 재현하려고 시도합니다.