Responsabilidad compartida de Google Distributed Cloud conectado

El monitoreo y el mantenimiento de Google Distributed Cloud conectado son una responsabilidad compartida entre Google y el cliente. Usa la información de este documento para determinar la mejor manera de implementar y administrar tus cargas de trabajo locales.

Las responsabilidades de Google

Como servicio administrado de hardware y software, Google es responsable de administrar y supervisar la infraestructura que usas para implementar tus aplicaciones empresariales.

Google es responsable de los siguientes aspectos del sistema de Distributed Cloud conectado:

  • El Google Cloud plano de control
  • El plano de control de Kubernetes, el nodo trabajador y los servicios integrados del sistema
  • Complementos y productos de software proporcionados por Google
  • Hardware suministrado, incluidos los servidores

Google supervisa la funcionalidad de la que somos responsables y alerta a los ingenieros de Google cuando se encuentran problemas para que puedan investigarlos.

Responsabilidades de los clientes

Eres responsable de los siguientes aspectos del sistema de Distributed Cloud conectado:

  • La red local, incluidos los conmutadores que proporciona el cliente
  • Conectividad a Internet
  • Potencia
  • El entorno, como el enfriamiento
  • Aplicación del cliente y cualquier complemento de Google Distributed Cloud o Kubernetes instalado por el cliente
  • Instancias de host de bastión propiedad del cliente y las implementaciones de proxy de límite, si se usan estas funciones

Google no supervisa directamente los problemas que son tu responsabilidad. Por ejemplo, Google no supervisa si una VM del cliente no se inicia correctamente o si la aplicación del cliente no se ejecuta. En caso de que creas que estos comportamientos se deben a un problema de la plataforma, debes abrir un ticket de asistencia de Google Cloud para que Google investigue.

Responsabilidad compartida

En algunos casos, Google detecta una falla del sitio, pero cree que la causa es un problema específico del sitio del que eres responsable. Por ejemplo, podríamos ver un aumento de la temperatura con el tiempo en todos los nodos de un sitio, seguido de una desconexión, lo que indicaría que el problema probable es una falla de enfriamiento local. En estos casos, Google inicia una solución de problemas colaborativa contigo para confirmar si el problema se debe a responsabilidades del cliente específicas del sitio y para verificar si hay fallas de hardware.

Para resolver problemas y determinar la causa raíz de forma satisfactoria, es posible que Google necesite solicitarte información y recibirla. Por ejemplo, es posible que Google necesite saber la hora en que se cortó la energía y cuándo se restableció la energía o la red. Si no puedes proporcionar esta información, es posible que Google no pueda realizar un análisis detallado de la causa raíz.

Fallas de conectividad

En el caso específico de una falla en la conectividad a Internet, el producto admite el modo de supervivencia por hasta siete días. Durante este período, se puede acceder al servicio de forma local. Sin embargo, Google no puede supervisar, mitigar ni diagnosticar los problemas del sistema en las instalaciones hasta que se restablezca la conectividad de la red.

Si bien Google supervisa las desconexiones del sitio de los sistemas de telemetría de Google, no podemos determinar de forma remota si la causa raíz es la energía, la conectividad del ISP o una falla catastrófica del sitio, como un incendio o una inundación.

Si todos los equipos de un sitio dejan de enviar datos de forma simultánea, es probable que se deba a un problema local de energía o de red. Para evitar falsas alarmas, es posible que Google no comunique el problema hasta que confirmemos que no se resolverá por sí solo, por ejemplo, debido al mantenimiento del ISP, y que no se puede resolver de forma virtual. En ese caso, se requiere una solución de problemas adicional.

Cuando se configura para el host de bastión y el proxy de límite (BH/BP), Google supervisa la conectividad con tu BH/BP y los dispositivos conectados de Distributed Cloud a través del BH/BP con solicitudes de prueba periódicas. Google espera que supervises el estado general de las instancias de BH/BP, por ejemplo, haciendo un seguimiento del uso de recursos. Si detectamos problemas de conectividad con BH/BP o con dispositivos conectados a Distributed Cloud, y sospechamos que el problema podría originarse en los componentes propiedad del cliente, es posible que te pidamos que diagnostiques y depures el problema.

Depuración

Para ayudar con la depuración, es posible que Google solicite los siguientes datos:

  • Cualquier cambio de configuración aplicado a equipos de redes no administrados por Google, como el conmutador, el router o el firewall, incluida la marca de tiempo al segundo más cercano
  • Registros de denegación del firewall, incluidos la marca de tiempo y los detalles
  • La hora y los motivos de los reinicios del dispositivo Los motivos pueden incluir una actualización de software, una falla de alimentación o un error de software.
  • La hora de cualquier corte de energía, que podría conocerse, por ejemplo, a partir de la administración del edificio o del centro de datos, o inferirse del último mensaje de registro de otros equipos
  • La hora de cualquier interrupción de la red, según el proveedor de red o los mensajes de registro del router o firewall

En el caso de problemas de interoperabilidad, es posible que Google también requiera una depuración conjunta con un proveedor, lo que incluye compartir archivos de registro del dispositivo y habilitar opciones de depuración. Cuando es posible, intentamos reproducir el problema en un entorno de laboratorio del cliente.

En algunos casos, Google puede obtener información de nuestros equipos administrados, pero es posible que esté incompleta. Por ejemplo, después de un corte de energía, la conexión del ISP puede tardar más en iniciarse que los servidores conectados de Distributed Cloud.

División de responsabilidad

Usa la siguiente tabla para determinar quién es responsable de las tareas comunes.

Tarea Cliente Google
Identificar problemas de desconexión de la implementación y proporcionar notificaciones a los clientes para su investigación X
Cómo resolver problemas de alimentación X
Resuelve problemas de red, incluidos los conmutadores proporcionados por el cliente. X X
Resolver problemas del entorno, como la refrigeración X
Resuelve las instancias de host de bastión propiedad del cliente y las implementaciones de proxy de límite, si se implementaron. X
Supervisa el plano de administración de la API X
Supervisar el plano de control de Kubernetes, el nodo trabajador y los servicios del sistema integrados X
Supervisar los complementos y productos de software proporcionados por Google, como Symcloud Storage X
Supervisar el hardware suministrado, como los servidores y, en algunas implementaciones, el equipo de red X
Supervisión del equipo de redes proporcionado por el cliente X
Supervisa la conectividad de red upstream X
Brindar asistencia conjunta para la depuración de problemas de red o ambientales X
Observabilidad de la plataforma, incluidas las métricas y los registros X
Observabilidad de la aplicación, incluidas las métricas y los registros X
Responder a las solicitudes para investigar problemas que se cree que son responsabilidad del cliente X