Conceitos do Personalized Service Health

Este documento descreve os principais conceitos e termos usados no PSH. Entender esses conceitos ajuda a interpretar eventos e configurar alertas com eficácia.

Evento do Service Health

Um evento de integridade do serviço (v1,v1beta) é qualquer evento disruptivo que afeta um produto do Google Cloud relevante para seus projetos ou recursos. Exemplos incluem interrupções de rede, erros de configuração e problemas de desempenho.

Cada evento contém detalhes sobre o impacto geral, atualizações do Google e informações específicas do seu projeto Google Cloud .

Incidente

Incidentes são interrupções ou degradações de serviço relevantes para seus projetos no Google Cloud . É uma categoria de um evento de integridade de serviço.

Um incidente inclui o seguinte:

  • Impacto do incidente: detalhes do escopo do evento, comoGoogle Cloud produtos e locais afetados.
  • Atualizações de Google Cloud: atualizações periódicas do suporte do Google Cloud .
  • Relevância personalizada: relevância do incidente para seu projeto Google Cloud.
  • Sintomas, soluções alternativas e ETAs: informações para ajudar a avaliar o impacto, aplicar uma solução alternativa ou saber mais sobre a causa raiz.

Um incidente pode ter um relatório de incidente, que inclui os fatores que contribuíram para o incidente e as etapas que o Google Cloud planeja tomar para evitar que incidentes semelhantes ocorram novamente. Os relatórios de incidentes estão disponíveis para incidentes que atendem às seguintes condições:

  • O incidente tem impacto global ou está afetando uma porcentagem significativa de projetos de clientes em uma ou mais regiões.
  • Um ou mais produtos estão indisponíveis ou muito degradados.

Estados de eventos e estados detalhados

Um evento tem dois campos que indicam o estado dele. Os valores desses campos mudam à medida que o evento evolui.

  • Estado do evento: indica o estado geral do evento. Pode ser um dos seguintes:

    • Ativo: o evento está afetando Google Cloud e vai continuar recebendo atualizações.
    • Fechado: o evento não afeta mais nenhum produto do Google Cloud ou foi mesclado com outro evento.
  • Estado detalhado: fornece mais informações sobre o estado do evento. Ele se aplica apenas a incidentes e pode ter um dos seguintes valores, dependendo do estado do evento:

    • Emergente: os engenheiros do Google estão investigando ativamente o incidente para determinar o impacto. Um incidente emergente se torna confirmado ou resolvido quando a avaliação de impacto é concluída. Um incidente ativo pode ser um incidente emergente.

      O suporte a incidentes emergentes está disponível apenas para produtos de rede Google Cloud.

    • Confirmado: o incidente foi confirmado por engenheiros do Google e está afetando pelo menos um produto Google Cloud . Vamos fornecer atualizações contínuas sobre o status até que o problema seja resolvido.

      Um incidente ativo pode ser um incidente confirmado.

    • Mesclado: o incidente foi mesclado em um incidente principal. Todas as atualizações futuras serão publicadas apenas para o pai.

    • Resolvido: o incidente não afeta mais nenhum produto Google Cloudapós a ação. Não haverá mais atualizações.

      Um incidente fechado geralmente é um incidente resolvido.

    • Falso positivo: após a investigação, os engenheiros do Google concluíram que o incidente não está afetando um produto do Google Cloud . Esse estado pode mudar se o incidente for revisado novamente.

    • Fechado automaticamente: o incidente foi fechado automaticamente pelos seguintes motivos:

      • Não foi possível confirmar o impacto do incidente.
      • O incidente foi intermitente ou resolvido por conta própria.

      O incidente não tem uma resolução porque nenhuma ação ou investigação foi realizada. Se for intermitente, o incidente poderá ser reaberto.

Relevância

O Personalized Service Health avalia o impacto de todos os incidentes no seu projeto. Se o impacto do incidente no seu projeto for possível ou confirmado, ele vai ficar disponível no painel e na API Service Health.

A relevância descreve como um incidente afeta seu projeto. A relevância pode mudar à medida que o incidente avança.

A relevância pode ter os seguintes valores:

  • Afetado: foi verificado que o incidente está afetando o projeto. Disponível apenas para alguns produtos Google Cloud .
  • Relacionado: o incidente tem uma conexão direta com o projeto e afeta um produto do Google Cloud em um local usado por ele.
  • Parcialmente relacionado: o incidente está associado a um produto do Google Cloud que seu projeto usa, mas talvez ele não esteja sendo afetado. Por exemplo, o incidente pode estar afetando um produto do Google Cloud Google Cloud que o projeto usa, mas em um local que não é usado por ele.
  • Não afetado: o incidente não está afetando seu projeto.
  • Desconhecido: o impacto no projeto não é conhecido neste momento.