Conceitos do Personalized Service Health

Este documento descreve os principais conceitos e termos usados no Personalized Service Health (PSH). Compreender estes conceitos ajuda a interpretar eficazmente os eventos e a configurar alertas.

Evento de qualidade do serviço

Um evento de estado de funcionamento do serviço (v1,v1beta) é qualquer evento disruptivo que afete um Google Cloud produto que seja relevante para os seus projetos ou recursos. Alguns exemplos incluem falhas de rede, erros de configuração e problemas de desempenho.

Cada evento contém detalhes sobre o impacto geral do evento, atualizações da Google e informações específicas do seu Google Cloud projeto.

Incidente

Incidentes emergentes e ativos Google Cloud interrupções de serviço ou degradações relevantes para os seus projetos. É uma categoria de um evento de estado de funcionamento do serviço.

Um incidente inclui o seguinte:

  • Impacto do incidente: detalhes do âmbito do evento, como produtos e localizações afetados.Google Cloud
  • Atualizações de Google Cloud: atualizações periódicas do apoio técnico do Google Cloud .
  • Relevância personalizada: relevância do incidente para o seu Google Cloud projeto.
  • Sintomas, soluções alternativas e prazos de execução estimados: informações para ajudar a avaliar o impacto, aplicar uma solução alternativa ou saber mais sobre a causa principal.

Um incidente pode ter um relatório de incidente, que inclui os fatores que contribuíram para o incidente e os passos Google Cloud que planeia tomar para evitar a recorrência de incidentes semelhantes. Os relatórios de incidentes estão disponíveis para incidentes que cumprem as seguintes condições:

  • O incidente tem um impacto global ou está a afetar uma percentagem significativa de projetos de clientes numa ou mais regiões.
  • Um ou mais produtos estão indisponíveis ou com um desempenho muito degradado.

Estados dos eventos e estados detalhados

Um evento tem dois campos que indicam o respetivo estado. Os valores destes campos mudam à medida que o evento evolui.

  • Estado do evento: indica o estado geral do evento. Pode ser uma das seguintes opções:

    • Ativa: o evento está a afetar ativamente Google Cloud e vai continuar a receber atualizações.
    • Fechado: o evento já não afeta nenhum Google Cloud produto ou foi unido a outro evento.
  • Estado detalhado: fornece mais informações sobre o estado do evento. Aplica-se apenas a incidentes e pode ter um dos seguintes valores, consoante o estado do evento:

    • Emergente: os engenheiros da Google estão a investigar ativamente o incidente para determinar o impacto. Um incidente emergente torna-se um incidente confirmado ou resolvido assim que a avaliação do impacto estiver concluída. Um incidente ativo pode ser um incidente emergente.

      O apoio técnico para incidentes emergentes só está disponível para produtos de Google Cloud trabalhar em rede.

    • Confirmado: o incidente foi confirmado pelos engenheiros da Google e está a afetar, pelo menos, um Google Cloud produto. Vamos fornecer atualizações contínuas do estado até que o problema seja resolvido.

      Um incidente ativo pode ser um incidente confirmado.

    • Unido: o incidente foi unido a um incidente principal. Todas as atualizações adicionais são publicadas apenas no publicador principal.

    • Resolvido: o incidente já não afeta nenhum Google Cloud produto após a ação tomada. Não vão ser disponibilizadas mais atualizações.

      Normalmente, um incidente encerrado é um incidente resolvido.

    • Falso positivo: após investigação, os engenheiros da Google concluíram que o incidente não está a afetar um Google Cloud produto. Este estado pode mudar se o incidente for revisto novamente.

    • Encerrado automaticamente: o incidente foi encerrado automaticamente pelos seguintes motivos:

      • Não foi possível confirmar o impacto do incidente.
      • O incidente foi intermitente ou resolveu-se sozinho.

      O incidente não tem uma resolução porque não foi realizada nenhuma ação nem investigação. Se for intermitente, o incidente pode ser reaberto.

Relevância

O Personalized Service Health avalia o impacto de todos os incidentes no seu projeto. Se o impacto do incidente no seu projeto for possível ou confirmado, fica disponível no painel de controlo e na API Service Health.

A relevância descreve o impacto de um incidente no seu projeto. A relevância pode mudar à medida que o incidente progride.

A relevância pode ter os seguintes valores:

  • Afetado: o incidente foi validado como estando a afetar o seu projeto. Disponível apenas para alguns Google Cloud produtos.
  • Relacionado: o incidente tem uma ligação direta com o seu projeto e afeta um Google Cloud produto numa localização que o seu projeto usa.
  • Parcialmente relacionado: o incidente está associado a um Google Cloud produto que o seu projeto usa, mas o incidente pode não estar a afetar o seu projeto. Por exemplo, o incidente pode estar a afetar um Google Cloud produto que o seu projeto usa, mas numa localização que o seu projeto não usa.
  • Não afetado: o incidente não está a afetar o seu projeto.
  • Desconhecido: o impacto no seu projeto é desconhecido neste momento.