Este documento descreve os principais conceitos e termos usados no PSH. Entender esses conceitos ajuda a interpretar eventos e configurar alertas com eficácia.
Evento do Service Health
Um evento de integridade do serviço (v1,v1beta) é qualquer evento disruptivo que afeta um produto do Google Cloud relevante para seus projetos ou recursos. Exemplos incluem interrupções de rede, erros de configuração e problemas de desempenho.
Cada evento contém detalhes sobre o impacto geral, atualizações do Google e informações específicas do seu projeto Google Cloud .
Incidente
Incidentes são interrupções ou degradações de serviço relevantes para seus projetos no Google Cloud . É uma categoria de um evento de integridade de serviço.
Um incidente inclui o seguinte:
- Impacto do incidente: detalhes do escopo do evento, comoGoogle Cloud produtos e locais afetados.
- Atualizações de Google Cloud: atualizações periódicas do suporte do Google Cloud .
- Relevância personalizada: relevância do incidente para seu projeto Google Cloud.
- Sintomas, soluções alternativas e ETAs: informações para ajudar a avaliar o impacto, aplicar uma solução alternativa ou saber mais sobre a causa raiz.
Um incidente pode ter um relatório de incidente, que inclui os fatores que contribuíram para o incidente e as etapas que o Google Cloud planeja tomar para evitar que incidentes semelhantes ocorram novamente. Os relatórios de incidentes estão disponíveis para incidentes que atendem às seguintes condições:
- O incidente tem impacto global ou está afetando uma porcentagem significativa de projetos de clientes em uma ou mais regiões.
- Um ou mais produtos estão indisponíveis ou muito degradados.
Estados de eventos e estados detalhados
Um evento tem dois campos que indicam o estado dele. Os valores desses campos mudam à medida que o evento evolui.
Estado do evento: indica o estado geral do evento. Pode ser um dos seguintes:
- Ativo: o evento está afetando Google Cloud e vai continuar recebendo atualizações.
- Fechado: o evento não afeta mais nenhum produto do Google Cloud ou foi mesclado com outro evento.
Estado detalhado: fornece mais informações sobre o estado do evento. Ele se aplica apenas a incidentes e pode ter um dos seguintes valores, dependendo do estado do evento:
Emergente: os engenheiros do Google estão investigando ativamente o incidente para determinar o impacto. Um incidente emergente se torna confirmado ou resolvido quando a avaliação de impacto é concluída. Um incidente ativo pode ser um incidente emergente.
O suporte a incidentes emergentes está disponível apenas para produtos de rede Google Cloud.
Confirmado: o incidente foi confirmado por engenheiros do Google e está afetando pelo menos um produto Google Cloud . Vamos fornecer atualizações contínuas sobre o status até que o problema seja resolvido.
Um incidente ativo pode ser um incidente confirmado.
Mesclado: o incidente foi mesclado em um incidente principal. Todas as atualizações futuras serão publicadas apenas para o pai.
Resolvido: o incidente não afeta mais nenhum produto Google Cloudapós a ação. Não haverá mais atualizações.
Um incidente fechado geralmente é um incidente resolvido.
Falso positivo: após a investigação, os engenheiros do Google concluíram que o incidente não está afetando um produto do Google Cloud . Esse estado pode mudar se o incidente for revisado novamente.
Fechado automaticamente: o incidente foi fechado automaticamente pelos seguintes motivos:
- Não foi possível confirmar o impacto do incidente.
- O incidente foi intermitente ou resolvido por conta própria.
O incidente não tem uma resolução porque nenhuma ação ou investigação foi realizada. Se for intermitente, o incidente poderá ser reaberto.
Relevância
O Personalized Service Health avalia o impacto de todos os incidentes no seu projeto. Se o impacto do incidente no seu projeto for possível ou confirmado, ele vai ficar disponível no painel e na API Service Health.
A relevância descreve como um incidente afeta seu projeto. A relevância pode mudar à medida que o incidente avança.
A relevância pode ter os seguintes valores:
- Afetado: foi verificado que o incidente está afetando o projeto. Disponível apenas para alguns produtos Google Cloud .
- Relacionado: o incidente tem uma conexão direta com o projeto e afeta um produto do Google Cloud em um local usado por ele.
- Parcialmente relacionado: o incidente está associado a um produto do Google Cloud que seu projeto usa, mas talvez ele não esteja sendo afetado. Por exemplo, o incidente pode estar afetando um produto do Google Cloud Google Cloud que o projeto usa, mas em um local que não é usado por ele.
- Não afetado: o incidente não está afetando seu projeto.
- Desconhecido: o impacto no projeto não é conhecido neste momento.