Este documento descreve os principais conceitos e termos usados no Personalized Service Health (PSH). Compreender estes conceitos ajuda a interpretar eficazmente os eventos e a configurar alertas.
Evento de qualidade do serviço
Um evento de estado de funcionamento do serviço (v1,v1beta) é qualquer evento disruptivo que afete um Google Cloud produto que seja relevante para os seus projetos ou recursos. Alguns exemplos incluem falhas de rede, erros de configuração e problemas de desempenho.
Cada evento contém detalhes sobre o impacto geral do evento, atualizações da Google e informações específicas do seu Google Cloud projeto.
Incidente
Incidentes emergentes e ativos Google Cloud interrupções de serviço ou degradações relevantes para os seus projetos. É uma categoria de um evento de estado de funcionamento do serviço.
Um incidente inclui o seguinte:
- Impacto do incidente: detalhes do âmbito do evento, como produtos e localizações afetados.Google Cloud
- Atualizações de Google Cloud: atualizações periódicas do apoio técnico do Google Cloud .
- Relevância personalizada: relevância do incidente para o seu Google Cloud projeto.
- Sintomas, soluções alternativas e prazos de execução estimados: informações para ajudar a avaliar o impacto, aplicar uma solução alternativa ou saber mais sobre a causa principal.
Um incidente pode ter um relatório de incidente, que inclui os fatores que contribuíram para o incidente e os passos Google Cloud que planeia tomar para evitar a recorrência de incidentes semelhantes. Os relatórios de incidentes estão disponíveis para incidentes que cumprem as seguintes condições:
- O incidente tem um impacto global ou está a afetar uma percentagem significativa de projetos de clientes numa ou mais regiões.
- Um ou mais produtos estão indisponíveis ou com um desempenho muito degradado.
Estados dos eventos e estados detalhados
Um evento tem dois campos que indicam o respetivo estado. Os valores destes campos mudam à medida que o evento evolui.
Estado do evento: indica o estado geral do evento. Pode ser uma das seguintes opções:
- Ativa: o evento está a afetar ativamente Google Cloud e vai continuar a receber atualizações.
- Fechado: o evento já não afeta nenhum Google Cloud produto ou foi unido a outro evento.
Estado detalhado: fornece mais informações sobre o estado do evento. Aplica-se apenas a incidentes e pode ter um dos seguintes valores, consoante o estado do evento:
Emergente: os engenheiros da Google estão a investigar ativamente o incidente para determinar o impacto. Um incidente emergente torna-se um incidente confirmado ou resolvido assim que a avaliação do impacto estiver concluída. Um incidente ativo pode ser um incidente emergente.
O apoio técnico para incidentes emergentes só está disponível para produtos de Google Cloud trabalhar em rede.
Confirmado: o incidente foi confirmado pelos engenheiros da Google e está a afetar, pelo menos, um Google Cloud produto. Vamos fornecer atualizações contínuas do estado até que o problema seja resolvido.
Um incidente ativo pode ser um incidente confirmado.
Unido: o incidente foi unido a um incidente principal. Todas as atualizações adicionais são publicadas apenas no publicador principal.
Resolvido: o incidente já não afeta nenhum Google Cloud produto após a ação tomada. Não vão ser disponibilizadas mais atualizações.
Normalmente, um incidente encerrado é um incidente resolvido.
Falso positivo: após investigação, os engenheiros da Google concluíram que o incidente não está a afetar um Google Cloud produto. Este estado pode mudar se o incidente for revisto novamente.
Encerrado automaticamente: o incidente foi encerrado automaticamente pelos seguintes motivos:
- Não foi possível confirmar o impacto do incidente.
- O incidente foi intermitente ou resolveu-se sozinho.
O incidente não tem uma resolução porque não foi realizada nenhuma ação nem investigação. Se for intermitente, o incidente pode ser reaberto.
Relevância
O Personalized Service Health avalia o impacto de todos os incidentes no seu projeto. Se o impacto do incidente no seu projeto for possível ou confirmado, fica disponível no painel de controlo e na API Service Health.
A relevância descreve o impacto de um incidente no seu projeto. A relevância pode mudar à medida que o incidente progride.
A relevância pode ter os seguintes valores:
- Afetado: o incidente foi validado como estando a afetar o seu projeto. Disponível apenas para alguns Google Cloud produtos.
- Relacionado: o incidente tem uma ligação direta com o seu projeto e afeta um Google Cloud produto numa localização que o seu projeto usa.
- Parcialmente relacionado: o incidente está associado a um Google Cloud produto que o seu projeto usa, mas o incidente pode não estar a afetar o seu projeto. Por exemplo, o incidente pode estar a afetar um Google Cloud produto que o seu projeto usa, mas numa localização que o seu projeto não usa.
- Não afetado: o incidente não está a afetar o seu projeto.
- Desconhecido: o impacto no seu projeto é desconhecido neste momento.