Acerca da deteção de anomalias

Esta página aplica-se ao Apigee e ao Apigee Hybrid.

Veja a documentação do Apigee Edge.

O que é uma anomalia?

Uma anomalia é um padrão de dados da API invulgar ou inesperado. Por exemplo, consulte o gráfico da taxa de erros da API abaixo:

Gráfico de uma anomalia da taxa de erros.

Como pode ver, a taxa de erros aumenta subitamente por volta das 07:00. Em comparação com os dados anteriores a essa hora, este aumento é suficientemente invulgar para ser classificado como uma anomalia.

No entanto, nem todas as variações nos dados da API representam anomalias: a maioria são simplesmente flutuações aleatórias. Por exemplo, pode ver algumas variações relativamente pequenas na taxa de erro que antecedem a anomalia, mas estas não são suficientemente significativas para serem consideradas uma verdadeira anomalia.

Anomalia vs. variação aleatória dos dados.

A API AAPI Ops monitoriza continuamente os dados da API e realiza análises estatísticas para distinguir as verdadeiras anomalias das flutuações aleatórias nos dados.

Sem a deteção de anomalias, tem de escolher um limiar para detetar cada anomalia. (Um limite é um valor que uma quantidade, como a taxa de erros, tem de atingir para acionar uma anomalia.) Também tem de manter os valores de limite atualizados com base nos dados mais recentes. Por outro lado, a AAPI-Ops escolhe os melhores limites de anomalias para si com base em padrões de dados recentes.

Quando a AAPI deteta uma anomalia como a apresentada acima, apresenta os detalhes da anomalia no painel de controlo Eventos de anomalia. Neste ponto, pode investigar a anomalia nos painéis de controlo da API Monitoring e tomar as medidas adequadas, se necessário. Também pode criar um alerta para receber uma notificação se ocorrerem eventos semelhantes no futuro.

Uma anomalia detetada inclui as seguintes informações:

  • A métrica que causou a anomalia, como a latência do proxy ou um código de erro HTTP.
  • A gravidade da anomalia. A gravidade pode ser ligeira, moderada ou grave, com base no respetivo nível de confiança no modelo. Um nível de confiança baixo indica que a gravidade é ligeira, enquanto um nível de confiança elevado indica que é grave.

Tipos de anomalias

O Apigee deteta automaticamente os seguintes tipos de anomalias:

  • Aumento dos erros HTTP 503 ao nível da organização, do ambiente e da região
  • Aumento dos erros HTTP 504 ao nível da organização, do ambiente e da região
  • Aumento de todos os erros HTTP 4xx ou 5xx ao nível da organização, do ambiente e da região
  • Aumento na latência de resposta total para o percentil 90 (p90) ao nível da organização, do ambiente e da região

Como funciona a deteção de anomalias

A deteção de anomalias envolve as seguintes fases:

Prepare modelos

A deteção de anomalias funciona através da preparação de um modelo do comportamento dos seus proxies de API a partir de dados do histórico de séries cronológicas. Não tem de fazer nada para formar o modelo. O Apigee cria e prepara automaticamente modelos para si a partir das seis horas anteriores de dados da API. Por conseguinte, o Apigee requer um mínimo de seis horas de dados num proxy de API para preparar o modelo antes de poder registar uma anomalia.

O objetivo da preparação é melhorar a precisão do modelo, que pode ser testado em dados do histórico. A forma mais simples de testar a precisão de um modelo é calcular a respetiva taxa de erro, ou seja, a soma dos falsos positivos e falsos negativos, dividida pelo número total de eventos previstos.

Eventos de anomalias de registo

Em tempo de execução, a deteção de anomalias do Apigee compara o comportamento atual dos seus proxies de API com o comportamento previsto pelo modelo. Em seguida, a deteção de anomalias pode determinar, com um nível de confiança específico, quando uma métrica operacional está a exceder o valor previsto. Por exemplo, quando a taxa de erros 5xx excede a taxa prevista pelo modelo.

Quando o Apigee deteta uma anomalia, regista automaticamente o evento no painel de controlo Eventos de anomalia. A lista de eventos apresentada no painel de controlo inclui todas as anomalias detetadas, bem como os alertas acionados.