Aumente a resiliência do Playbook com novas tentativas automáticas
Este documento explica como as ações automatizadas nos guias de soluções podem, por vezes, falhar devido a problemas temporários, como interrupções de rede ou limites de taxa da API. Para garantir que os manuais de procedimentos são mais resilientes, pode configurar ações individuais para repetir automaticamente se encontrarem essas falhas.
As novas tentativas de ações ajudam os manuais de procedimentos a recuperar de falhas temporárias, como problemas de rede, limites de taxa da API ou indisponibilidade do serviço. Estas novas tentativas aplicam-se a ações de manuais de procedimentos padrão, como o enriquecimento, a contenção ou as notificações.
O mecanismo de repetição é acionado pelo estado de execução interno da ação, e não por códigos de erro HTTP padrão. Não são feitas novas tentativas para ações que encontrem limites de tempo ou ações usadas para o controlo de fluxo (como condições ou blocos de manuais), uma vez que não foram concebidas para falhar da mesma forma.
Condições do mecanismo de repetição de ações
O mecanismo de repetição é acionado apenas quando uma ação falha em condições específicas que normalmente indicam uma falha transitória, de infraestrutura ou não processada. Não está ativado para falhas relacionadas com ações de limite de tempo ou controlo de fluxo.
Condições que ativam uma nova tentativa
O mecanismo de nova tentativa só é ativado quando a ação falha nas seguintes circunstâncias:
- Erros de script não processados: qualquer erro ou exceção que ocorra no script Python da ação que não processa explicitamente no script.
- Estado de falha explícito: o script de ação devolve explicitamente o estado de execução
EXECUTION_STATE_FAILEDao servidor. - Falhas de infraestrutura: falhas que resultam da infraestrutura subjacente, como problemas de ligação (por exemplo, erros de ligação Python) que impedem um resultado bem-sucedido.
Condições que ignoram uma nova tentativa (não é feita nenhuma nova tentativa)
As novas tentativas são ignoradas em cenários de falha relacionados com ações de limite de tempo ou controlo de fluxo:
- Tempo limite de execução do guia: a ação não é concluída e não devolve um resultado dentro do limite de tempo limite geral configurado para o passo específico do guia.
- Estado de limite de tempo processado: o script de ação comunica explicitamente um limite de tempo de ação interno devolvendo o estado
EXECUTION_STATE_TIMEOUT. O servidor trata isto como um "Limite de tempo processado", o que permite que a execução do manual continue sem uma nova tentativa.
Configure novas tentativas de ações
Para configurar novas tentativas para uma ação, siga estes passos:
- Clique duas vezes na ação relevante no criador de manuais de procedimentos.
- Na barra lateral, clique no separador Definições e, de seguida, clique no botão Voltar a tentar em caso de falha para o ativar.
- Especifique os seguintes parâmetros:
- Número de novas tentativas: introduza quantas vezes a ação deve tentar ser executada novamente se falhar.
- Atraso entre novas tentativas: defina o atraso em segundos, minutos ou horas entre cada tentativa.
- Na secção Se o passo falhar, selecione uma das seguintes opções
se a ação falhar definitivamente após todas as tentativas:
- Parar playbook: a execução do playbook é interrompida.
- Ignorar passo: o manual continua para o passo seguinte.
- Clique em Guardar.
Como as novas tentativas aparecem durante a execução do manual de vendas
Quando é executado um passo do manual de soluções com novas tentativas, são apresentados estados e mensagens específicos que indicam o progresso das tentativas:
- Se uma ação falhar com repetições configuradas, o respetivo estado no separador Playbooks muda temporariamente para A aguardar a próxima repetição antes da próxima tentativa.
- Se a ação for bem-sucedida após uma ou mais novas tentativas, o respetivo estado final no separador Playbooks indica êxito, juntamente com o número de novas tentativas (por exemplo, Concluído após duas novas tentativas).
- Se a ação falhar após todas as tentativas de repetição, o respetivo estado final indica falha, juntamente com o número de repetições (por exemplo, Falhou após 3 repetições).
- As informações relevantes sobre as tentativas de repetição também são apresentadas no Case Wall.
Precisa de mais ajuda? Receba respostas de membros da comunidade e profissionais da Google SecOps.