Resolva problemas de atrasos em trabalhos de streaming

Para pipelines de streaming, um elemento atrasado é definido como um item de trabalho com as seguintes características:

  • Impede que a marca de água avance durante um período significativo (da ordem dos minutos).
  • É processado durante muito tempo em relação a outros itens de trabalho na mesma fase.

Os valores atípicos atrasam a marca de água e adicionam latência à tarefa. Se o atraso for aceitável para o seu exemplo de utilização, não tem de fazer nada. Se quiser reduzir a latência de uma tarefa, comece por resolver os problemas de tarefas pendentes.

Veja os atrasos no streaming na Google Cloud consola

Depois de iniciar uma tarefa do Dataflow, pode usar a Google Cloud consola para ver os atrasos detetados.

Pode ver os atrasos no streaming na vista de progresso da fase ou na vista de fluxo de trabalho da fase.

Veja os atrasos por progresso da fase

Para ver os atrasos por progresso da fase:

  1. Na Google Cloud consola, aceda à página Tarefas do Dataflow.

    Aceda a Empregos

  2. Clique no nome da tarefa.

  3. Na página Detalhes da tarefa, clique no separador Detalhes da execução.

  4. Na lista Vista de gráfico, selecione Progresso da fase. O gráfico de progresso mostra as contagens agregadas de todos os atrasados detetados em cada fase.

    Uma captura de ecrã da vista de progresso da fase.

  5. Para ver os detalhes de uma fase, mantenha o ponteiro sobre a barra da fase. O painel de detalhes inclui um link para os registos do trabalhador. Clicar neste link abre o Cloud Logging com âmbito definido para o trabalhador e o intervalo de tempo em que o valor atípico foi detetado.

    Uma captura de ecrã do cartão de detalhes de valores atípicos.

Veja os atrasos por fluxo de trabalho de fase

Para ver os atrasos por fluxo de trabalho de fase:

  1. Na Google Cloud consola, aceda à página Tarefas do Dataflow.

    Aceda a Tarefas

  2. Clique no nome da tarefa.

  3. Na página de detalhes da tarefa, clique no separador Detalhes da execução.

  4. Na lista Vista de gráfico, selecione Fluxo de trabalho de preparação. O fluxo de trabalho de fases mostra as fases de execução da tarefa, representadas como um gráfico de fluxo de trabalho.

    Uma captura de ecrã da vista do fluxo de trabalho da fase.

Resolva problemas de streaming intermitente

Se for detetado um valor atípico, significa que uma operação no seu pipeline está a ser executada durante um período invulgarmente longo.

Para resolver o problema, verifique primeiro se a funcionalidade Estatísticas do fluxo de dados identifica problemas.

Se ainda não conseguir determinar a causa, verifique os registos do trabalhador para a fase que comunicou o atraso. Para ver os registos de trabalhadores relevantes, consulte os detalhes de atrasos no progresso da fase. Em seguida, clique no link do trabalhador. Este link abre o Cloud Logging, com âmbito para o trabalhador e o intervalo de tempo em que o valor atípico foi detetado. Procure problemas que possam estar a abrandar o palco, como:

Também pode usar o painel Informações laterais para encontrar os passos mais lentos na fase. Um destes passos pode estar a causar o atraso. Clique no nome do passo para ver os registos do trabalhador desse passo.

Depois de determinar a causa, atualize o pipeline com o novo código e monitorize o resultado.

O que se segue?