Caso de uso: resolver problemas de conectividade do GKE

Neste caso de uso, você é responsável pela administração de uma rede que inclui vários namespaces do GKE. Você recebeu um alerta sobre um problema de latência, e a informação é que o aplicativo móvel da sua organização atinge o tempo limite e fica lento de forma intermitente. Você sabe que vários usuários são afetados e que não houve implantações recentes de aplicativos. O problema provavelmente está relacionado a um cluster específico do GKE.

O caso de uso a seguir demonstra como o recurso Topologia de Rede permite solucionar e investigar problemas rapidamente em sua implantação do GKE.

Detalhes da topologia

A implantação abrange três regiões do Google Cloud (us-central1, europe-west1 e asia-east1). Todas as solicitações de clientes externos são disponibilizadas pelos três clusters nas três regiões com vários namespaces. Solicitações de clientes provenientes de uma das três regiões de negócios (Américas, EMEA e APAC) são atendidas por instâncias de aplicativos na região mais próxima doGoogle Cloud .

A topologia a seguir mostra a hierarquia de nível superior para a implantação:

Latência de rede

Neste cenário, suponha que você tem um cluster do GKE chamado online-boutique. Você confere a latência entre clientes externos e o cluster do GKE para ver se a latência entre eles foi alterada. Ao descobrir que ela mudou, você decide investigar os nós do cluster mais a fundo.

  1. Você filtra a topologia para mostrar apenas o tráfego do cluster online-boutique.

    Na seção Filtro, é possível adicionar um filtro para selecionar nós e seus pares. Essa seção está disponível apenas para visualização de métricas, e não para visualizações de insights. Clique em Adicionar filtro e selecione o tipo de nó e o nó.

    Depois de aplicar o filtro, a Topologia de Rede exibe apenas as conexões relacionadas ao cluster, conforme mostrado no exemplo a seguir.

  2. Começando com os clientes externos nas Américas, você clica nas métricas de tráfego entre a região de negócios das Américas e o cluster do GKE. A Topologia de Rede mostra gráficos no painel de detalhes. As informações incluem tráfego de entrada e saída entre a entidade selecionada e a entidade conectada. Por exemplo, a topologia de rede fornece os valores mais recentes para consultas por segundo (QPS) e a latência da solicitação HTTP. No gráfico de latência da solicitação, você vê valores para os percentis 50, 95 e 99. Neste exemplo, imagine que todos os valores de latência são mais altos do que o esperado.

  3. Para expandir os gráficos de séries temporais para seis semanas, na parte superior do painel de detalhes, você seleciona 6 semanas.

    Você vê um salto significativo que ocorreu há duas horas, aproximadamente quando os primeiros problemas foram relatados. Você tem certeza de que o problema está relacionado ao aumento da latência com um pod do GKE.

  4. Com uma visão geral do problema, você investiga os nós do GKE mais a fundo. Para mais informações sobre como solucionar problemas de nós do GKE, consulte como solucionar problemas de conectividade do GKE.

A seguir