Visão geral da administração do cluster

Esta página oferece uma visão geral rápida do gerenciamento de clusters do GKE para administradores.

Se você for um desenvolvedor que executa cargas de trabalho no GKE, talvez não precise realizar a maioria dessas tarefas. Para uma introdução à implantação de cargas de trabalho no GKE, consulte Implantação de cargas de trabalho.

Antes de ler esta página, você precisa conhecer os seguintes conceitos básicos do Kubernetes: conceitos básicos do Kubernetes:

Quais ferramentas eu uso?

Como administrador, você usa várias ferramentas para trabalhar com clusters do GKE.

  • Para controlar a configuração e as características gerais de um cluster, use Google Cloud ferramentas e APIs, incluindo a Google Cloud CLI e o Google Cloud console. Essas tarefas incluem criar, atualizar, visualizar e excluir clusters, além de controlar quem pode acessar o cluster usando o Identity and Access Management (IAM). Você também pode usar outras Google Cloud ferramentas e serviços, como serviços de observabilidade para monitoramento, registro e alertas.

  • Para controlar o comportamento interno de um cluster, use a API Kubernetes e a kubectl interface de linha de comando. As tarefas em que você pode precisar usar kubectl incluem a implantação de cargas de trabalho, a aplicação de políticas de controle de acesso baseado em papéis (RBAC, na sigla em inglês) do Kubernetes e a especificação de regras de política de rede do Kubernetes. Para saber mais sobre como configurar kubectl para uso com clusters do GKE, consulte Instalar kubectl e configurar o acesso ao cluster.

  • Para provisionar clusters e cargas de trabalho de maneira declarativa, use o Terraform. Para saber mais sobre como usar o Terraform com GKE, consulte Provisionar recursos do GKE com Terraform.

Administração básica do cluster

As tarefas básicas de administração de cluster incluem configuração, upgrades e configuração de nós. Se você usar o modo Autopilot padrão para seus clusters (recomendado), o GKE vai processar a maior parte disso para você: upgrades de cluster e configuração de nós são gerenciados pelo GKE. Se você usar o modo Standard, apenas os upgrades serão gerenciados pelo GKE, e você precisará configurar os nós. Para saber mais sobre quando você pode precisar escolher o modo Standard para clusters, consulte Modos de operação do GKE.

As tarefas básicas de administração de cluster são específicas dos clusters do GKE no Google Cloud Platform e normalmente não envolvem o próprio sistema do Kubernetes. Execute essas tarefas inteiramente usando o Google Cloud console, a Google Cloud CLI, a API do GKE ou o provedor do Terraform. Google Cloud Google Cloud

Como visualizar clusters

É possível conferir informações básicas sobre seus clusters no Google Cloud console e usando a Google Cloud CLI ou a API do GKE. Isso inclui se um cluster está em execução e a configuração atual dele, além de listar todos os clusters. Para mais detalhes, consulte Gerenciar clusters.

Para informações mais detalhadas sobre o estado e a integridade do cluster, use ferramentas e recursos de observabilidade.

Upgrades de nós e clusters

Por padrão, os clusters e nós são atualizados automaticamente. Saiba mais sobre como configurar o funcionamento dos upgrades em cada cluster, incluindo quando eles podem e não podem ocorrer.

Configuração no nível do cluster

As tarefas de configuração no nível de cluster incluem a criação e a exclusão de clusters e nós do GKE. Também é possível atualizar algumas configurações de cluster como quando as tarefas de manutenção do cluster podem ocorrer.

Para saber mais sobre a configuração do cluster, consulte a Visão geral da configuração do cluster.

Configuração de nós

Se você usa o Autopilot para seus clusters, não precisa se preocupar com a configuração de nós, porque o GKE configura os nós para você. Os nós de cluster do Autopilot são totalmente gerenciados pelo GKE e usam o mesmo sistema operacional de nós (SO), cos_containerd.

No entanto, se você precisar usar o modo Standard para clusters, o GKE oferece diversas opções para seus nós do cluster. Por exemplo, você pode criar um ou mais pools de nós, que são grupos de nós dentro do cluster que compartilham uma configuração em comum. O cluster precisa ter pelo menos um pool de nós, e um pool de nós chamado default é criado por padrão quando você cria o cluster. Para saber mais sobre o gerenciamento pool de nós no GKE, consulte Adicionar e gerenciar pools de nós.

Outras opções de configuração de nós para clusters Standard incluem escolher um SO não padrão, usar VMs spot efêmeras e escolher uma plataforma de CPU mínima para novos nós ( os usuários do Autopilot também podem especificar uma plataforma de CPU mínima para cargas de trabalho com uso intenso de computação, mas apenas com base no escopo da carga de trabalho).

Mesmo com clusters Standard, não é possível alterar as regras iptables ou outras configurações no nível do nó gerenciadas pelo GKE. O nó poderá ficar inacessível ou ser acidentalmente exposto quando as alterações manuais reverterem para a configuração declarativa do cluster.

Como configurar redes de cluster

Um aspecto importante da administração de clusters é ativar e controlar vários recursos de rede para o cluster, como opções de endereço IP para clusters Standard, se os nós do cluster podem ser acessados de redes públicas (nós que não podem ser acessados de redes públicas são conhecidos como nós particulares) e políticas de acesso à rede.

Muitos recursos de rede são definidos na criação do cluster, e muitos deles não podem ser alterados sem recriar o cluster: quando você cria um cluster usando uma Google Cloud interface, é necessário ativar os recursos de rede que você quer usar. Devido a esse comportamento, se você não for um administrador de rede, talvez seja necessário trabalhar em conjunto com os administradores de rede ao configurar clusters prontos para produção.

Alguns recursos de rede que podem ser ativados com Google Cloud ferramentas, como a aplicação de políticas de rede, também exigem mais configurações usando as APIs do Kubernetes.

Saiba muito mais sobre a rede do GKE em Visão geral da rede.

Observabilidade do cluster

Outra parte importante da administração de clusters é configurar e usar ferramentas de observabilidade para entender a integridade da infraestrutura e dos aplicativos, além de manter a disponibilidade e a confiabilidade dos aplicativos. Por padrão, os clusters do GKE são configurados para fazer o seguinte:

O GKE também oferece recursos de observabilidade que ajudam a usar os dados coletados, incluindo painéis padrão e personalizados, alertas, monitoramento de objetivo de nível de serviço (SLO) e análise de registros.

Para saber mais sobre como configurar e usar a observabilidade do GKE , consulte Observabilidade do GKE.

Como configurar a segurança do cluster

O GKE inclui recursos de segurança específicos do Google Cloud e do Kubernetes que podem ser usados com o cluster. Google CloudÉ possível gerenciar a segurança no nível do Google Cloud, como o IAM, usando o Google Cloud console.Google CloudGerencie os recursos de segurança dentro do cluster, como o controle de acesso baseado em papéis (RBAC, na sigla em inglês) do Kubernetes, usando as APIs do Kubernetes e outras interfaces.

Para saber mais sobre os recursos de segurança disponíveis no GKE, consulte a Visão geral de segurança e Aumentar a segurança do cluster. Os clusters do GKE Autopilot implementam muitos desses recursos de segurança e práticas recomendadas de reforço da proteção automaticamente. Para mais informações, consulte Recursos de segurança no GKE Autopilot.

Otimizar os custos

As ferramentas do GKE permitem visualizar os custos do cluster e ajudam a garantir que você esteja usando os recursos Google Cloud pelos quais está pagando da maneira mais eficiente. É possível visualizar as métricas de utilização da CPU, da memória e do uso do disco em diferentes períodos e usar essas métricas para otimizar o uso de recursos. Por exemplo, se você tiver clusters potencialmente subutilizados ou superutilizados que talvez queira redimensionar. Também é possível usar o escalonamento automático para reduzir o tamanho do cluster durante os horários de pico horas, e usar insights e recomendações para identificar clusters inativos, além de outras práticas recomendadas.

Também é possível visualizar métricas para otimizar os custos em toda a frota e para equipes individuais teams.

Como configurar a recuperação de desastres

Para garantir que suas cargas de trabalho de produção permaneçam disponíveis no caso de um evento de interrupção de serviço, prepare um plano de recuperação de desastres (DR). Para saber mais sobre o planejamento de DR, consulte o guia de planejamento de recuperação de desastres.

A configuração do Kubernetes e os volumes permanentes não serão armazenados em backup, a menos que você execute uma ação explícita. Para fazer backup e restaurar a configuração do Kubernetes e os volumes permanentes nos clusters do GKE, use o Backup para GKE.

A seguir