Práticas recomendadas para o GKE

Este documento oferece uma visão geral consolidada das práticas recomendadas para projetar, criar e operar aplicativos no Google Kubernetes Engine (GKE). Seguir essas recomendações ajuda a otimizar o custo, o desempenho, a segurança e a confiabilidade. Cada entrada tem um link para documentação mais detalhada sobre tópicos específicos.

Selecione sua categoria do GKE:

Ou pesquise uma prática recomendada:

Categoria Práticas recomendadas Resumo
Cargas de trabalho de IA e ML Otimizar a eficiência da carga de trabalho de IA/ML Maximize a eficiência de recursos para tarefas de IA/ML no GKE.
Cargas de trabalho de IA e ML Cargas de trabalho de inferência Executar cargas de trabalho de inferência de machine learning no GKE.
Cargas de trabalho de IA e ML Escalonamento automático da inferência de LLM com GPUs Escalonar automaticamente a inferência de modelos de linguagem grandes (LLM) usando GPUs no GKE.
Cargas de trabalho de IA e ML Escalonamento automático da inferência de LLM com TPUs Escalone automaticamente a inferência de modelos de linguagem grandes (LLMs) usando TPUs no GKE.
Cargas de trabalho de IA e ML Otimizar a inferência de LLM com GPUs Otimize a inferência de LLM com GPUs no GKE.
Cargas de trabalho de IA e ML Plataforma de processamento em lote Crie e opere uma plataforma de processamento em lote no GKE.
Otimização de custos Execute aplicativos do Kubernetes econômicos Reduza os custos operacionais dos aplicativos do Kubernetes no GKE.
Bancos de dados Opções de banco de dados Escolha e gerencie soluções de banco de dados para aplicativos do GKE.
Rede Rede Configurar e gerenciar a conectividade de rede para o GKE.
Operações Como fazer upgrade de clusters Saiba como realizar upgrades de cluster do GKE sem problemas e de maneira confiável.
Operações CI/CD para GKE Implemente pipelines de integração e entrega contínuas para aplicativos do GKE.
Confiabilidade e escalonabilidade Escalonabilidade Aprenda princípios e técnicas para escalonar aplicativos no GKE.
Confiabilidade e escalonabilidade Planejar a escalonabilidade Aprenda estratégias para projetar ambientes escalonáveis do GKE.
Confiabilidade e escalonabilidade Planejar grandes clusters do GKE Saiba como arquitetar e gerenciar clusters do GKE em grande escala.
Confiabilidade e escalonabilidade Planejar cargas de trabalho grandes Implante e gerencie aplicativos que consomem muitos recursos.
Segurança Aumente a proteção do seu cluster do GKE Aprimore a postura de segurança do GKE dos seus clusters do GKE.
Segurança Planejar políticas de RBAC Definir o controle de acesso baseado em papéis para gerenciar permissões.
Segurança Multilocação empresarial Execute vários locatários com segurança em um único cluster do GKE.