Esta página descreve como ajustar as implantações do Google Kubernetes Engine (GKE) para otimizar a performance e a confiabilidade usando o Gemini Cloud Assist, um colaborador com tecnologia de IA para Google Cloud. A assistência do Gemini pode incluir recomendações, geração de código e solução de problemas.
Entre muitos outros benefícios, o Gemini Cloud Assist pode ajudar você a:
- Reduzir custos: identifique recursos inativos, ajuste o tamanho das implantações e otimize as configurações de escalonamento automático para minimizar gastos desnecessários.
- Melhorar a confiabilidade e a estabilidade: identifique proativamente possíveis problemas, como incompatibilidade de versões ou orçamentos de interrupção de pods ausentes, para evitar inatividade e garantir a resiliência do aplicativo.
- Otimizar cargas de trabalho de IA/ML: receba ajuda para implantar, gerenciar e otimizar cargas de trabalho de IA/ML no GKE.
- Simplificar a solução de problemas: analise rapidamente os registros e identifique a causa raiz dos erros, economizando tempo e esforço.
Esta página é para usuários atuais do GKE, operadores e desenvolvedores que provisionam e configuram recursos de nuvem e implantam apps e serviços. Para saber mais sobre as funções comuns e os exemplos de tarefas mencionados no Google Cloud conteúdo, consulte Funções e tarefas comuns do usuário do GKE.
Saiba como e quando o Gemini para Google Cloud usa seus dados.
Custos
Gemini: durante o pré-lançamento, não há custo financeiro para usar o Gemini Cloud Assist.
GKE: não há custos adicionais para usar o Gemini Cloud Assist no GKE.
Antes de começar
Para começar a usar o Gemini com o GKE, conclua os pré-requisitos a seguir.
-
Verifique se o faturamento está ativado para o Google Cloud projeto.
- Peça aos administradores de identidade e de contas para conceder as permissões necessárias para acessar e modificar os recursos do GKE.
- Siga as instruções fornecidas no guia Configurar o Gemini Cloud Assist para ativar o Gemini Cloud Assist no projeto ou na pasta, com papéis específicos do Identity and Access Management (IAM) concedidos ao principal.
Este guia pressupõe que você tenha um cluster do GKE e, de preferência, algumas implantações em execução.
Faça uma pergunta ao Gemini Cloud Assist
É possível invocar o Gemini Cloud Assist no Google Cloud console. O Gemini Cloud Assist permite usar comandos em linguagem natural para receber ajuda com tarefas de maneira rápida e eficiente.
Para abrir o Cloud Assist em uma página do GKE, siga estas etapas:
No Google Cloud console, na página do seletor de projetos, selecione um Google Cloud projeto em que você ativou o Gemini Cloud Assist.
No Google Cloud console, acesse uma página específica no console do Kubernetes Engine.
Por exemplo, acesse a página Visão geral do Kubernetes Engine.
Acessar a visão geral do Kubernetes Engine
Se você tiver uma dúvida sobre um recurso específico, navegue primeiro até a página relevante. Por exemplo, na página Clusters , o Gemini Cloud Assist pode aconselhar você sobre como gerenciar clusters, monitorar a integridade do cluster e solucionar problemas. Usar o Gemini em uma página específica do Google Cloud console ajuda a fornecer contexto para suas perguntas. O Gemini pode usar esse contexto, juntamente com o projeto geral em que você está, para gerar uma assistência mais personalizada e precisa.
Para abrir o painel do Gemini Cloud Assist, clique no brilho Abrir ou fechar o chat com IA do Gemini na barra de ferramentas.
Se solicitado e você concordar com os termos, clique em Aceitar.
Insira um comando no painel do Gemini. Consulte um exemplo de fluxo de trabalho de uso do Gemini para solucionar problemas na seção a seguir.
Para mais informações sobre como usar o Gemini no Google Cloud console, consulte Usar o Gemini Cloud Assist.
Exemplo de uso do Gemini para solucionar problemas
O Gemini pode ajudar você a solucionar problemas nos serviços do GKE.
Acesse a página Cargas de trabalho no Google Cloud console.
Selecione a carga de trabalho que você quer solucionar.
Clique na guia Registros.
Clique no brilho Abrir ou fechar o chat com IA do Gemini na barra de ferramentas.
Insira um comando para descrever o problema que você está tendo. Por exemplo, "Meu aplicativo de banco de dados
accounts-dbestá com alta latência". O Gemini pode pedir mais contexto, como o tipo de banco de dados, o escopo do impacto, como as operações e os usuários afetados pela latência.O Gemini pode fornecer orientações para analisar os registros e oferecer sugestões de solução de problemas.
Analise e siga as sugestões para resolver o problema.
Exemplos de comandos do Gemini Cloud Assist
Esta seção mostra alguns casos de uso reais e sugere os comandos que você pode tentar perguntar ao Gemini. As respostas reais que você recebe podem ser genéricas, ou podem ser personalizadas e acionáveis com base no estado exclusivo do seu Google Cloud ambiente. As respostas podem incluir Google Cloud links do console para revisar e gerenciar seus recursos do Cloud e links para a documentação relevante para mais informações.
Reduza os custos
A tabela a seguir descreve os comandos que você pode usar para ajudar a reduzir custos.
| Comando | Tipo de resposta |
|---|---|
| "Como posso economizar nos meus clusters do GKE sem sacrificar a performance?" |
|
"Quero fazer upgrade do meu cluster do GKE my-docker-cluster. Alguma recomendação?" |
Sugestões para implementar configurações e práticas recomendadas específicas do Kubernetes, por exemplo:
|
"Tenho um grande pico de tráfego chegando em algumas semanas no cluster my-docker-cluster. Alguma recomendação?" |
|
| "Quais das minhas cargas de trabalho do GKE não têm o HPA ativado?" | A lista de cargas de trabalho que não têm o escalonador automático horizontal de pods ativado. |
Melhorar a confiabilidade e a estabilidade
A tabela a seguir descreve os comandos que você pode usar para ajudar a melhorar a confiabilidade e a estabilidade das cargas de trabalho do GKE.
| Comando | Tipo de resposta |
|---|---|
| "Como posso tornar meus clusters do GKE mais confiáveis e evitar inatividade?" |
|
"Mostre como posso mover minhas cargas de trabalho do namespace Default em my-cluster." |
Etapas para fazer o seguinte:
|
| "Como posso garantir a alta disponibilidade dos meus pods em execução?" |
|
Otimizar o GKE para cargas de trabalho de IA/ML
A tabela a seguir descreve os comandos que você pode usar para receber ajuda com a implantação, o gerenciamento e a otimização de cargas de trabalho de IA/ML no GKE.
| Comando | Tipo de resposta |
|---|---|
| "Quais são as configurações recomendadas do pool de nós para executar o treinamento distribuído do TensorFlow em grande escala no GKE com GPUs?" | As recomendações para otimizar o treinamento de ML distribuído do TensorFlow no GKE podem incluir o seguinte:
|
| "Como uso GPUs no GKE para treinamento?" | Visão geral das etapas e considerações para configurar um cluster e cargas de trabalho para usar GPUs. |
| Dê um exemplo de como implantar um contêiner de disponibilização de modelo no GKE. | Um exemplo com exemplo de código para implantar um contêiner de disponibilização do modelo no GKE. O exemplo pode incorporar práticas recomendadas e ajuda a garantir a escalonabilidade. |
| "Quais métricas devo acompanhar para avaliar a eficácia da minha configuração de balanceamento de carga para inferência?" | A lista de métricas, como distribuição de tráfego, latência, taxas de erro, CPU e uso de memória, para ter insights sobre a performance e a integridade da configuração de balanceamento de carga. |
Simplifique a solução de problemas
A tabela a seguir descreve os comandos que você pode usar para ajudar a analisar rapidamente os registros e identificar a causa raiz dos erros, economizando tempo e esforço.
| Comando | Tipo de resposta |
|---|---|
"Sobre o que é esse erro?Readiness probe failed: Get "https://10…./abcd": context deadline exceeded (Client.Timeout exceeded while awaiting headers)"
|
Explica que o kubelet não conseguiu executar o probe de prontidão para o contêiner dentro do período de tempo limite definido e sugere possíveis causas e ações de solução de problemas. |
"Por que minha implantação nettools está falhando com o erro ping: socket: Operation not permitted?"
|
Explica que o comando ping exige a capacidade de contexto de segurança CAP_NET_RAW e que, por padrão, os contêineres no Kubernetes são executados com um conjunto restrito de recursos por motivos de segurança.
|
"O que significa quando meu pod não pode ser programado devido ao erro Cannot schedule pods: No preemption victims found for incoming pod."
|
Explica como a programação e a preempção de pods funcionam no Kubernetes. Lista as etapas para solucionar o problema de por que nenhuma vítima de preempção foi encontrada. |
A seguir
- Aprenda a escrever comandos melhores.
- Saiba como usar o painel do Gemini Cloud Assist.
- Leia Usar o Gemini para assistência e desenvolvimento de IA.
- Saiba como o Gemini para Google Cloud usa seus dados.