Este documento explica como planejar e projetar sua infraestrutura de computação usando comandos do Gemini.
Use o Gemini no console Google Cloud como uma interface com tecnologia de IA para avaliar opções de hardware, estimar custos de implantação e conferir configurações recomendadas para suas instâncias do Compute Engine. Para personalizar as recomendações, o Gemini avalia seu projeto Google Cloudverificando os limites de cota, as reservas atuais, os descontos por uso contínuo (CUDs), a região e a zona padrão e as restrições de local do recurso. Ao usar o Gemini para ajudar no planejamento, você pode alcançar uma configuração ideal para sua carga de trabalho antes de criar ou modificar uma instância de computação.
Para saber mais sobre os componentes que você precisa configurar antes ou ao criar uma instância de computação, consulte Visão geral da criação de instâncias do Compute Engine.
Limitações
Ao usar o Gemini no console Google Cloud , não é possível criar, modificar ou excluir recursos.
Antes de começar
Quando você usa o console Google Cloud para acessar serviços Google Cloud e APIs, não é necessário configurar a autenticação.
Funções exigidas
Para receber as permissões necessárias para
acessar e usar o Gemini,
peça ao administrador para conceder a você o papel do IAM de
Leitor do Compute (roles/compute.viewer) no projeto.
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Esse papel predefinido contém as permissões necessárias para acessar e usar o Gemini. Para acessar as permissões exatas necessárias, expanda a seção Permissões necessárias:
Permissões necessárias
As seguintes permissões são necessárias para acessar e usar o Gemini:
-
Para conferir uma lista de instâncias:
compute.instances.list
Essas permissões também podem ser concedidas com funções personalizadas ou outros papéis predefinidos.
Acessar o Gemini no console do Google Cloud
Para acessar o Gemini no console do Google Cloud , siga estas etapas:
No console Google Cloud , acesse a página Visão geral.
Na seção Projete sua infraestrutura com o Compute Advisor, é possível conferir o seguinte:
Os elementos da interface mostrados na captura de tela anterior são os seguintes:
Cards de comandos de ação rápida: um conjunto de cards que contêm um exemplo de comando. Se você clicar em um card, o console Google Cloud vai preencher automaticamente a caixa de comando com o exemplo.
Caixa de comando: permite inserir e enviar comandos. Para enviar um comando, clique em Enviar comando.
Ver conversas anteriores: com esse recurso, você pode conferir os detalhes de uma conversa passada e retomar ou excluir conversas se não precisar mais delas.
Perguntar ao Gemini
Depois que você envia um comando, o Gemini começa a gerar uma resposta. Um painel aparece e o console Google Cloud mostra a resposta ao seu comando no painel, conforme mostrado na captura de tela a seguir:
Com base no seu comando, o painel de resposta inclui os seguintes elementos:
Fundamentação contextual: o Gemini avalia automaticamente o contexto do seu projeto para oferecer recomendações altamente personalizadas, incluindo limites de cota, reservas atuais, CUDs, sua região e zona padrão e restrições de local de recursos.
Snippets de código interativos: o Gemini gera comandos gcloud, métodos da API REST ou recursos do Terraform. É possível copiar e colar esses snippets de código ou executá-los no Cloud Shell.
Canvas visual: o Gemini organiza as recomendações em tabelas estruturadas e comparações lado a lado. Essa visualização ajuda você a avaliar recursos do produto e abordagens arquitetônicas. Ele também oferece um plano de implementação para seu caso de uso.
As seções a seguir descrevem as práticas recomendadas para escrever comandos e exemplos que podem ser usados antes de criar ou modificar uma instância de computação.
Práticas recomendadas para comandos
Para receber as recomendações mais precisas e práticas do Gemini, recomendamos que você estruture seus comandos da mesma forma que faria um bloco de código. Essa abordagem orienta a IA generativa usando declarações de parâmetros claras, definições de função, instruções específicas e formatos de saída explícitos.
Ao usar o Gemini, considere as seguintes práticas recomendadas:
Foco no design e no planejamento: recomendamos que você não peça ao Gemini para resolver problemas de erros de instância de computação. Para resolver esses erros, consulte Resolver problemas de criação, atualização e exclusão de instâncias de computação.
Especifique uma persona ou função: declare uma função ou persona de destino, como um administrador de TI, um pesquisador de IA ou um engenheiro de plataforma, para o Gemini adotar. Essa abordagem orienta o tom, a profundidade e o nível de especialização das recomendações resultantes.
Dê instruções explícitas e numeradas: divida seu objetivo em perguntas ou tarefas concretas e detalhadas. Essa abordagem estrutura o processo de raciocínio do Gemini e ajuda a garantir que ele atenda a todos os seus requisitos.
Defina um formato de saída específico: declare explicitamente como você quer que a recomendação seja formatada, como uma explicação detalhada, uma tabela de comparação em Markdown ou um bloco de código gcloud pronto para uso.
Aproveite a fundamentação automática de contexto: não é necessário incluir na solicitação sua região ou zona padrão, cotas disponíveis, CUDs ou restrições de local do recurso. O Gemini pode acessar essas informações no seu projeto do Google Cloud .
Refine seus designs de forma iterativa: você pode modificar ou expandir a resposta gerada pelo Gemini enviando novos comandos. Por exemplo, você pode pedir ao assistente para adicionar recomendações de rede ao seu plano de implantação ou modificar os requisitos de armazenamento sem iniciar uma nova conversa.
Exemplos de comandos
Confira alguns exemplos de comandos que podem ajudar você a projetar e otimizar sua infraestrutura de computação:
Topologia e estratégia de posicionamento da instância de computação: para determinar o modelo de implantação e a política de posicionamento ideais para uma carga de trabalho de alta disponibilidade, use um comando como este:
Act as a cloud architect. I need to design a compute instance topology for a distributed database that balances multi-zone resilience with sub-millisecond latency. Please provide the following: 1. A side-by-side comparison of regional MIGs against zonal MIGs. 2. An explanation of whether compact placement policies work regionally. 3. The optimal autoscaling configuration for this workload. Format the comparison as a Markdown table, and provide the deployment steps as ready-to-use gcloud code blocks.Modelo de provisionamento e otimização de custos: para avaliar modelos de provisionamento e reduzir os custos de processamento em lote, use um comando como este:
Act as a platform engineer. I need to find the cheapest way to run large, interruptible analytics jobs on our cloud servers without risking data loss. Please provide the following: 1. A cost and reliability comparison of standard discounted servers against queue-based servers. 2. An explanation of how to boot all our compute power at the exact same time. 3. A deployment script that gives our jobs a two-minute warning before a server gets reclaimed. Format the comparison as a Markdown table, and provide the script as a ready-to-use code block.