Neste documento, explicamos como planejar e projetar seu cluster usando comandos do Gemini.
Use o Gemini no console Google Cloud como uma interface com tecnologia de IA para avaliar opções de hardware, estimar custos de implantação e conferir configurações recomendadas para seus clusters. Para personalizar as recomendações, o Gemini avalia seu projeto Google Cloudverificando os limites de cota, as reservas atuais, os descontos por uso contínuo (CUDs), a região e a zona padrão e as restrições de local do recurso. Ao usar o Gemini para ajudar no planejamento, você pode alcançar uma configuração ideal para sua carga de trabalho antes de criar ou modificar um cluster.
Para saber mais sobre os componentes que você precisa configurar antes ou ao criar um cluster, consulte Visão geral das opções de implantação.
Limitações
Ao usar o Gemini no console Google Cloud , não é possível criar, modificar ou excluir recursos.
Antes de começar
Quando você usa o console Google Cloud para acessar serviços Google Cloud e APIs, não é necessário configurar a autenticação.
Funções exigidas
Para receber as permissões necessárias para
acessar e usar o Gemini,
peça ao administrador para conceder a você o papel
Leitor do Cluster Director (roles/hypercomputecluster.viewer) do IAM no projeto.
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Esse papel predefinido contém as permissões necessárias para acessar e usar o Gemini. Para acessar as permissões exatas necessárias, expanda a seção Permissões necessárias:
Permissões necessárias
As seguintes permissões são necessárias para acessar e usar o Gemini:
-
Para conferir uma lista de clusters:
hypercomputecluster.clusters.list
Essas permissões também podem ser concedidas com funções personalizadas ou outros papéis predefinidos.
Acessar o Gemini no console do Google Cloud
Para acessar o Gemini no console do Google Cloud , siga estas etapas:
No console Google Cloud , acesse a página Visão geral.
Na seção Projete sua infraestrutura com o Compute Advisor, clique em Iniciar um novo chat.
Na página Compute Advisor, você pode conferir o seguinte:
Os elementos da interface mostrados na captura de tela anterior são os seguintes:
Painel lateral do histórico de conversas: mostra seus chats recentes. Você pode interagir com esse painel da seguinte forma:
Para iniciar uma conversa, clique em Nova conversa.
Para retomar uma conversa recente, na seção Conversas recentes, clique na conversa.
Para ver uma lista de todas as suas conversas, clique em Ver tudo. Na página Meu histórico, você pode conferir os detalhes de uma conversa anterior e retomar ou excluir conversas que não precisa mais.
Cards de comandos de ação rápida: um conjunto de cards que contêm um exemplo de comando. Se você clicar em um cartão, o console Google Cloud vai preencher automaticamente a caixa de comando com o exemplo.
Caixa de comando: permite inserir e enviar comandos. Para enviar um comando, clique em Enviar comando.
Perguntar ao Gemini
Depois que você envia um comando, o Gemini começa a gerar uma resposta. Um painel aparece e o console Google Cloud mostra a resposta ao seu comando no painel, conforme mostrado na captura de tela a seguir:
Com base no seu comando, o painel de resposta inclui os seguintes elementos:
Fundamentação contextual: o Gemini avalia automaticamente o contexto do seu projeto para oferecer recomendações altamente personalizadas, incluindo limites de cota, reservas atuais, CUDs, região e zona padrão e restrições de local de recursos.
Snippets de código interativos: o Gemini gera comandos gcloud, métodos da API REST ou recursos do Terraform. É possível copiar e colar esses snippets de código ou executá-los no Cloud Shell.
Canvas visual: o Gemini organiza as recomendações em tabelas estruturadas e comparações lado a lado. Essa visualização ajuda você a avaliar recursos do produto e abordagens arquitetônicas. Ele também oferece um plano de implementação para seu caso de uso.
As seções a seguir descrevem as práticas recomendadas para escrever comandos e exemplos que podem ser usados antes de criar ou modificar um cluster.
Práticas recomendadas para comandos
Para receber as recomendações mais precisas e práticas do Gemini, recomendamos que você estruture seus comandos da mesma forma que faria um bloco de código. Essa abordagem orienta a IA generativa usando declarações de parâmetros claras, definições de função, instruções específicas e formatos de saída explícitos.
Ao usar o Gemini, considere as seguintes práticas recomendadas:
Foco no design e no planejamento: recomendamos que você não peça ao Gemini para resolver problemas de erros de cluster. Para resolver esses erros, consulte Resolver problemas de criação, atualização e exclusão de instâncias de computação.
Especifique uma persona ou função: declare uma função ou persona de destino, como um administrador de TI, um pesquisador de IA ou um engenheiro de plataforma, para o Gemini adotar. Essa abordagem orienta o tom, a profundidade e o nível de especialização das recomendações resultantes.
Dê instruções explícitas e numeradas: divida seu objetivo em perguntas ou tarefas concretas e detalhadas. Essa abordagem estrutura o processo de raciocínio do Gemini e ajuda a garantir que ele atenda a todos os seus requisitos.
Defina um formato de saída específico: declare explicitamente como você quer que a recomendação seja formatada, como uma explicação detalhada, uma tabela de comparação em Markdown ou um bloco de código gcloud pronto para uso.
Aproveite a fundamentação automática de contexto: não é necessário incluir na solicitação sua região ou zona padrão, cotas disponíveis, CUDs ou restrições de local do recurso. O Gemini pode acessar essas informações no seu projeto do Google Cloud .
Refine seus designs de forma iterativa: você pode modificar ou expandir a resposta gerada pelo Gemini enviando novos comandos. Por exemplo, você pode pedir ao assistente para adicionar recomendações de rede ao seu plano de implantação ou modificar os requisitos de armazenamento sem iniciar uma nova conversa.
Exemplos de comandos
Confira abaixo exemplos de comandos que podem ajudar você a projetar e otimizar seu cluster:
Topologia e estratégia de posicionamento do cluster: para determinar o modelo de implantação e a política de posicionamento ideais para uma carga de trabalho de IA de alta performance, use um comando como este:
Act as an AI researcher. I need to design a cluster topology in Cluster Director for training a large language model that balances high accelerator performance with guaranteed capacity. Please provide the following: 1. A side-by-side comparison of deploying A3 Mega VMs across different regions. 2. An explanation of how topology-aware scheduling minimizes network latency. 3. The optimal reservation configuration for this training workload. Format the comparison as a Markdown table, and provide the deployment steps as a ready-to-use gcloud code block.Modelo de provisionamento e otimização de custos: para avaliar modelos de provisionamento e reduzir os custos de processamento em lote, use um comando como este:
Act as an IT administrator. I need to find the cheapest way to run large, interruptible batch jobs on our clusters in Cluster Director without risking data loss. Please provide the following: 1. A cost and reliability comparison of standard discounted VMs against Spot VMs. 2. An explanation of how to provision all our compute power at the exact same time. 3. A deployment script that gives our jobs a two-minute warning before a Spot VM gets reclaimed. Format the comparison as a Markdown table, and provide the steps to take in the Google Cloud console.