Diseña y optimiza tu clúster con Gemini

En este documento, se explica cómo planificar y diseñar tu clúster con Gemini.

Puedes usar Gemini en la consola de Google Cloud como una interfaz potenciada por IA para evaluar opciones de hardware, estimar costos de implementación y ver las configuraciones recomendadas para tus clústeres. Para personalizar sus recomendaciones, Gemini evalúa tu proyecto Google Cloudverificando los límites de cuota, las reservas existentes, los descuentos por compromiso de uso (CUD), la región y zona predeterminadas y cualquier restricción de ubicación de recursos. Si usas Gemini para ayudarte con la planificación, puedes alcanzar una configuración óptima para tu carga de trabajo antes de crear o modificar un clúster.

Para obtener más información sobre los componentes que debes configurar antes de crear un clúster o durante el proceso, consulta Descripción general de las opciones de implementación.

Limitaciones

Cuando le das instrucciones a Gemini en la consola de Google Cloud , no puedes crear, modificar ni borrar recursos con Gemini.

Antes de comenzar

Cuando usas la consola de Google Cloud para acceder a los servicios Google Cloud y las APIs, no necesitas configurar la autenticación.

Roles obligatorios

Para obtener los permisos que necesitas para acceder a Gemini y darle instrucciones, pídele a tu administrador que te otorgue el rol de IAM de visualizador de Cluster Director (roles/hypercomputecluster.viewer) en el proyecto. Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

Este rol predefinido contiene los permisos necesarios para acceder a Gemini y darle instrucciones. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:

Permisos necesarios

Se requieren los siguientes permisos para acceder a Gemini y solicitarle información:

  • Para ver una lista de clústeres, haz lo siguiente: hypercomputecluster.clusters.list

También puedes obtener estos permisos con roles personalizados o con otros roles predefinidos.

Accede a Gemini en la consola de Google Cloud

Para acceder a Gemini en la consola de Google Cloud , completa los siguientes pasos:

  1. En la consola de Google Cloud , ve a la página Descripción general.

    Ir a Descripción general

  2. En la sección Diseña tu infraestructura con Compute Advisor, haz clic en Iniciar un nuevo chat.

  3. En la página Compute Advisor, puedes ver lo siguiente:

    Captura de pantalla de la página de Compute Advisor y los elementos de la IU que la componen.

    Los elementos de la IU que se muestran en la captura de pantalla anterior son los siguientes:

    • Panel lateral del historial de conversaciones: Muestra tus chats recientes. Puedes interactuar con este panel de la siguiente manera:

      • Para iniciar una conversación nueva, haz clic en Nuevo chat.

      • Para reanudar una conversación reciente, en la sección Chats recientes, haz clic en la conversación.

      • Para ver una lista de todas tus conversaciones, haz clic en Ver todo. En la página Mi historial, puedes ver los detalles de una conversación anterior y reanudarla, o bien borrar conversaciones si ya no las necesitas.

    • Tarjetas de instrucciones de acción rápida: Un conjunto de tarjetas que contienen una instrucción de ejemplo. Si haces clic en una tarjeta, la consola Google Cloud completa automáticamente el cuadro de instrucción con el mensaje de muestra.

    • Cuadro de instrucción: Este campo te permite ingresar y enviar instrucciones. Para enviar una instrucción, haz clic en Enviar instrucción.

Envía instrucciones a Gemini

Después de que envías una instrucción, Gemini comienza a generar una respuesta. Aparecerá un panel y la consola de Google Cloud mostrará la respuesta a tu instrucción en el panel, como se muestra en la siguiente captura de pantalla:

Captura de pantalla de la página de Compute Advisor después de enviar una instrucción.

Según tu instrucción, el panel de respuesta incluye los siguientes elementos:

  • Fundamentación contextual: Gemini evalúa automáticamente el contexto de tu proyecto para ofrecer recomendaciones altamente personalizadas, incluidos los límites de cuota, las reservas existentes, los CUD, tu región y zona predeterminadas, y cualquier restricción de ubicación de recursos.

  • Fragmentos de código interactivos: Gemini genera comandos de gcloud, métodos de la API de REST o recursos de Terraform. Puedes copiar y pegar estos fragmentos de código o ejecutarlos en Cloud Shell.

  • Lienzo visual: Gemini organiza las recomendaciones en tablas estructuradas y comparaciones paralelas. Esta vista te ayuda a evaluar las funciones del producto y los enfoques arquitectónicos. También proporciona un plan de implementación para tu caso de uso.

En las siguientes secciones, se describen las prácticas recomendadas para escribir instrucciones y se incluyen ejemplos que puedes usar antes de crear o modificar un clúster.

Prácticas recomendadas para escribir instrucciones

Para obtener las recomendaciones más precisas y prácticas de Gemini, te recomendamos que estructures tus instrucciones de la misma manera en que lo harías con un bloque de código. Este enfoque guía la IA generativa con declaraciones de parámetros claras, definiciones de roles, instrucciones específicas y formatos de salida explícitos.

Cuando le des instrucciones a Gemini, ten en cuenta las siguientes prácticas recomendadas:

  • Enfócate en el diseño y la planificación: Te recomendamos que no le pidas a Gemini que solucione problemas de errores de clúster. Para resolver estos errores, consulta Soluciona problemas relacionados con la creación, actualización y eliminación de instancias de procesamiento.

  • Especifica un rol o arquetipo: Declara un rol o arquetipo objetivo, como un administrador de TI, un investigador de IA o un ingeniero de plataformas, para que Gemini lo adopte. Este enfoque guía el tono, la profundidad y el nivel de experiencia de las recomendaciones resultantes.

  • Proporciona instrucciones explícitas y numeradas: Desglosa tu objetivo en preguntas o tareas concretas paso a paso. Este enfoque estructura el proceso de razonamiento de Gemini y ayuda a garantizar que Gemini aborde todos tus requisitos.

  • Define un formato de salida específico: Indica explícitamente cómo deseas que se formatee la recomendación, por ejemplo, como una explicación paso a paso, una tabla de comparación en Markdown o un bloque de código de gcloud listo para usar.

  • Aprovecha la fundamentación automática del contexto: No es necesario que incluyas en tu instrucción tu región o zona predeterminada, las cuotas disponibles, los CUD ni las restricciones de ubicación de los recursos. Gemini puede acceder a esta información en tu proyecto de Google Cloud .

  • Mejora tus diseños de forma iterativa: Puedes modificar o expandir la respuesta que generó Gemini enviando nuevas instrucciones. Por ejemplo, puedes pedirle al asistente que agregue recomendaciones de redes a tu plan de implementación o que modifique los requisitos de almacenamiento sin iniciar una conversación nueva.

Ejemplos de instrucciones

A continuación, se muestran ejemplos de instrucciones que puedes usar para diseñar y optimizar tu clúster:

  • Topología del clúster y estrategia de ubicación: Para determinar el modelo de implementación y la política de ubicación óptimos para una carga de trabajo de IA de alto rendimiento, usa una instrucción como la siguiente:

    Act as an AI researcher. I need to design a cluster topology in
    Cluster Director for training a large language model that balances high
    accelerator performance with guaranteed capacity.
    
    Please provide the following:
    1. A side-by-side comparison of deploying A3 Mega VMs across different
       regions.
    2. An explanation of how topology-aware scheduling minimizes network
       latency.
    3. The optimal reservation configuration for this training workload.
    
    Format the comparison as a Markdown table, and provide the deployment steps
    as a ready-to-use gcloud code block.
    
  • Optimización de costos y modelos de aprovisionamiento: Para evaluar los modelos de aprovisionamiento y reducir los costos de procesamiento por lotes, usa una instrucción como la siguiente:

    Act as an IT administrator. I need to find the cheapest way to run large,
    interruptible batch jobs on our clusters in Cluster Director
    without risking data loss.
    
    Please provide the following:
    1. A cost and reliability comparison of standard discounted VMs against
       Spot VMs.
    2. An explanation of how to provision all our compute power at the exact
       same time.
    3. A deployment script that gives our jobs a two-minute warning before a
       Spot VM gets reclaimed.
    
    Format the comparison as a Markdown table, and provide the steps to take in
    the Google Cloud console.
    

¿Qué sigue?