Diseña tu infraestructura de procesamiento con Gemini

En este documento, se explica cómo planificar y diseñar tu infraestructura de procesamiento con Gemini.

Puedes usar Gemini en la Google Cloud consola como una interfaz potenciada por IA para evaluar opciones de hardware, estimar costos de implementación y ver las configuraciones recomendadas para tus instancias de Compute Engine. Para personalizar sus recomendaciones, Gemini evalúa tu proyecto Google Cloudverificando los límites de cuota, las reservas existentes, los descuentos por compromiso de uso (CUD), la región y zona predeterminadas y cualquier restricción de ubicación de recursos. Si usas Gemini para ayudarte con la planificación, puedes alcanzar una configuración óptima para tu carga de trabajo antes de crear o modificar una instancia de procesamiento.

Para obtener más información sobre los componentes que debes configurar antes de crear una instancia de procesamiento o cuando la creas, consulta la Descripción general de la creación de instancias de Compute Engine.

Limitaciones

Cuando le das instrucciones a Gemini en la consola de Google Cloud , no puedes crear, modificar ni borrar recursos con Gemini.

Antes de comenzar

Cuando usas la consola de Google Cloud para acceder a los servicios Google Cloud y las APIs, no necesitas configurar la autenticación.

Roles obligatorios

Para obtener los permisos que necesitas para acceder a Gemini y darle instrucciones, pídele a tu administrador que te otorgue el rol de IAM de Visualizador de Compute (roles/compute.viewer) en el proyecto. Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

Este rol predefinido contiene los permisos necesarios para acceder a Gemini y darle instrucciones. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:

Permisos necesarios

Se requieren los siguientes permisos para acceder a Gemini y solicitarle información:

  • Para ver una lista de instancias, haz lo siguiente: compute.instances.list

También puedes obtener estos permisos con roles personalizados o con otros roles predefinidos.

Accede a Gemini en la consola de Google Cloud

Para acceder a Gemini en la consola de Google Cloud , completa los siguientes pasos:

  1. En la consola de Google Cloud , ve a la página Descripción general.

    Ir a Descripción general

  2. En la sección Diseña tu infraestructura con Compute Advisor, puedes ver lo siguiente:

    Captura de pantalla de la página de Compute Advisor y los elementos de la IU que la componen.

    Los elementos de la IU que se muestran en la captura de pantalla anterior son los siguientes:

    • Tarjetas de instrucciones de acción rápida: Un conjunto de tarjetas que contienen una instrucción de ejemplo. Si haces clic en una tarjeta, la consola de Google Cloud completará automáticamente el cuadro de instrucción con el mensaje de ejemplo.

    • Cuadro de instrucción: Este campo te permite ingresar y enviar instrucciones. Para enviar una instrucción, haz clic en Enviar instrucción.

    • Ver conversaciones anteriores: Esta función te permite ver los detalles de una conversación anterior y reanudarla, o bien borrar conversaciones si ya no las necesitas.

Envía instrucciones a Gemini

Después de que envías una instrucción, Gemini comienza a generar una respuesta. Aparecerá un panel y la consola de Google Cloud mostrará la respuesta a tu instrucción en el panel, como se muestra en la siguiente captura de pantalla:

Captura de pantalla de la página de Compute Advisor después de enviar una instrucción.

Según tu instrucción, el panel de respuesta incluye los siguientes elementos:

  • Fundamentación contextual: Gemini evalúa automáticamente el contexto de tu proyecto para ofrecer recomendaciones altamente personalizadas, incluidos los límites de cuota, las reservas existentes, los CUD, tu región y zona predeterminadas, y cualquier restricción de ubicación de recursos.

  • Fragmentos de código interactivos: Gemini genera comandos de gcloud, métodos de la API de REST o recursos de Terraform. Puedes copiar y pegar estos fragmentos de código o ejecutarlos en Cloud Shell.

  • Lienzo visual: Gemini organiza las recomendaciones en tablas estructuradas y comparaciones paralelas. Esta vista te ayuda a evaluar las funciones del producto y los enfoques arquitectónicos. También proporciona un plan de implementación para tu caso de uso.

En las siguientes secciones, se describen las prácticas recomendadas para escribir instrucciones y se incluyen ejemplos que puedes usar antes de crear o modificar una instancia de procesamiento.

Prácticas recomendadas para escribir instrucciones

Para obtener las recomendaciones más precisas y prácticas de Gemini, te recomendamos que estructures tus instrucciones de la misma manera en que lo harías con un bloque de código. Este enfoque guía la IA generativa con declaraciones de parámetros claras, definiciones de roles, instrucciones específicas y formatos de salida explícitos.

Cuando le des instrucciones a Gemini, ten en cuenta las siguientes prácticas recomendadas:

  • Enfócate en el diseño y la planificación: Te recomendamos que no le pidas a Gemini que solucione errores de instancias de procesamiento. Para resolver estos errores, consulta Soluciona problemas relacionados con la creación, actualización y eliminación de instancias de procesamiento.

  • Especifica un rol o arquetipo: Declara un rol o arquetipo objetivo, como un administrador de TI, un investigador de IA o un ingeniero de plataformas, para que Gemini lo adopte. Este enfoque guía el tono, la profundidad y el nivel de experiencia de las recomendaciones resultantes.

  • Proporciona instrucciones explícitas y numeradas: Desglosa tu objetivo en preguntas o tareas concretas paso a paso. Este enfoque estructura el proceso de razonamiento de Gemini y ayuda a garantizar que Gemini aborde todos tus requisitos.

  • Define un formato de salida específico: Indica explícitamente cómo deseas que se formatee la recomendación, por ejemplo, como una explicación paso a paso, una tabla de comparación en Markdown o un bloque de código de gcloud listo para usar.

  • Aprovecha la fundamentación automática del contexto: No es necesario que incluyas en tu instrucción tu región o zona predeterminada, las cuotas disponibles, los CUD ni las restricciones de ubicación de los recursos. Gemini puede acceder a esta información en tu proyecto de Google Cloud .

  • Mejora tus diseños de forma iterativa: Puedes modificar o expandir la respuesta que generó Gemini enviando nuevas instrucciones. Por ejemplo, puedes pedirle al asistente que agregue recomendaciones de redes a tu plan de implementación o que modifique los requisitos de almacenamiento sin iniciar una conversación nueva.

Ejemplos de instrucciones

A continuación, se incluyen ejemplos de instrucciones que puedes usar para diseñar y optimizar tu infraestructura de procesamiento:

  • Topología y estrategia de posición de la instancia de procesamiento: Para determinar el modelo de implementación y la política de posición óptimos para una carga de trabajo de alta disponibilidad, usa una instrucción como la siguiente:

    Act as a cloud architect. I need to design a compute instance topology for a
    distributed database that balances multi-zone resilience with
    sub-millisecond latency.
    
    Please provide the following:
    1. A side-by-side comparison of regional MIGs against zonal MIGs.
    2. An explanation of whether compact placement policies work regionally.
    3. The optimal autoscaling configuration for this workload.
    
    Format the comparison as a Markdown table, and provide the deployment steps
    as ready-to-use gcloud code blocks.
    
  • Optimización de costos y modelos de aprovisionamiento: Para evaluar los modelos de aprovisionamiento y reducir los costos de procesamiento por lotes, usa una instrucción como la siguiente:

    Act as a platform engineer. I need to find the cheapest way to run large,
    interruptible analytics jobs on our cloud servers without risking data loss.
    
    Please provide the following:
    1. A cost and reliability comparison of standard discounted servers against
       queue-based servers.
    2. An explanation of how to boot all our compute power at the exact same
       time.
    3. A deployment script that gives our jobs a two-minute warning before a
       server gets reclaimed.
    
    Format the comparison as a Markdown table, and provide the script as a
    ready-to-use code block.
    

¿Qué sigue?