Concevez votre infrastructure de calcul avec Gemini

Ce document explique comment planifier et concevoir votre infrastructure de calcul en demandant à Gemini.

Vous pouvez utiliser Gemini dans la console Google Cloud comme interface basée sur l'IA pour évaluer les options matérielles, estimer les coûts de déploiement et afficher les configurations recommandées pour vos instances Compute Engine. Pour personnaliser ses recommandations, Gemini évalue votre projet Google Clouden vérifiant vos limites de quota, vos réservations existantes, vos remises sur engagement d'utilisation, votre région et zone par défaut, ainsi que toutes les contraintes liées à l'emplacement des ressources. En utilisant Gemini pour vous aider à planifier, vous pouvez atteindre une configuration optimale pour votre charge de travail avant de créer ou de modifier une instance de calcul.

Pour en savoir plus sur les composants que vous devez configurer avant ou lorsque vous créez une instance de calcul, consultez Présentation de la création d'instances Compute Engine.

Limites

Lorsque vous envoyez des requêtes à Gemini dans la console Google Cloud , vous ne pouvez pas créer, modifier ni supprimer de ressources à l'aide de Gemini.

Avant de commencer

Lorsque vous utilisez la console Google Cloud pour accéder aux services Google Cloud et aux API, vous n'avez pas besoin de configurer l'authentification.

Rôles requis

Pour obtenir les autorisations nécessaires pour accéder à Gemini et lui envoyer des requêtes, demandez à votre administrateur de vous accorder le rôle IAM Lecteur de Compute (roles/compute.viewer) sur le projet. Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.

Ce rôle prédéfini contient les autorisations requises pour accéder à Gemini et lui envoyer des requêtes. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :

Autorisations requises

Vous devez disposer des autorisations suivantes pour accéder à Gemini et lui envoyer des requêtes :

  • Pour afficher la liste des instances : compute.instances.list

Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.

Accéder à Gemini dans la console Google Cloud

Pour accéder à Gemini dans la console Google Cloud , procédez comme suit :

  1. Dans la console Google Cloud , accédez à la page Présentation.

    Accéder à la page "Vue d'ensemble"

  2. Dans la section Concevez votre infrastructure avec Compute Advisor, vous pouvez afficher les éléments suivants :

    Capture d'écran de la page Compute Advisor et des éléments d'interface utilisateur qui la composent.

    Les éléments d'UI affichés dans la capture d'écran précédente sont les suivants :

    • Fiches d'invite à action rapide : ensemble de fiches contenant chacune un exemple d'invite. Si vous cliquez sur une fiche, la console Google Cloud remplit automatiquement le champ du prompt avec l'exemple de prompt.

    • Zone de saisie des requêtes : ce champ vous permet de saisir et d'envoyer des requêtes. Pour envoyer une requête, cliquez sur Envoyer une requête.

    • Afficher les conversations précédentes : cette fonctionnalité vous permet d'afficher les détails d'une conversation passée et de la reprendre, ou de supprimer les conversations dont vous n'avez plus besoin.

Envoyer des prompts à Gemini

Une fois que vous avez envoyé une requête, Gemini commence à générer une réponse. Un volet s'affiche et la console Google Cloud affiche la réponse à votre requête dans le volet, comme illustré dans la capture d'écran suivante :

Capture d'écran de la page Compute Advisor après l'envoi d'une requête.

En fonction de votre requête, le volet de réponse inclut les éléments suivants :

  • Ancrage contextuel : Gemini évalue automatiquement le contexte de votre projet pour fournir des recommandations très personnalisées, y compris les limites de quota, les réservations existantes, les remises pour utilisation soutenue, votre région et zone par défaut, ainsi que toutes les contraintes d'emplacement des ressources.

  • Extraits de code interactifs : Gemini génère des commandes gcloud, des méthodes d'API REST ou des ressources Terraform. Vous pouvez copier et coller ces extraits de code ou les exécuter dans Cloud Shell.

  • Canevas visuel : Gemini organise les recommandations dans des tableaux structurés et des comparaisons côte à côte. Cette vue vous aide à évaluer les fonctionnalités du produit et les approches architecturales. Il fournit également un plan d'implémentation pour votre cas d'utilisation.

Les sections suivantes décrivent les bonnes pratiques pour rédiger des requêtes et fournissent des exemples de requêtes que vous pouvez utiliser avant de créer ou de modifier une instance de calcul.

Bonnes pratiques concernant les requêtes

Pour obtenir les recommandations les plus précises et les plus utiles de Gemini, nous vous conseillons de structurer vos requêtes de la même manière que vous le feriez pour un bloc de code. Cette approche guide l'IA générative en utilisant des déclarations de paramètres claires, des définitions de rôle, des instructions spécifiques et des formats de sortie explicites.

Lorsque vous envoyez une requête à Gemini, tenez compte des bonnes pratiques suivantes :

  • Concentrez-vous sur la conception et la planification : nous vous recommandons de ne pas demander à Gemini de résoudre les erreurs liées aux instances de calcul. Pour résoudre ces erreurs, consultez plutôt Résoudre les problèmes de création, de mise à jour et de suppression d'instances de calcul.

  • Spécifiez un persona ou un rôle : indiquez un rôle ou un persona cible que Gemini doit adopter, comme un administrateur informatique, un chercheur en IA ou un ingénieur de plate-forme. Cette approche guide le ton, la profondeur et le niveau d'expertise des recommandations obtenues.

  • Fournissez des instructions explicites et numérotées : décomposez votre objectif en questions ou tâches concrètes, étape par étape. Cette approche structure le processus de raisonnement de Gemini et permet de s'assurer que Gemini répond à toutes vos exigences.

  • Définissez un format de sortie spécifique : indiquez explicitement le format souhaité pour la recommandation, par exemple une explication détaillée, un tableau comparatif Markdown ou un bloc de code gcloud prêt à l'emploi.

  • Exploitez l'ancrage contextuel automatique : vous n'avez pas besoin d'inclure votre région ou zone par défaut, les quotas disponibles, les remises sur engagement d'utilisation ni les contraintes d'emplacement des ressources dans votre requête. Gemini peut accéder à ces informations dans votre projet Google Cloud .

  • Affinez vos conceptions de manière itérative : vous pouvez modifier ou développer la réponse générée par Gemini en envoyant de nouveaux prompts. Par exemple, vous pouvez demander à l'assistant d'ajouter des recommandations de mise en réseau à votre plan de déploiement ou de modifier les exigences de stockage sans démarrer une nouvelle conversation.

Exemples de prompts

Voici des exemples de requêtes que vous pouvez utiliser pour concevoir et optimiser votre infrastructure de calcul :

  • Topologie et stratégie d'emplacement des instances de calcul : pour déterminer le modèle de déploiement et la stratégie d'emplacement optimaux pour une charge de travail à haute disponibilité, utilisez une requête comme celle-ci :

    Act as a cloud architect. I need to design a compute instance topology for a
    distributed database that balances multi-zone resilience with
    sub-millisecond latency.
    
    Please provide the following:
    1. A side-by-side comparison of regional MIGs against zonal MIGs.
    2. An explanation of whether compact placement policies work regionally.
    3. The optimal autoscaling configuration for this workload.
    
    Format the comparison as a Markdown table, and provide the deployment steps
    as ready-to-use gcloud code blocks.
    
  • Modèle de provisionnement et optimisation des coûts : pour évaluer les modèles de provisionnement et réduire les coûts de traitement par lot, utilisez une requête comme celle-ci :

    Act as a platform engineer. I need to find the cheapest way to run large,
    interruptible analytics jobs on our cloud servers without risking data loss.
    
    Please provide the following:
    1. A cost and reliability comparison of standard discounted servers against
       queue-based servers.
    2. An explanation of how to boot all our compute power at the exact same
       time.
    3. A deployment script that gives our jobs a two-minute warning before a
       server gets reclaimed.
    
    Format the comparison as a Markdown table, and provide the script as a
    ready-to-use code block.
    

Étapes suivantes