Tester les capacités des modèles dans Model Garden

Model Garden propose plusieurs options pour vous permettre de visualiser et de tester rapidement les capacités des modèles. Pour les modèles compatibles, vous pouvez essayer des bacs à sable de démonstration ou lancer des applications de démonstration appelées "Model Garden Spaces" que vous pouvez partager avec d'autres utilisateurs pour présenter les capacités d'un modèle.

Les bacs à sable sont alimentés par des points de terminaison de prédiction en ligne Vertex AI prédéployés et n'entraînent aucun frais. Lorsque vous ouvrez la fiche de modèle pour un modèle compatible, vous pouvez utiliser le panneau Tester pour tester rapidement les capacités du modèle en envoyant un prompt textuel. Vous pouvez également définir certains des paramètres les plus courants, tels que la température et le nombre de jetons de sortie. L'atelier est limité aux entrées et sorties de texte uniquement.

Lorsque vous lancez Spaces, vous disposez d'une application Web fonctionnelle prête à l'emploi, avec beaucoup moins d'efforts manuels que pour déployer un modèle et créer une application pour utiliser le point de terminaison du modèle. Model Garden déploie le modèle sélectionné dans Vertex AI et l'application exemple sur une instance Cloud Run qui utilise le point de terminaison du modèle déployé. L'application peut également utiliser des points de terminaison existants ou un point de terminaison MaaS.

Avant de commencer

Ce tutoriel nécessite que vous configuriez un projet Google Cloud et activiez l'API Vertex AI.

  1. Connectez-vous à votre compte Google Cloud . Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits sans frais pour exécuter, tester et déployer des charges de travail.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  4. Verify that billing is enabled for your Google Cloud project.

  5. Enable the Vertex AI, Artifact Registry, Cloud Build, Cloud Logging, and Cloud Run Admin APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  6. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  7. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  8. Verify that billing is enabled for your Google Cloud project.

  9. Enable the Vertex AI, Artifact Registry, Cloud Build, Cloud Logging, and Cloud Run Admin APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  10. Si vous souhaitez essayer les espaces Model Garden, vérifiez que le compte de service Compute Engine par défaut dispose des autorisations requises pour lancer des espaces.

Rôles requis

Pour tester les capacités des modèles dans Model Garden, assurez-vous que vous et le compte de service Compute Engine par défaut disposez des rôles IAM requis.

Rôles utilisateur requis

Pour obtenir les autorisations nécessaires pour tester les capacités des modèles dans Model Garden, demandez à votre administrateur de vous accorder les rôles IAM suivants sur votre projet Google Cloud  :

Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.

Vous pouvez également obtenir les autorisations requises avec des rôles personnalisés ou d'autres rôles prédéfinis.

Rôles requis pour le compte de service Compute Engine par défaut

Le compte de service Compute Engine par défaut est utilisé pour lancer des espaces.

Pour vous assurer que le compte de service Compute Engine par défaut dispose des autorisations nécessaires pour lancer des espaces, demandez à votre administrateur d'accorder les rôles IAM suivants au compte de service Compute Engine par défaut sur votre projet Google Cloud  :

Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.

Votre administrateur peut également attribuer au compte de service Compute Engine par défaut les autorisations requises à l'aide de rôles personnalisés ou d'autres rôles prédéfinis.

Essayer un bac à sable

  1. Dans la console Google Cloud , accédez à la fiche d'un modèle compatible, comme la fiche du modèle Gemma 2.

    Accéder à Gemma 2

  2. Dans le panneau Essayer :

    1. Pour Région, acceptez la valeur par défaut ou sélectionnez votre région.
    2. Pour Point de terminaison, sélectionnez Bac à sable de démonstration.
    3. Dans le champ Requête, saisissez Why is the sky blue?.
    4. Développez la section Options avancées et affichez les paramètres par défaut.

    Panneau d'essai pour Gemma 2b-it

  3. Cliquez sur Envoyer. Le résultat s'affiche sous le bouton "Envoyer".

Essayer Espaces

Pour lancer un modèle, ouvrez la fiche de modèle du modèle compatible, puis, dans le panneau Essayer les Spaces, cliquez sur un Space pour le lancer. Les machines utilisées pour le déploiement et l'instance Cloud Run qui héberge l'application vous sont facturées.

Vous pouvez lancer des espaces avec des modèles tels que Gemini, Gemma, Llama et Stable Diffusion.

Lancer Spaces

Lancez Spaces pour tester un modèle à partir d'un exemple d'application Gradio.

  1. Dans la console Google Cloud , accédez à Model Garden pour afficher la fiche de modèle d'un modèle.

    Accéder à la page "Jardin de modèles"

  2. Sélectionnez le modèle à utiliser. Les fiches de modèle compatibles comportent un panneau Essayer Spaces, comme la fiche du modèle Gemma 3.

    Accéder à Gemma 3

  3. Cliquez sur rocket_launch Exécuter pour lancer un espace.

    1. Vous pouvez choisir d'exiger l'authentification (via Identity-Aware Proxy) ou d'autoriser l'accès public. Pour en savoir plus, consultez Activer les API pour le premier déploiement et accorder des autorisations.
    1. Cliquez sur Créer un service pour lancer le déploiement. Vous pouvez surveiller l'état du déploiement à partir de la fiche de modèle.
  4. Une fois que l'état de Spaces est passé à Prêt, cliquez dessus pour afficher des informations sur le déploiement.

    Pour une protection de base, l'application Web nécessite une clé secrète qui doit être ajoutée à l'URL lors de l'envoi des requêtes. Cette clé secrète est fournie dans le champ Clé secrète.

    1. Cliquez sur Ouvrir pour commencer à utiliser l'application. Vous pouvez envoyer des requêtes au modèle et afficher ses réponses dans l'application.

    Vous pouvez partager l'URL pour que d'autres personnes puissent également essayer l'application.

    1. Pour fermer l'accès à l'application, cliquez sur Modifier dans le champ Contrôle des accès.

    Dans l'onglet Sécurité de votre application Cloud Run, sélectionnez Exiger l'authentification, puis cliquez sur Enregistrer. L'application n'est plus disponible via l'URL. Les visites de l'URL génèrent une erreur 403 (interdit).

Effectuer un nettoyage

Pour éviter que les ressources utilisées sur cette page soient facturées sur votre compte Google Cloud , procédez comme suit :

Supprimer des espaces

Pour libérer de l'espace, vous devez supprimer les ressources du modèle et celles de l'exemple d'application sur Cloud Run.

Supprimer des ressources de modèle

Dans l'application Gradio, vous pouvez supprimer des points de terminaison de modèle pour nettoyer les ressources Vertex AI. Ensuite, vous devez supprimer le service Cloud Run pour arrêter et supprimer l'application Gradio.

Pour supprimer manuellement les ressources Vertex AI, consultez Annuler le déploiement de modèles et supprimer des ressources.

Supprimer le service Cloud Run

Supprimez les ressources associées à un service, y compris toutes les révisions du service. La suppression d'un service n'inclut pas les éléments tels que les images de conteneurs d'Artifact Registry. Pour en savoir plus, consultez Gérer les services dans la documentation Cloud Run.

  1. Dans la console Google Cloud , affichez la liste des services Cloud Run :

    Accédez à Cloud Run

  2. Recherchez le service à supprimer, puis sélectionnez-le.

  3. Cliquez sur Supprimer Supprimer. Cette opération supprime toutes les révisions du service.

Supprimer le projet

Le moyen le plus simple d'empêcher la facturation est de supprimer le projet que vous avez créé pour ce tutoriel.

Pour supprimer le projet :

  1. Dans la console Google Cloud , accédez à la page Gérer les ressources.

    Accéder à la page "Gérer les ressources"

  2. Dans la liste des projets, sélectionnez le projet que vous souhaitez supprimer, puis cliquez sur Supprimer.
  3. Dans la boîte de dialogue, saisissez l'ID du projet, puis cliquez sur Arrêter pour supprimer le projet.

Étapes suivantes

Consultez la présentation de Model Garden.