Model Garden est une bibliothèque de modèles d'IA/ML qui vous permet de découvrir, tester, personnaliser et déployer des modèles et des éléments de Google et de ses partenaires.
Avantages de Model Garden
Lorsque vous travaillez avec des modèles d'IA, Model Garden présente les avantages suivants :
- Les modèles disponibles sont tous regroupés au même endroit.
- Model Garden fournit un modèle de déploiement cohérent pour différents types de modèles.
- Model Garden fournit une intégration intégrée à d'autres parties de Gemini Enterprise Agent Platform, telles que le réglage, l'évaluation et la diffusion de modèles.
- La diffusion de modèles d'IA générative peut être difficile. Gemini Enterprise Agent Platform gère le déploiement et la diffusion des modèles pour vous.
Explorer les modèles
Pour afficher la liste des modèles Gemini Enterprise Agent Platform et Open Source disponibles (modèles de base, réglables ou spécifiques à une tâche), accédez à la page "Jardin de modèles" dans la Google Cloud console.
Les catégories de modèles disponibles dans Model Garden sont les suivantes :
| Catégorie | Description |
|---|---|
| Modèles de fondation | Grands modèles multitâches pré-entraînés, qui peuvent être réglés ou personnalisés pour des tâches spécifiques à l'aide d'Agent Studio, de l'API Agent Platform et du SDK Agent Platform. |
| Modèles ajustables | Modèles que vous pouvez ajuster en utilisant un notebook ou un pipeline personnalisé. |
| Solutions spécifiques à une tâche | La plupart de ces modèles prédéfinis sont prêts à l'emploi. Bon nombre d'entre eux peuvent être personnalisés à l'aide de vos propres données. |
Pour filtrer les modèles dans le volet de filtrage, spécifiez les éléments suivants :
- Tâches : cliquez sur la tâche que vous souhaitez que le modèle exécute.
- Collections de modèles : cliquez pour choisir les modèles gérés par Google, ses partenaires ou vous-même.
- Fournisseurs : cliquez sur le fournisseur du modèle.
- Caractéristiques : cliquez sur les caractéristiques que vous souhaitez inclure dans le modèle.
Pour en savoir plus sur chaque modèle, cliquez sur la fiche de modèle.
Analyse de sécurité des modèles
Google effectue des tests et des benchmarks approfondis sur les conteneurs de diffusion et de réglage que nous fournissons. Une analyse active des failles est également appliquée aux artefacts de conteneur.
Les modèles tiers de partenaires présentés font l'objet d'analyses de points de contrôle pour garantir leur authenticité. Les modèles tiers de HuggingFace Hub sont analysés directement par HuggingFace et leur scanner tiers pour détecter les logiciels malveillants, les fichiers pickle, les calques Keras Lambda et les secrets. Les modèles jugés dangereux par ces analyses sont signalés par HuggingFace et ne peuvent pas être déployés dans Model Garden. Les modèles jugés suspects ou ceux qui peuvent potentiellement exécuter du code à distance sont indiqués dans Model Garden, mais peuvent toujours être déployés. Nous vous recommandons d'examiner attentivement tout modèle suspect avant de le déployer dans Model Garden.
Tarifs
Pour les modèles Open Source dans Model Garden, des frais vous sont facturés pour l'utilisation des éléments suivants sur Gemini Enterprise Agent Platform :
- Réglages de modèles : les ressources de calcul utilisées vous sont facturées au même tarif que l'entraînement personnalisé. Consultez les tarifs de l'entraînement personnalisé.
- Déploiement de modèle : les ressources de calcul utilisées pour déployer le modèle sur un point de terminaison vous sont facturées. Consultez les tarifs des prédictions.
- Colab Enterprise : consultez les tarifs de Colab Enterprise.
Contrôler l'accès à des modèles spécifiques
Vous pouvez définir une règle d'organisation Model Garden au niveau de l'organisation, du dossier ou du projet pour contrôler l'accès à des modèles spécifiques dans Model Garden. Par exemple, vous pouvez autoriser l'accès à des modèles spécifiques que vous avez examinés et refuser l'accès à tous les autres.
En savoir plus sur Model Garden
Pour en savoir plus sur les options de déploiement et les personnalisations que vous pouvez effectuer avec les modèles dans Model Garden, consultez les ressources des sections suivantes, qui incluent des liens vers des tutoriels, des références, des notebooks et des vidéos YouTube.
Déployer et mettre en service
Découvrez comment personnaliser les déploiements et les fonctionnalités de diffusion avancées.
- Déployer et mettre en service un modèle Open Source à l'aide du SDK Python, de la CLI, de l'API REST ou de la console
- Déploiement et réglage de Gemma 3 dans Model Garden (vidéo YouTube)
- Déployer Gemma et effectuer des prédictions
- Mettre en service des modèles ouverts avec un conteneur Hex-LLM sur des Cloud TPU
- Déployer des modèles Llama à l'aide du notebook de tutoriel Hex-LLM
- Utiliser la mise en cache de préfixes et le décodage spéculatif avec le notebook de tutoriel Hex-LLM ou vLLM
- Utiliser vLLM pour mettre en service des modèles de langage textuels et multimodaux sur des GPU Cloud
- Utiliser un conteneur de mise en service de GPU xDiT pour la génération d'images et de vidéos
- Mettre en service Gemma 2 avec plusieurs adaptateurs LoRA et le conteneur de deep learning HuggingFace pour l'inférence PyTorch (tutoriel sur Medium)
- Utiliser des gestionnaires personnalisés pour mettre en service PaliGemma pour le sous-titrage d'images avec le conteneur de deep learning HuggingFace pour l'inférence PyTorch (tutoriel sur LinkedIn)
- Notebook de tutoriel sur le déploiement et la mise en service d'un modèle utilisant des VM Spot ou une réservation Compute Engine
- Déployer et mettre en service un modèle HuggingFace
Réglage
Découvrez comment régler des modèles pour adapter les réponses à des cas d'utilisation spécifiques.
- Notebook de tutoriel sur le réglage de Workbench
- Notebook de tutoriel sur le réglage et l'évaluation
- Déploiement et réglage de Gemma 3 dans Model Garden (vidéo YouTube)
Évaluation
Découvrez comment évaluer les réponses des modèles avec Agent Platform.
Autres ressources
- Notebooks Model Garden spécifiques au modèle et au parcours utilisateur
- Notebooks de diffusion, de réglage et d'évaluation de modèles ouverts de Gemini Enterprise Agent Platform