Model Garden est une bibliothèque de modèles d'IA/ML qui vous aide à découvrir, tester, personnaliser et déployer des modèles et des éléments de Google et de ses partenaires.
Avantages de Model Garden
Lorsque vous travaillez avec des modèles d'IA, Model Garden offre les avantages suivants:
- Les modèles disponibles sont tous regroupés au même endroit.
- Model Garden fournit un modèle de déploiement cohérent pour différents types de modèles.
- Model Garden offre une intégration intégrée à d'autres éléments de Vertex AI, tels que le réglage, l'évaluation et le traitement des modèles.
- La diffusion de modèles d'IA générative peut être difficile. Vertex AI gère le déploiement et la diffusion des modèles à votre place.
Explorer les modèles
Pour afficher la liste des modèles Vertex AI et Open Source disponibles (modèles de base, réglables ou spécifiques à une tâche) accédez à la page "Jardin de modèles" dans la consoleGoogle Cloud .
Accéder à la page "Jardin de modèles"
Les catégories de modèles disponibles dans Model Garden sont les suivantes :
| Catégorie | Description |
|---|---|
| Modèles de fondation | Grands modèles multitâches pré-entraînés, qui peuvent être paramétrés ou personnalisés pour des tâches spécifiques à l'aide de Vertex AI Studio, de l'API Vertex AI et du SDK Vertex AI pour Python. |
| Modèles ajustables | Modèles que vous pouvez ajuster en utilisant un notebook ou un pipeline personnalisé. |
| Solutions spécifiques à une tâche | La plupart de ces modèles prédéfinis sont prêts à l'emploi. Bon nombre d'entre eux peuvent être personnalisés à l'aide de vos propres données. |
Pour filtrer les modèles dans le volet de filtrage, spécifiez les éléments suivants :
- Tâches : cliquez sur la tâche que vous souhaitez que le modèle exécute.
- Collections de modèles: cliquez pour choisir les modèles gérés par Google, des partenaires ou vous-même.
- Fournisseurs: cliquez sur le fournisseur du modèle.
- Caractéristiques : cliquez sur les caractéristiques que vous souhaitez inclure dans le modèle.
Pour en savoir plus sur chaque modèle, cliquez sur la fiche de modèle.
Pour obtenir la liste des modèles disponibles dans Model Garden, consultez la section Modèles disponibles dans Model Garden.
Analyse de sécurité des modèles
Google effectue des tests et des analyses comparatives approfondis sur les conteneurs de diffusion et de réglage que nous fournissons. L'analyse active des failles est également appliquée aux artefacts de conteneur.
Les modèles tiers de partenaires sélectionnés sont soumis à des analyses de point de contrôle pour garantir leur authenticité. Les modèles tiers du hub Hugging Face sont analysés directement par Hugging Face et son outil d'analyse tiers pour détecter les logiciels malveillants, les fichiers pickle, les couches Lambda Keras et les secrets. Les modèles jugés non sécurisés par ces analyses sont signalés par HuggingFace et leur déploiement est bloqué dans Model Garden. Les modèles considérés comme suspects ou ceux qui peuvent potentiellement exécuter du code à distance sont indiqués dans Model Garden, mais peuvent toujours être déployés. Nous vous recommandons d'examiner minutieusement tout modèle suspect avant de le déployer dans Model Garden.
Tarifs
Pour les modèles Open Source dans Model Garden, des frais vous sont facturés pour l'utilisation des éléments suivants sur Vertex AI :
- Réglages de modèles : les ressources de calcul utilisées vous sont facturées au même tarif que l'entraînement personnalisé. Consultez les tarifs de l'entraînement personnalisé.
- Déploiement de modèle : les ressources de calcul utilisées pour déployer le modèle sur un point de terminaison vous sont facturées. Consultez les tarifs des prédictions.
- Colab Enterprise : consultez les tarifs de Colab Enterprise.
Contrôler l'accès à des modèles spécifiques
Vous pouvez définir une règle d'organisation Model Garden au niveau de l'organisation, du dossier ou du projet pour contrôler l'accès à des modèles spécifiques dans Model Garden. Par exemple, vous pouvez autoriser l'accès à des modèles spécifiques que vous avez examinés et refuser l'accès à tous les autres.
En savoir plus sur Model Garden
Pour en savoir plus sur les options de déploiement et les personnalisations que vous pouvez effectuer avec les modèles dans Model Garden, consultez les ressources des sections suivantes, qui incluent des liens vers des tutoriels, des références, des notebooks et des vidéos YouTube.
Déployer et diffuser
Découvrez comment personnaliser les déploiements et les fonctionnalités de diffusion avancées.
- Déploiement et exécution d'un modèle Open Source à l'aide du SDK Python, de la CLI, de l'API REST ou de la console
- Vidéo YouTube sur le déploiement et l'ajustement de Gemma 3 dans Model Garden
- Déployer Gemma et effectuer des prédictions
- Diffuser des modèles ouverts avec un conteneur Hex-LLM sur des Cloud TPU
- Déployer des modèles Llama à l'aide du notebook de tutoriel Hex-LLM
- Utiliser le cache de préfixes et le décodage spéculatif avec le notebook de tutoriel Hex-LLM ou vLLM
- Utiliser vLLM pour diffuser des modèles de langage multimodaux et textuels sur des GPU Cloud
- Utiliser le conteneur de diffusion GPU xDiT pour générer des images et des vidéos
- Tutoriel sur la diffusion de Gemma 2 avec plusieurs adaptateurs LoRA avec le DLC HuggingFace pour l'inférence PyTorch sur Medium
- Utiliser des poignées personnalisées pour diffuser PaliGemma pour le sous-titrage d'images avec le DLC HuggingFace pour le tutoriel d'inférence PyTorch sur LinkedIn
- Déploiement et exécution d'un modèle qui utilise des VM Spot ou un notebook de tutoriel sur les réservations Compute Engine
- Déployer et diffuser un modèle HuggingFace
Réglage
Découvrez comment ajuster des modèles pour adapter les réponses à des cas d'utilisation spécifiques.
- Notebook de tutoriel sur l'ajustement de Workbench
- Notebook de tutoriel sur l'ajustement et l'évaluation
- Vidéo YouTube sur le déploiement et l'ajustement de Gemma 3 dans Model Garden
Évaluation
En savoir plus sur l'évaluation des réponses des modèles avec Vertex AI
Autres ressources
- Notebooks Model Garden spécifiques au modèle et au parcours utilisateur
- Notebooks Vertex AI sur l'inférence de modèles, l'ajustement fin et l'évaluation