Model Garden est une bibliothèque de modèles d'IA/ML qui vous aide à découvrir, tester, personnaliser et déployer des modèles et des composants de Google et de ses partenaires.
Avantages de Model Garden
Lorsque vous travaillez avec des modèles d'IA, Model Garden présente les avantages suivants :
- Les modèles disponibles sont tous regroupés au même endroit.
- Model Garden fournit un modèle de déploiement cohérent pour différents types de modèles.
- Model Garden offre une intégration intégrée à d'autres composants de Vertex AI, tels que le réglage, l'évaluation et le service de modèles.
- La diffusion de modèles d'IA générative peut être difficile. Vertex AI gère le déploiement et la diffusion des modèles pour vous.
Explorer les modèles
Pour afficher la liste des modèles Vertex AI et Open Source disponibles (modèles de base, réglables ou spécifiques à une tâche), accédez à la page "Jardin de modèles" dans la consoleGoogle Cloud .
Accéder à la page "Jardin de modèles"
Les catégories de modèles disponibles dans Model Garden sont les suivantes :
Catégorie | Description |
---|---|
Modèles de fondation | Grands modèles multitâches pré-entraînés, qui peuvent être paramétrés ou personnalisés pour des tâches spécifiques à l'aide de Vertex AI Studio, de l'API Vertex AI et du SDK Vertex AI pour Python. |
Modèles ajustables | Modèles que vous pouvez ajuster en utilisant un notebook ou un pipeline personnalisé. |
Solutions spécifiques à une tâche | La plupart de ces modèles prédéfinis sont prêts à l'emploi. Bon nombre d'entre eux peuvent être personnalisés à l'aide de vos propres données. |
Pour filtrer les modèles dans le volet de filtrage, spécifiez les éléments suivants :
- Tâches : cliquez sur la tâche que vous souhaitez que le modèle exécute.
- Collections de modèles : cliquez pour choisir des modèles gérés par Google, des partenaires ou vous-même.
- Fournisseurs : cliquez sur le fournisseur du modèle.
- Caractéristiques : cliquez sur les caractéristiques que vous souhaitez inclure dans le modèle.
Pour en savoir plus sur chaque modèle, cliquez sur la fiche de modèle.
Pour obtenir la liste des modèles disponibles dans Model Garden, consultez Modèles disponibles dans Model Garden.
Analyse de sécurité des modèles
Google effectue des tests et des benchmarks approfondis sur les conteneurs de diffusion et d'optimisation que nous fournissons. L'analyse active des failles s'applique également aux artefacts de conteneur.
Les modèles tiers de partenaires sélectionnés font l'objet d'analyses de points de contrôle pour garantir leur authenticité. Les modèles tiers du hub Hugging Face sont analysés directement par Hugging Face et son outil d'analyse tiers pour détecter les logiciels malveillants, les fichiers pickle, les calques Keras Lambda et les secrets. Les modèles jugés dangereux lors de ces analyses sont signalés par Hugging Face et ne peuvent pas être déployés dans Model Garden. Les modèles considérés comme suspects ou ceux qui peuvent potentiellement exécuter du code à distance sont indiqués dans Model Garden, mais peuvent toujours être déployés. Nous vous recommandons d'examiner minutieusement tout modèle suspect avant de le déployer dans Model Garden.
Tarifs
Pour les modèles Open Source dans Model Garden, des frais vous sont facturés pour l'utilisation des éléments suivants sur Vertex AI :
- Réglages de modèles : les ressources de calcul utilisées vous sont facturées au même tarif que l'entraînement personnalisé. Consultez les tarifs de l'entraînement personnalisé.
- Déploiement de modèle : les ressources de calcul utilisées pour déployer le modèle sur un point de terminaison vous sont facturées. Consultez les tarifs des prédictions.
- Colab Enterprise : consultez les tarifs de Colab Enterprise.
Contrôler l'accès à des modèles spécifiques
Vous pouvez définir une règle d'organisation Model Garden au niveau de l'organisation, du dossier ou du projet pour contrôler l'accès à des modèles spécifiques dans Model Garden. Par exemple, vous pouvez autoriser l'accès à des modèles spécifiques que vous avez examinés et refuser l'accès à tous les autres.
En savoir plus sur Model Garden
Pour en savoir plus sur les options de déploiement et les personnalisations que vous pouvez effectuer avec les modèles dans Model Garden, consultez les ressources des sections suivantes, qui incluent des liens vers des tutoriels, des références, des notebooks et des vidéos YouTube.
Déployer et diffuser
Découvrez comment personnaliser les déploiements et les fonctionnalités de diffusion avancées.
- Déployer et mettre en service un modèle Open Source à l'aide du SDK Python, de la CLI, de l'API REST ou de la console
- Déployer et affiner Gemma 3 dans la vidéo YouTube Model Garden
- Déployer Gemma et effectuer des prédictions
- Mettre en service des modèles ouverts avec un conteneur Hex-LLM sur des Cloud TPU
- Notebook de tutoriel sur le déploiement de modèles Llama à l'aide de Hex-LLM
- Notebook de tutoriel sur l'utilisation de la mise en cache de préfixes et du décodage spéculatif avec Hex-LLM ou vLLM
- Utiliser vLLM pour mettre en service des modèles de langage textuels et multimodaux sur des GPU Cloud
- Utiliser un conteneur de mise en service de GPU xDiT pour la génération d'images et de vidéos
- Mettre en service Gemma 2 avec plusieurs adaptateurs LoRA et le conteneur de deep learning HuggingFace pour l'inférence PyTorch (tutoriel sur Medium)
- Utiliser des gestionnaires personnalisés pour mettre en service PaliGemma pour le sous-titrage d'images avec le conteneur de deep learning HuggingFace pour l'inférence PyTorch (tutoriel sur LinkedIn)
- Notebook de tutoriel sur le déploiement et la mise en service d'un modèle utilisant des VM Spot ou une réservation Compute Engine
- Déployer et mettre en service un modèle HuggingFace
Conformité des conteneurs
Model Garden propose les conteneurs conformes à FedRAMP au niveau d'impact élevé suivants pour le déploiement de modèles.
Réglage
Découvrez comment ajuster les modèles pour adapter les réponses à des cas d'utilisation spécifiques.
- Notebook de tutoriel sur le réglage de Workbench
- Notebook de tutoriel sur le réglage fin et l'évaluation
- Déployer et affiner Gemma 3 dans la vidéo YouTube Model Garden
Évaluation
En savoir plus sur l'évaluation des réponses de modèles avec Vertex AI
Autres ressources
- Notebooks Model Garden spécifiques au modèle et au parcours utilisateur
- Notebooks Vertex AI pour la mise en service, le réglage et l'évaluation de modèles ouverts