Model Garden vous permet de déployer et de mettre en service vous-même des modèles ouverts, partenaires et personnalisés sur Gemini Enterprise Agent Platform. Contrairement aux offres de modèle en tant que service (MaaS), qui sont sans serveur et ne nécessitent pas de déploiement manuel, les modèles déployés automatiquement s'exécutent de manière sécurisée dans votre Google Cloud projet et votre réseau VPC, ce qui vous donne un contrôle total sur l'environnement de déploiement.
Déployer automatiquement des modèles ouverts
Les modèles ouverts fournissent des capacités pré-entrainées pour diverses tâches d'IA, y compris les modèles Gemma qui excellent dans le traitement multimodal. Ces modèles sont disponibles sans frais. Vous êtes libre de publier leurs résultats, à condition de respecter les conditions de licence. Gemini Enterprise Agent Platform propose des modèles à pondération ouverte et Open Source.
Lorsque vous utilisez un modèle ouvert avec Gemini Enterprise Agent Platform, vous utilisez Gemini Enterprise Agent Platform pour votre infrastructure. Vous pouvez également utiliser des modèles ouverts avec d'autres produits d'infrastructure, tels que PyTorch ou Jax.
Modèles à pondération ouverte
De nombreux modèles ouverts sont considérés comme de grands modèles de langage (LLM) ouverts. Les modèles à pondération ouverte offrent plus de transparence que les modèles qui ne le sont pas. Les pondérations d'un modèle sont les valeurs numériques stockées dans l'architecture de réseau de neurones du modèle, qui représentent les relations et modèles appris à partir des données sur lesquelles un modèle est entraîné. Les paramètres pré-entraînés, ou pondérations, des modèles à pondération ouverte sont publiés. Vous pouvez utiliser un modèle à pondération ouverte pour l'inférence et le réglage. Les détails tels que l'ensemble de données d'origine, l'architecture du modèle et le code d'entraînement ne sont pas toujours fournis.
Modèles Open Source
Les modèles ouverts sont différents des modèles d'IA Open Source. Bien que les modèles ouverts exposent souvent les pondérations et la représentation numérique de base des modèles appris, ils ne fournissent pas nécessairement le code source complet ni les détails de l'entraînement. Les modèles Open Source, en revanche, mettent généralement à disposition l'ensemble du code base, y compris les scripts et les données d'entraînement. Fournir des pondérations offre un niveau de transparence du modèle d'IA, ce qui vous permet de comprendre ses capacités sans avoir à le créer vous-même.
Modèles partenaires déployés automatiquement
Model Garden vous aide à acheter et à gérer les licences de modèles auprès de partenaires qui proposent des modèles propriétaires en tant qu'option de déploiement automatique. Vous pouvez accéder à ces modèles via Cloud Marketplace. Une fois que vous disposez d'une licence, vous pouvez choisir de déployer sur du matériel à la demande ou d'utiliser vos réservations Compute Engine existantes et vos remises automatiques proportionnelles à une utilisation soutenue pour gérer les coûts. Avec les modèles partenaires déployés automatiquement, vous êtes facturé à la fois pour l'utilisation du modèle et pour l'infrastructure Gemini Enterprise Agent Platform sous-jacente consommée.
Pour demander l'utilisation d'un modèle partenaire déployé automatiquement :
- Accédez à la console Model Garden.
- Recherchez le modèle partenaire approprié.
- Cliquez sur Activer et remplissez le formulaire fourni pour obtenir les licences d'utilisation commerciale nécessaires.
Pour en savoir plus sur le déploiement et l'utilisation de modèles partenaires, consultez Déployer un modèle partenaire et envoyer des requêtes de prédiction.
Remarques
Lorsque vous utilisez des modèles partenaires déployés automatiquement, tenez compte des points suivants :
- Exportation de pondérations : contrairement à certains modèles ouverts, vous ne pouvez pas exporter les pondérations des modèles partenaires déployés automatiquement.
- Type de point de terminaison : seul le type de point de terminaison public partagé est compatible avec ces déploiements.
En savoir plus sur les modèles déployés automatiquement dans Gemini Enterprise Agent Platform
- Pour en savoir plus sur les pondérations personnalisées, consultez Déployer des modèles avec des pondérations personnalisées.
- Pour en savoir plus sur Model Garden, consultez Présentation de Model Garden.
- Pour en savoir plus sur le déploiement de modèles, consultez Utiliser des modèles dans Model Garden.
- Utiliser des modèles ouverts Gemma
- Utiliser les modèles ouverts Llama
- Utiliser les modèles ouverts Hugging Face