Vertex AI est une plate-forme unifiée et ouverte qui permet de créer, de déployer et de mettre à l'échelle des modèles d'IA générative et de machine learning (ML), ainsi que des applications d'IA. Il donne accès à Model Garden, qui propose un catalogue de plus de 200 modèles, y compris les modèles de fondation de Google (comme Gemini) et une sélection complète de modèles partenaires et ouverts, ainsi qu'à l'infrastructure TPU/GPU sous-jacente. Vertex AI est compatible avec les workflows d'IA générative de pointe, ainsi qu'avec les workflows d'inférence d'IA pour le MLOps. Elle offre des outils MLOps de bout en bout et des contrôles de niveau entreprise pour la gouvernance, la sécurité et la conformité.
Principales fonctionnalités de Vertex AI
Vertex AI inclut des outils et des services qui prennent en charge l'IA générative, ainsi que les workflows d'inférence d'IA et de machine learning.
Fonctionnalités d'IA générative
Vertex AI regroupe un ensemble complet d'outils avec les outils de modèles de fondation avancés de Google que vous pouvez utiliser pour créer des agents et des applications d'IA générative prêts pour la production, comme suit :
Prompting : commencez par la conception de prompts dans Vertex AI Studio. Vertex AI Studio inclut des outils de conception de requêtes et de gestion de modèles que vous pouvez utiliser pour prototyper, créer et déployer des applications d'IA générative.
Modèles : Model Garden de Vertex AI est un hub centralisé contenant plus de 200 modèles adaptés aux entreprises de Google, de partenaires tiers de premier plan (comme Claude d'Anthropic) et des options Open Source populaires (comme Llama).
Cette sélection de modèles inclut les éléments suivants :
Les modèles d'IA générative de base de Google :
- Gemini : fonctionnalités multimodales pour le texte, les images, les vidéos et l'audio ; et capacités de réflexion pour les modèles, comme Gemini 3 Flash et Gemini 3 Pro (avec Nano Banana).
- Imagen sur Vertex AI : générez et modifiez des images.
- Veo sur Vertex AI : générez des vidéos à partir de texte et d'images.
Modèles partenaires et Open Source : accédez à une sélection de modèles de pointe tels que Claude d'Anthropic, les modèles Mistral AI et Llama, qui offrent un rapport prix/performances supérieur. Ces modèles sont disponibles en tant qu'API MaaS (Model as a Service) entièrement gérées.
Personnalisation des modèles : adaptez les modèles à votre activité pour créer des composants d'IA uniques. Cela va de l'ancrage avec vos données d'entreprise ou la recherche Google pour réduire les hallucinations à l'utilisation de Vertex AI Training pour l'affinage supervisé (SFT) ou l'affinage efficace des paramètres (PEFT) de modèles comme Gemini. Pour en savoir plus sur la personnalisation des modèles, consultez Présentation du réglage.
Évaluations de l'IA générative : évaluez et comparez objectivement les performances des modèles et des agents grâce aux fonctionnalités d'évaluation de l'IA générative de Vertex AI. Assurez la sécurité et la conformité en déployant des fonctionnalités de protection de l'exécution comme Model Armor pour inspecter de manière proactive les menaces émergentes et vous en protéger, comme l'injection de prompt et l'exfiltration de données.
Agent Builder : Vertex AI Agent Builder est un système de transformation agentique complet qui vous aide à créer, gérer et déployer des agents d'IA. Utilisez l'Agent Development Kit (ADK) Open Source pour créer et orchestrer des agents, puis déployez-les dans Vertex AI Agent Engine, un moteur d'agent géré et sans serveur, pour une utilisation à grande échelle en production. Chaque agent se voit attribuer une identité d'agent (principal Identity and Access Management) pour la sécurité et un journal d'audit clair.
Accéder à des informations externes : améliorez les réponses du modèle en vous connectant à des sources fiables avec l'ancrage, en interagissant avec des API externes à l'aide de l'appel de fonction et en récupérant des informations à partir de bases de connaissances avec le RAG.
IA responsable et sécurité : utilisez les fonctionnalités de sécurité intégrées pour bloquer les contenus dangereux et garantir une utilisation responsable de l'IA.
Pour en savoir plus sur l'IA générative sur Vertex AI, consultez la documentation sur l'IA générative sur Vertex AI.
Fonctionnalités d'inférence de l'IA
Vertex AI fournit des outils et des services qui correspondent à chaque étape du workflow de ML :
Préparation des données : collectez, nettoyez et transformez vos données.
- Utilisez les notebooks Vertex AI Workbench pour effectuer une analyse exploratoire des données (EDA).
- Intégrez Cloud Storage et BigQuery pour accéder aux données.
- Utilisez Dataproc Serverless Spark pour le traitement des données à grande échelle.
Entraînement du modèle : entraînez votre modèle de ML.
- Choisissez entre AutoML pour un entraînement sans code ou Entraînement personnalisé pour un contrôle total.
- Gérez et comparez les exécutions d'entraînement à l'aide de Vertex AI Experiments.
- Enregistrez les modèles entraînés dans Vertex AI Model Registry.
- Vertex AI Training propose à la fois l'entraînement sans serveur et les clusters d'entraînement.
- Utilisez l'entraînement sans serveur Vertex AI pour exécuter votre code d'entraînement personnalisé à la demande dans un environnement entièrement géré. Consultez la [présentation de l'entraînement sans serveur Vertex AI][serverless].
- Utilisez des clusters d'entraînement Vertex AI pour les tâches volumineuses qui nécessitent une capacité assurée sur des clusters d'accélérateurs réservés et dédiés. Consultez la présentation des clusters d'entraînement Vertex AI.
- Utilisez Ray sur Vertex AI pour faire évoluer les charges de travail Python et de ML avec le framework Ray Open Source sur un cluster géré et interactif. Consultez la présentation de Ray sur Vertex AI.
- Utilisez Vertex AI Vizier pour ajuster les hyperparamètres des modèles de ML complexes.
Évaluation et itération du modèle : évaluez et améliorez les performances du modèle.
- Utilisez les métriques d'évaluation de modèle pour comparer les modèles.
- Intégrez des évaluations dans les workflows Vertex AI Pipelines.
Diffusion de modèles : déployez votre modèle et obtenez des inférences.
- Déployez pour les inférences en ligne avec des conteneurs prédéfinis ou personnalisés.
- Effectuez des inférences par lot pour les grands ensembles de données.
- Utilisez l'environnement d'exécution TensorFlow optimisé pour un service TensorFlow efficace.
- Comprendre les inférences de modèle avec Vertex Explainable AI
- Diffuser des caractéristiques à partir de Vertex AI Feature Store.
- Déployez des modèles entraînés avec BigQuery ML.
Surveillance des modèles : suivez les performances des modèles déployés au fil du temps.
- Utilisez Vertex AI Model Monitoring pour détecter les écarts entre l'entraînement et le service, ainsi que la dérive d'inférence.
Outils MLOps
Automatisez, gérez et surveillez vos projets de ML :
- Vertex AI Pipelines : orchestrez et automatisez les workflows de ML en tant que pipelines réutilisables.
- Vertex AI Model Registry : gérez le cycle de vie de vos modèles de ML, y compris la gestion des versions et le déploiement.
- Vertex AI Serverless Training : exécutez votre code d'entraînement personnalisé à la demande dans un environnement entièrement géré.
- Vertex AI Model Monitoring : surveillez les modèles déployés pour détecter les écarts et les dérives de données afin de maintenir les performances.
- Vertex AI Experiments : suivez et analysez différentes architectures de modèle et différents hyperparamètres.
- Vertex AI Feature Store : gérez et diffusez les données de caractéristiques pour entraîner des modèles ou effectuer des prédictions en temps réel.
- Vertex ML Metadata : suivez et gérez les métadonnées des artefacts de ML.
- Clusters d'entraînement Vertex AI : entraînez des jobs à grande échelle qui nécessitent une capacité assurée sur un cluster d'accélérateurs dédié et réservé.
- Ray sur Vertex AI : mettez à l'échelle les charges de travail Python et de ML à l'aide du framework Ray Open Source sur un cluster géré et interactif.
Étapes suivantes
- Découvrez l'IA générative sur Vertex AI.
- Découvrez les fonctionnalités MLOps de Vertex AI.
- Découvrez les interfaces que vous pouvez utiliser pour interagir avec Vertex AI.