Guide du débutant sur l'IA générative

Ce guide pour débutants vous présente les technologies de base de l'IA générative et explique comment elles s'articulent pour alimenter les chatbots et les applications. L'IA générative (également appelée genAI ou gen AI) est un domaine du machine learning (ML) qui développe et utilise des modèles de ML pour générer de nouveaux contenus.

Les modèles d'IA générative sont souvent appelés grands modèles de langage (LLM) en raison de leur grande taille et de leur capacité à comprendre et à générer du langage naturel. Toutefois, selon les données sur lesquelles les modèles sont entraînés, ils peuvent comprendre et générer du contenu à partir de plusieurs modalités, y compris du texte, des images, des vidéos et de l'audio. Les modèles qui fonctionnent avec plusieurs modalités de données sont appelés modèles multimodaux.

Google propose la famille de modèles d'IA générative Gemini pour les cas d'utilisation multimodaux. Elle est capable de traiter des informations provenant de plusieurs modalités, y compris des images, des vidéos et du texte.

Génération de contenu

Pour que les modèles d'IA générative puissent générer des contenus utiles dans des applications concrètes, ils doivent disposer des fonctionnalités suivantes :

Découvrez comment effectuer de nouvelles tâches :

Les modèles d'IA générative sont conçus pour effectuer des tâches générales. Si vous souhaitez qu'un modèle effectue des tâches propres à votre cas d'utilisation, vous devez pouvoir le personnaliser. Sur Vertex AI, vous pouvez personnaliser votre modèle en l'ajustant.
Accès à des informations externes :

Les modèles d'IA générative sont entraînés sur de grandes quantités de données. Toutefois, pour que ces modèles soient utiles, ils doivent pouvoir accéder à des informations en dehors de leurs données d'entraînement. Par exemple, si vous souhaitez créer un chatbot de service client optimisé par un modèle d'IA générative, le modèle doit avoir accès aux informations sur les produits et services que vous proposez. Dans Vertex AI, vous utilisez les fonctionnalités d'ancrage et d'appel de fonction pour aider le modèle à accéder à des informations externes.
Bloquer le contenu dangereux :

Les modèles d'IA générative peuvent générer des résultats inattendus, y compris du texte offensant ou insensible. Pour assurer la sécurité et éviter les utilisations abusives, les modèles ont besoin de filtres de sécurité pour bloquer les requêtes et les réponses qui sont considérées comme potentiellement dangereuses. Vertex AI intègre des fonctionnalités de sécurité qui favorisent l'utilisation responsable de nos services d'IA générative.

Le schéma suivant montre comment ces différentes fonctionnalités fonctionnent ensemble pour générer le contenu souhaité :

Schéma du workflow d'IA générative

Requête

Le workflow de l'IA générative commence généralement par une requête. Une requête est une instruction en langage naturel envoyée à un modèle d'IA générative pour déclencher une réponse. Selon le modèle, une requête peut contenir du texte, des images, des vidéos, de l'audio, des documents et d'autres modalités, voire même des modalités multiples (requête multimodale).

Le fait d'écrire une requête pour obtenir la réponse souhaitée du modèle est une pratique appelée conception de requête. Bien que la conception d'une requête soit un processus expérimental, vous pouvez utiliser des principes et des stratégies de conception de requêtes pour inciter le modèle à se comporter de la manière souhaitée. Vertex AI Studio propose un outil de gestion des requêtes pour vous aider à gérer vos requêtes.

Modèles de fondation

Les requêtes sont envoyées à un modèle d'IA générative afin de générer des réponses. Vertex AI dispose de divers modèles de fondation d'IA générative accessibles via une API, dont les suivants :

API Gemini : raisonnement avancé, chat multitour, génération de code et requêtes multimodales.
API Imagen : génération d'images, modification d'images et description d'images.
MedLM : système de questions-réponses et de synthèse pour le secteur médical (Obsolète)

Les modèles diffèrent en termes de taille, de modalité et de coût. Vous pouvez explorer les modèles Google, ainsi que des modèles Open Source et des modèles de partenaires Google, dans Model Garden.

Personnaliser le modèle

Vous pouvez personnaliser le comportement par défaut des modèles de fondation de Google afin qu'ils génèrent les résultats souhaités de manière cohérente, sans utiliser de requêtes complexes. Ce processus de personnalisation est appelé réglage du modèle. Les réglages de modèles vous aident à réduire le coût et la latence de vos requêtes en vous permettant de simplifier vos requêtes.

Vertex AI propose également des outils d'évaluation de modèle pour vous aider à évaluer les performances de votre modèle réglé. Une fois que votre modèle réglé est prêt pour la production, vous pouvez le déployer sur un point de terminaison et surveiller les performances, comme dans les workflows MLOps standards.

Accéder à des informations externes

Vertex AI offre plusieurs façons de permettre au modèle d'accéder aux API externes et à des informations en temps réel.

Ancrage : connecte les réponses du modèle à une source fiable, telle que vos propres données ou une recherche sur le Web, ce qui permet de réduire les hallucinations.
RAG : connecte les modèles à des sources de connaissances externes, telles que des documents et des bases de données, afin de générer des réponses plus précises et informatives.
Appel de fonction : permet au modèle d'interagir avec des API externes pour obtenir des informations en temps réel et effectuer des tâches réelles.

Vérification des citations

Une fois la réponse générée, Vertex AI vérifie si les citations doivent être incluses dans la réponse. Si une grande partie du texte de la réponse provient d'une source particulière, cette source est ajoutée aux métadonnées de citation de la réponse.

IA responsable et sécurité

La dernière couche de vérification que la requête et la réponse passent avant d'être renvoyée concernent les filtres de sécurité. Vertex AI vérifie à la fois la requête et la réponse indiquant dans quelle mesure la requête ou la réponse appartient à une catégorie de sécurité. Si le seuil est dépassé pour une ou plusieurs catégories, la réponse est bloquée et Vertex AI renvoie une réponse de remplacement.

Réponse

Si la requête et la réponse réussissent les contrôles de filtre de sécurité, la réponse est renvoyée. En règle générale, la réponse est renvoyée en une fois. Cependant, avec Vertex AI, vous pouvez également recevoir des réponses progressivement, au fur et à mesure de leur génération, en activant le streaming.

Commencer

Pour commencer à utiliser l'IA générative sur Vertex AI, essayez l'un des guides de démarrage rapide suivants :

Générer du texte à l'aide de l'API Gemini Vertex AI : utilisez le SDK pour envoyer des requêtes à l'API Gemini Vertex AI.
Envoyer des requêtes à Gemini à l'aide de la galerie de requêtes Vertex AI Studio : testez des requêtes sans aucune configuration requise.
Générer une image et vérifier son filigrane à l'aide d'Imagen : créer une image avec un filigrane à l'aide d'Imagen sur Vertex AI

Guide du débutant sur l'IA générative Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.