Ce guide pour débutants vous présente les technologies de base de l'IA générative et explique comment elles s'articulent pour alimenter les chatbots et les applications. L'IA générative (également appelée genAI ou gen AI) est un domaine du machine learning (ML) qui développe et utilise des modèles de ML pour générer de nouveaux contenus.
Les modèles d'IA générative sont souvent appelés grands modèles de langage (LLM) en raison de leur grande taille et de leur capacité à comprendre et à générer du langage naturel. Toutefois, selon les données sur lesquelles les modèles sont entraînés, ils peuvent comprendre et générer du contenu à partir de plusieurs modalités, y compris du texte, des images, des vidéos et de l'audio. Les modèles qui fonctionnent avec plusieurs modalités de données sont appelés modèles multimodaux.
Google propose la famille de modèles d'IA générative Gemini pour les cas d'utilisation multimodaux. Elle est capable de traiter des informations provenant de plusieurs modalités, y compris des images, des vidéos et du texte.
Génération de contenu
Pour que les modèles d'IA générative puissent générer des contenus utiles dans des applications concrètes, ils doivent disposer des capacités suivantes :
Découvrez comment effectuer de nouvelles tâches :
Les modèles d'IA générative sont conçus pour effectuer des tâches générales. Si vous souhaitez qu'un modèle effectue des tâches propres à votre cas d'utilisation, vous devez pouvoir le personnaliser. Sur la plate-forme Gemini Enterprise Agent, vous pouvez personnaliser votre modèle en l'ajustant.
Accès à des informations externes :
Les modèles d'IA générative sont entraînés sur de grandes quantités de données. Toutefois, pour que ces modèles soient utiles, ils doivent pouvoir accéder à des informations en dehors de leurs données d'entraînement. Par exemple, si vous souhaitez créer un chatbot de service client optimisé par un modèle d'IA générative, le modèle doit avoir accès aux informations sur les produits et services que vous proposez. Dans la plate-forme d'agents Gemini Enterprise, vous utilisez les fonctionnalités d'ancrage et d'appel de fonction pour aider le modèle à accéder à des informations externes.
Bloquer le contenu dangereux :
Les modèles d'IA générative peuvent générer des résultats inattendus, y compris du texte offensant ou insensible. Pour assurer la sécurité et éviter les utilisations abusives, les modèles ont besoin de filtres de sécurité pour bloquer les requêtes et les réponses qui sont considérées comme potentiellement dangereuses. La plate-forme d'agents Gemini Enterprise intègre des fonctionnalités de sécurité qui favorisent l'utilisation responsable de nos services d'IA générative.
Prompt
|
|
Le workflow de l'IA générative commence généralement par une requête. Une requête est une demande en langage naturel envoyée à un modèle d'IA générative pour obtenir une réponse. Selon le modèle, un prompt peut contenir du texte, des images, des vidéos, de l'audio, des documents et d'autres modalités, voire même des modalités multiples (multimodal). Le fait d'écrire une requête pour obtenir la réponse souhaitée du modèle est une pratique appelée conception de requête. Bien que la conception d'une requête soit un processus expérimental, vous pouvez utiliser des principes et des stratégies de conception de requêtes pour inciter le modèle à se comporter de la manière souhaitée. Gemini Enterprise Agent Platform Studio propose un outil de gestion des requêtes pour vous aider à gérer vos requêtes. |
Modèles de fondation
|
|
Les prompts sont envoyés à un modèle d'IA générative chargé de générer des réponses. La plate-forme d'agents Gemini Enterprise dispose de divers modèles de fondation d'IA générative accessibles via une API, dont les suivants :
Les modèles diffèrent en termes de taille, de modalité et de coût. Vous pouvez explorer les modèles Google, ainsi que des modèles Open Source et des modèles de partenaires Google, dans Model Garden. |
Personnaliser le modèle
|
|
Vous pouvez personnaliser le comportement par défaut des modèles de fondation de Google afin qu'ils génèrent les résultats souhaités de manière cohérente, sans utiliser de requêtes complexes. Ce processus de personnalisation est appelé réglage du modèle. Les réglages de modèles vous aident à réduire le coût et la latence de vos requêtes en vous permettant de simplifier vos requêtes. La plate-forme d'agents Gemini Enterprise propose également des outils d'évaluation de modèle pour vous aider à évaluer les performances de votre modèle réglé. Une fois que votre modèle réglé est prêt pour la production, vous pouvez le déployer sur un point de terminaison et surveiller les performances, comme dans les workflows MLOps standards. |
Accéder à des informations externes
|
|
Gemini Enterprise Agent Platform offre plusieurs façons de permettre au modèle d'accéder aux API externes et à des informations en temps réel.
|
Vérification des citations
|
|
Une fois la réponse générée, la plate-forme Gemini Enterprise Agent vérifie si les citations doivent être incluses dans la réponse. Si une grande partie du texte de la réponse provient d'une source particulière, cette source est ajoutée aux métadonnées de citation de la réponse. |
IA responsable et sécurité
|
|
La dernière couche de vérification que la requête et la réponse passent avant d'être renvoyée concernent les filtres de sécurité. Gemini Enterprise Agent Platform vérifie à la fois la requête et la réponse indiquant dans quelle mesure la requête ou la réponse appartient à une catégorie de sécurité. Si le seuil est dépassé pour une ou plusieurs catégories, la réponse est bloquée et Gemini Enterprise Agent Platform renvoie une réponse de remplacement. |
Réponse
|
|
Si la requête et la réponse réussissent les contrôles de filtre de sécurité, la réponse est renvoyée. En règle générale, la réponse est renvoyée en une fois. Cependant, avec Agent Platform, vous pouvez également recevoir des réponses progressivement au fur et à mesure de leur génération en activant le streaming. |
Commencer
Essayez l'un de ces guides de démarrage rapide pour commencer à utiliser l'IA générative sur Agent Platform :
- Générer du texte à l'aide de l'API Gemini Agent Platform : utilisez le SDK pour envoyer des requêtes à l'API Gemini.
- Générer une image à l'aide de Gemini : générer des images à partir d'un prompt textuel