Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Guide du débutant en IA générative

Ce guide pour débutants vous présente les technologies de base de l'IA générative et explique comment elles fonctionnent ensemble pour alimenter les chatbots et les applications. L'IA générative (également appelée genAI ou gen AI) est un domaine du machine learning (ML) qui développe et utilise des modèles de ML pour générer de nouveaux contenus.

Les modèles d'IA générative sont souvent appelés grands modèles de langage (LLM) en raison de leur grande taille et de leur capacité à comprendre et à générer du langage naturel. Toutefois, selon les données sur lesquelles les modèles sont entraînés, ils peuvent comprendre et générer du contenu à partir de plusieurs modalités, y compris du texte, des images, des vidéos et de l'audio. Les modèles qui fonctionnent avec plusieurs modalités de données sont appelés modèles multimodaux.

Google propose la Gemini de modèles d'IA générative Gemini pour les cas d'utilisation multimodaux. Elle est capable de traiter des informations provenant de plusieurs modalités, y compris des images, des vidéos et du texte.

Génération de contenu

Pour que les modèles d'IA générative génèrent des contenus utiles dans les applications réelles, ils doivent disposer des fonctionnalités suivantes :

Apprendre à effectuer de nouvelles tâches :

Les modèles d'IA générative sont conçus pour effectuer des tâches générales. Si vous souhaitez qu'un modèle effectue des tâches propres à votre cas d'utilisation, vous devez pouvoir le personnaliser. Sur Gemini Enterprise Agent Platform, vous pouvez personnaliser votre modèle en l'ajustant.
Accéder à des informations externes :

Les modèles d'IA générative sont entraînés sur de grandes quantités de données. Toutefois, pour que ces modèles soient utiles, ils doivent pouvoir accéder à des informations en dehors de leurs données d'entraînement. Par exemple, si vous souhaitez créer un chatbot de service client alimenté par un modèle d'IA générative, le modèle doit avoir accès à des informations sur les produits et services que vous proposez. Dans Gemini Enterprise Agent Platform, vous utilisez les fonctionnalités d'ancrage et d'appel de fonction pour aider le modèle à accéder à des informations externes.
Bloquer le contenu nuisible :

Les modèles d'IA générative peuvent générer des résultats inattendus, y compris du texte offensant ou insensible. Pour garantir la sécurité et éviter les utilisations abusives, les modèles ont besoin de filtres de sécurité pour bloquer les requêtes et les réponses qui sont considérées comme potentiellement nuisibles. Gemini Enterprise Agent Platform dispose de fonctionnalités de sécurité intégrées qui favorisent l'utilisation responsable de nos services d'IA générative.

Prompt

Le workflow de l'IA générative commence généralement par une requête. Une requête est une instruction en langage naturel envoyée à un modèle d'IA générative afin de déclencher une réponse. Selon le modèle, un prompt peut contenir du texte, des images, des vidéos, de l'audio, des documents et d'autres modalités, voire même des modalités multiples (multimodal).

Le fait d'écrire une requête pour obtenir la réponse souhaitée du modèle est une pratique appelée conception de requête. Bien que la conception d'une requête soit un processus expérimental, vous pouvez utiliser des principes et des stratégies de conception de requêtes pour inciter le modèle à se comporter de la manière souhaitée. Agent Studio propose un outil de gestion des requêtes pour vous aider à gérer vos requêtes.

Modèles de fondation

Les requêtes sont envoyées à un modèle d'IA générative chargé de générer des réponses. Gemini Enterprise Agent Platform dispose de divers modèles de fondation d'IA générative accessibles via une API gérée, dont les suivants :

API Gemini : raisonnement avancé, chat multitour, génération de code et requêtes multimodales.

Les modèles diffèrent en termes de taille, de modalité et de coût. Vous pouvez explorer les modèles Google, ainsi que des modèles Open Source et des modèles de partenaires Google, dans Model Garden.

Personnaliser le modèle

Vous pouvez personnaliser le comportement par défaut des modèles de fondation de Google afin qu'ils génèrent les résultats souhaités de manière cohérente, sans utiliser de requêtes complexes. Ce processus de personnalisation est appelé réglage du modèle. Les réglages de modèles vous aident à réduire le coût et la latence de vos requêtes en vous permettant de simplifier vos requêtes.

Gemini Enterprise Agent Platform propose également des outils d'évaluation de modèle pour vous aider à évaluer les performances de votre modèle réglé. Une fois que votre modèle réglé est prêt pour la production, vous pouvez le déployer sur un point de terminaison et surveiller les performances, comme dans les workflows MLOps standards.

Accès à des informations externes

Gemini Enterprise Agent Platform offre plusieurs façons de permettre au modèle d'accéder à des API externes et à des informations en temps réel.

Ancrage: connecte les réponses du modèle à une source fiable, telle que vos propres données ou une recherche sur le Web, ce qui permet de réduire les hallucinations.
RAG : connecte les modèles à des sources de connaissances externes, telles que des documents et des bases de données, afin de générer des réponses plus précises et informatives.
Appel de fonction : permet au modèle d'interagir avec des API externes pour obtenir des informations en temps réel et effectuer des tâches réelles.

Vérification des citations

Une fois la réponse générée, Gemini Enterprise Agent Platform vérifie si les citations doivent être incluses dans la réponse. Si une grande partie du texte dans la réponse provient d'une source particulière, cette source est ajoutée aux métadonnées de citation de la réponse.

IA responsable et sécurité

La dernière couche de vérification que la requête et la réponse passent avant d'être renvoyée concerne les filtres de sécurité. Gemini Enterprise Agent Platform vérifie à la fois la requête et la réponse pour indiquer dans quelle mesure la requête (ou la réponse) appartient à une catégorie de sécurité. Si le seuil est dépassé pour une ou plusieurs catégories, la réponse est bloquée et Gemini Enterprise Agent Platform renvoie une réponse de remplacement.

Réponse

Si la requête et la réponse réussissent les contrôles de filtre de sécurité, la réponse est renvoyée. En règle générale, la réponse est renvoyée en une fois. Cependant, avec Agent Platform, vous pouvez également recevoir des réponses progressivement au fur et à mesure de leur génération en activant le streaming.

Commencer

Essayez l'un de ces guides de démarrage rapide pour commencer à utiliser l'IA générative sur Agent Platform :

Générer du texte à l'aide de l'API Gemini d'Agent Platform:Utilisez le SDK pour envoyer des requêtes à l'API Gemini.
Générer une image à l'aide de Gemini : générez des images à partir d'une requête textuelle.

Guide du débutant en IA générative Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.