Cette page décrit les applications et les datastores Gemini Enterprise.
Avec Gemini Enterprise, vous créez une application et l'associez à un data store. Un même projet Google Cloud peut contenir plusieurs applications.
Termes clés :
Application : une application Gemini Enterprise fournit des résultats de recherche, des actions et des agents à vos utilisateurs finaux. Le terme application peut être utilisé de manière interchangeable avec le terme moteur dans le contexte des API.
Datastore : un data store est une entité qui contient les données ingérées à partir d' une source de données first party, telle que Cloud Storage, ou d'applications tierces , telles que Jira ou Salesforce. Les datastores contenant des données provenant d'applications tierces sont également appelés connecteurs de données.
Relation entre les applications et les datastores
Une application doit être associée à un data store pour pouvoir utiliser ses données afin de fournir des résultats de recherche, des réponses ou des actions.
Les applications entretiennent une relation de type plusieurs à plusieurs avec les datastores. Lorsque plusieurs datastores sont associés à une seule application, on parle de recherche combinée. Pour en savoir plus sur les limites liées à l'association d'une application de recherche à plusieurs data store, consultez À propos de la recherche combinée.
Méthode de création d'applications et d'ingestion de données
La façon dont vous créez une application et ingérez des données dépend du type de données dont vous disposez :
Pour les données tierces, vous utilisez la Google Cloud console, et non l'API, pour créer votre application et ingérer des données.
Pour les autres données, vous pouvez utiliser la Google Cloud console ou l'API.
Documents
Chaque data store contient un ou plusieurs enregistrements de données appelés documents. Ce qu'un document représente varie en fonction du type de données du data store :
Données pour les sources de données tierces : Un document est ici une entité spécifique à la source de données tierces, comme un problème Jira ou un espace Confluence.
Données structurées : Un document est une ligne de table ou un enregistrement JSON qui suit un schéma particulier. Vous pouvez fournir ce schéma vous-même ou laisser Gemini Enterprise le déduire depuis les données ingérées.
Données non structurées : Un document correspond à un fichier au format HTML, PDF avec du texte intégré ou TXT. Les formats PPTX et DOCX sont disponibles en version preview.
Datastores et applications
Dans Gemini Enterprise, il existe différents types de datastores. Un data store ne peut contenir qu'un seul type de données.
Données structurées pour les datastores tiers
Les connecteurs de sources de données tierces suivants sont disponibles en version preview avec une liste d'autorisation :
- Confluence
- Jira
- Salesforce
- SharePoint Online
- Slack
Les données de ces tiers sont considérées comme des données structurées.
Lorsque vous configurez un nouveau connecteur, vous sélectionnez une fréquence de synchronisation. Vous sélectionnez également les entités à synchroniser. Les entités varient en fonction de la source, par exemple les problèmes pour Jira, et le contenu et les espaces pour Confluence. Un data store unique est créé pour chaque entité. Les datastores d'entités sont regroupés par instance de connecteur.
Étape suivante
Données structurées
Un data store avec des données structurées permet la recherche sémantique ou les recommandations basées sur des données structurées. Vous pouvez importer des données depuis BigQuery ou Cloud Storage. Vous pouvez également importer manuellement des données JSON structurées via l'API.
Par exemple, vous pouvez activer la recherche ou les recommandations dans un catalogue de produits pour votre expérience d'e-commerce ou dans un annuaire de médecins pour la recherche ou les recommandations de fournisseurs.
Gemini Enterprise détecte automatiquement le schéma à partir des données que vous importez. Si vous le souhaitez, vous pouvez fournir un schéma pour vos données. Fournir un schéma pour vos données améliore généralement la qualité des résultats.
Étape suivante
- Préparez les données structurées pour l'ingestion.
- Créez un data store de recherche à l'aide de l'une des méthodes suivantes :
- Créez une application.
Données non structurées
Un data store non structurées permet la recherche sémantique ou les recommandations basées sur des données telles que des documents et des images.
Les datastores de données non structurées sont compatibles avec les documents aux formats HTML, PDF avec du texte intégré et TXT. Les formats PPTX et DOCX sont disponibles en version preview.
La recherche fournit des résultats sous la forme de 10 URL et de réponses résumées pour les requêtes en langage naturel. Les documents doivent être importés dans un bucket Cloud Storage avec les autorisations d'accès appropriées. Par exemple, un établissement financier peut activer la recherche ou les recommandations dans son corpus privé de publications de recherche financière, ou une entreprise de biotechnologie peut activer la recherche ou les recommandations dans son dépôt privé de recherches médicales.
Étape suivante
- Préparez les données non structurées pour l'ingestion.
- Créez un data store de recherche à l'aide de l'une des méthodes suivantes :
- Créez un datastore first party pour vos données non structurées.
- Créez une application.
À propos de la recherche combinée
Avec la recherche combinée, plusieurs datastores peuvent être associés à une seule application. L'application peut ainsi effectuer des recherches dans plusieurs sources et types de données.
Pour créer une application de recherche combinée, sélectionnez plusieurs datastores lorsque vous créez une application. Si vous ne sélectionnez pas plusieurs datastores lors de la création, vous ne pourrez pas en ajouter d'autres ultérieurement.
Lorsque vous obtenez des résultats de recherche, vous pouvez effectuer une recherche dans tous les datastores ou filtrer les résultats d'un seul data store.
La recherche combinée présente les limites suivantes :
- Ajout et suppression de datastores :
- Pour activer la recherche combinée pour une application, vous devez y associer au moins deux datastores lors de sa création.
- Vous pouvez ajouter ou supprimer des datastores d'une application de recherche combinée, mais l'application ne peut jamais avoir moins de deux datastores associés.
- Si vous associez un seul data store à une application de recherche lors de sa création, vous ne pouvez pas ajouter ni supprimer ce data store.
- Les datastores contenant des données non structurées importées à l'aide de BigQuery ne sont pas acceptés.
- La recherche combinée autorise les champs suivants dans les
requêtes de recherche:
boostSpeccontentSearchSpecdataStoreSpecsfacetSpecsfilterlanguageCodeoffsetoneBoxPageSizeorderByquerypageSizepageTokenrelevanceScoreSpecrelevanceThresholdsessionsessionSpecspellCorrectionSpecuserInfouserPseudoId
- La recherche combinée autorise les champs suivants dans
dataStoreSpecs:dataStoreboostSpec: si des spécifications d'amplification sont spécifiées pourSearchRequestetdataStoreSpecs, les deux spécifications d'amplification sont appliquées aux résultats de recherche.filter: si des filtres sont spécifiés pourSearchRequestetdataStoreSpecs, les deux filtres sont appliqués aux résultats de recherche.
- Les opérations CRUD (création, lecture, mise à jour et suppression) sur les configurations de diffusion sont compatibles avec les applications combinées. Seuls les champs suivants peuvent être ajoutés ou mis à jour dans une configuration de diffusion :
boostControlIdsdisplayNamefilterControlIdsgenericConfig:contentSearchSpec
namesolutionTypesynonymsControlIds
- Les opérations CRUD sur les commandes suivantes sont compatibles avec les applications de recherche combinée :
boostActionsynonymActionfilterAction
- Une application de recherche ne peut pas contenir plus de 50 datastores.
- Si un data store utilise une configuration CMEK, tous les autres datastores doivent également utiliser la même configuration CMEK.