À propos des applications et des datastores

Cette page décrit les applications et les datastores Gemini Enterprise.

Avec Gemini Enterprise, vous créez une application et l'associez à un data store. Un même projet Google Cloud peut contenir plusieurs applications.

Termes clés :

  • Application : une application Gemini Enterprise fournit des résultats de recherche, des actions et des agents à vos utilisateurs finaux. Le terme application peut être utilisé de manière interchangeable avec le terme moteur dans le contexte des API.

  • Datastore : un data store est une entité qui contient les données ingérées à partir d' une source de données first party, telle que Cloud Storage, ou d'applications tierces , telles que Jira ou Salesforce. Les datastores contenant des données provenant d'applications tierces sont également appelés connecteurs de données.

Relation entre les applications et les datastores

Une application doit être associée à un data store pour pouvoir utiliser ses données afin de fournir des résultats de recherche, des réponses ou des actions.

Les applications entretiennent une relation de type plusieurs à plusieurs avec les datastores. Lorsque plusieurs datastores sont associés à une seule application, on parle de recherche combinée. Pour en savoir plus sur les limites liées à l'association d'une application de recherche à plusieurs data store, consultez À propos de la recherche combinée.

Méthode de création d'applications et d'ingestion de données

La façon dont vous créez une application et ingérez des données dépend du type de données dont vous disposez :

  • Pour les données tierces, vous utilisez la Google Cloud console, et non l'API, pour créer votre application et ingérer des données.

  • Pour les autres données, vous pouvez utiliser la Google Cloud console ou l'API.

Documents

Chaque data store contient un ou plusieurs enregistrements de données appelés documents. Ce qu'un document représente varie en fonction du type de données du data store :

  • Données pour les sources de données tierces : Un document est ici une entité spécifique à la source de données tierces, comme un problème Jira ou un espace Confluence.

  • Données structurées : Un document est une ligne de table ou un enregistrement JSON qui suit un schéma particulier. Vous pouvez fournir ce schéma vous-même ou laisser Gemini Enterprise le déduire depuis les données ingérées.

  • Données non structurées : Un document correspond à un fichier au format HTML, PDF avec du texte intégré ou TXT. Les formats PPTX et DOCX sont disponibles en version preview.

Datastores et applications

Dans Gemini Enterprise, il existe différents types de datastores. Un data store ne peut contenir qu'un seul type de données.

Données structurées pour les datastores tiers

Les connecteurs de sources de données tierces suivants sont disponibles en version preview avec une liste d'autorisation :

  • Confluence
  • Jira
  • Salesforce
  • SharePoint Online
  • Slack

Les données de ces tiers sont considérées comme des données structurées.

Lorsque vous configurez un nouveau connecteur, vous sélectionnez une fréquence de synchronisation. Vous sélectionnez également les entités à synchroniser. Les entités varient en fonction de la source, par exemple les problèmes pour Jira, et le contenu et les espaces pour Confluence. Un data store unique est créé pour chaque entité. Les datastores d'entités sont regroupés par instance de connecteur.

Étape suivante

Données structurées

Un data store avec des données structurées permet la recherche sémantique ou les recommandations basées sur des données structurées. Vous pouvez importer des données depuis BigQuery ou Cloud Storage. Vous pouvez également importer manuellement des données JSON structurées via l'API.

Par exemple, vous pouvez activer la recherche ou les recommandations dans un catalogue de produits pour votre expérience d'e-commerce ou dans un annuaire de médecins pour la recherche ou les recommandations de fournisseurs.

Gemini Enterprise détecte automatiquement le schéma à partir des données que vous importez. Si vous le souhaitez, vous pouvez fournir un schéma pour vos données. Fournir un schéma pour vos données améliore généralement la qualité des résultats.

Étape suivante

Données non structurées

Un data store non structurées permet la recherche sémantique ou les recommandations basées sur des données telles que des documents et des images.

Les datastores de données non structurées sont compatibles avec les documents aux formats HTML, PDF avec du texte intégré et TXT. Les formats PPTX et DOCX sont disponibles en version preview.

La recherche fournit des résultats sous la forme de 10 URL et de réponses résumées pour les requêtes en langage naturel. Les documents doivent être importés dans un bucket Cloud Storage avec les autorisations d'accès appropriées. Par exemple, un établissement financier peut activer la recherche ou les recommandations dans son corpus privé de publications de recherche financière, ou une entreprise de biotechnologie peut activer la recherche ou les recommandations dans son dépôt privé de recherches médicales.

Étape suivante

À propos de la recherche combinée

Avec la recherche combinée, plusieurs datastores peuvent être associés à une seule application. L'application peut ainsi effectuer des recherches dans plusieurs sources et types de données.

Pour créer une application de recherche combinée, sélectionnez plusieurs datastores lorsque vous créez une application. Si vous ne sélectionnez pas plusieurs datastores lors de la création, vous ne pourrez pas en ajouter d'autres ultérieurement.

Lorsque vous obtenez des résultats de recherche, vous pouvez effectuer une recherche dans tous les datastores ou filtrer les résultats d'un seul data store.

La recherche combinée présente les limites suivantes :

  • Ajout et suppression de datastores :
    • Pour activer la recherche combinée pour une application, vous devez y associer au moins deux datastores lors de sa création.
    • Vous pouvez ajouter ou supprimer des datastores d'une application de recherche combinée, mais l'application ne peut jamais avoir moins de deux datastores associés.
    • Si vous associez un seul data store à une application de recherche lors de sa création, vous ne pouvez pas ajouter ni supprimer ce data store.
  • Les datastores contenant des données non structurées importées à l'aide de BigQuery ne sont pas acceptés.
  • La recherche combinée autorise les champs suivants dans les requêtes de recherche:
    • boostSpec
    • contentSearchSpec
    • dataStoreSpecs
    • facetSpecs
    • filter
    • languageCode
    • offset
    • oneBoxPageSize
    • orderBy
    • query
    • pageSize
    • pageToken
    • relevanceScoreSpec
    • relevanceThreshold
    • session
    • sessionSpec
    • spellCorrectionSpec
    • userInfo
    • userPseudoId
  • La recherche combinée autorise les champs suivants dans dataStoreSpecs :
    • dataStore
    • boostSpec: si des spécifications d'amplification sont spécifiées pour SearchRequest et dataStoreSpecs, les deux spécifications d'amplification sont appliquées aux résultats de recherche.
    • filter: si des filtres sont spécifiés pour SearchRequest et dataStoreSpecs, les deux filtres sont appliqués aux résultats de recherche.
  • Les opérations CRUD (création, lecture, mise à jour et suppression) sur les configurations de diffusion sont compatibles avec les applications combinées. Seuls les champs suivants peuvent être ajoutés ou mis à jour dans une configuration de diffusion :
    • boostControlIds
    • displayName
    • filterControlIds
    • genericConfig:
      • contentSearchSpec
    • name
    • solutionType
    • synonymsControlIds
  • Les opérations CRUD sur les commandes suivantes sont compatibles avec les applications de recherche combinée :
    • boostAction
    • synonymAction
    • filterAction
  • Une application de recherche ne peut pas contenir plus de 50 datastores.
  • Si un data store utilise une configuration CMEK, tous les autres datastores doivent également utiliser la même configuration CMEK.