À propos des applications et des datastores

Cette page décrit les applications et les datastores Agent Search.

Avec Agent Search, vous créez une application de recherche ou de recommandation et vous l'associez à un data store. Un Google Cloud projet peut contenir plusieurs applications.

Relation entre les applications et les datastores

La relation entre les applications et les datastores dépend du type d'application :

  • Les applications de recherche personnalisée entretiennent une relation de type plusieurs à plusieurs avec les datastores. Lorsque plusieurs datastores sont associés à une seule application de recherche personnalisée, on parle de recherche combinée. Pour en savoir plus sur les limites liées à l'association d'une application de recherche à plusieurs data store, consultez À propos de la recherche combinée.

  • Une application de recommandation personnalisée entretient une relation de type un à un avec son datastore.

  • Une application multimédia entretient une relation de type plusieurs à un avec son data store. Une application ne peut être associée qu'à un seul data store, mais un data store donné peut être associé à plusieurs applications. Par exemple, une application de recherche multimédia et une application de recommandation multimédia peuvent utiliser le même data store.

  • Une application de recherche de données de santé entretient une relation de type plusieurs à un avec son data store. Une application ne peut être associée qu'à un seul data store, mais un data store donné peut être associé à plusieurs applications. Par exemple, une application destinée aux patients et une application destinée aux prestataires peuvent être associées au même data store.

    Pour une importation par lot de données de santé, les données sont importées dans un data store au sein d'une application. Pour une importation de données de santé en streaming (preview) de données de santé, les données sont importées dans une entité, qui est un type de data store au sein d'un connecteur de données. Un connecteur de données est également un type de data store au sein d'une application.

Une fois qu'un data store est associé à une application, il ne peut plus être dissocié.

Méthode de création d'application et d'ingestion de données

La façon dont vous créez une application et ingérez des données dépend du type de données dont vous disposez :

  • Pour les données de sites Web, vous pouvez utiliser la Google Cloud console ou l'API. Pour utiliser des données de sites Web créées avec l'API, vous devez les associer à une application dont les fonctionnalités Enterprise sont activées dans la Google Cloud console.

  • Pour les données structurées ou non structurées, vous pouvez utiliser la Google Cloud console ou l'API.

  • Pour les données de santé, vous pouvez utiliser la Google Cloud console ou l'API.

Documents

Chaque data store contient un ou plusieurs enregistrements de données appelés documents. Ce qu'un document représente dépend du type de données du data store :

  • Site Web : un document est une page Web.

  • Données structurées : un document est une ligne de table ou un enregistrement JSON qui suit un schéma particulier. Vous pouvez fournir ce schéma vous-même ou laisser Agent Search le déduire depuis les données ingérées.

  • Données structurées pour les contenus multimédias : un document est une ligne de table ou un enregistrement JSON qui suit un schéma spécifique aux contenus multimédias. Les documents sont des enregistrements relatifs à des contenus multimédias, tels que des vidéos, des articles d'actualité, des fichiers musicaux et des podcasts. Un document contient des informations qui décrivent l'élément multimédia, au minimum : le titre, l'URI menant à l'emplacement du contenu, les catégories, la durée et la date de disponibilité.

  • Données non structurées : un document est un fichier dans l'un des formats suivants : TXT, PDF, HTML, DOCX, PPTX, XLSX et XLSM.

  • Données de santé FHIR : un document est une ressource FHIR R4 acceptée. Pour obtenir la liste des ressources FHIR R4 compatibles avec Agent Search, consultez la documentation de référence sur le schéma de données de santé FHIR R4.

Datastores et applications

Dans Agent Search, il existe différents types de datastores. Un data store ne peut contenir qu'un seul type de données.

Données de sites Web

Un data store avec des données de sites Web utilise des données indexées issues de sites publics. Vous pouvez fournir un ensemble de formats d'URL que vous souhaitez inclure dans votre data store. Les pages Web qui correspondent aux formats d'URL sont appelées pages Web incluses. Vous pouvez ensuite configurer la recherche sur les données issues de l'exploration des pages Web incluses.

Par exemple, vous pouvez fournir des formats d'URL tels que example.com/faq/* et example.com/events/*, puis activer la recherche sur les données issues de l'exploration de ces pages Web qui correspondent au format. Ces données incluent du texte, des images avec des tags de métadonnées et d'autres données structurées telles que des balises meta, des attributs PageMap et des données schema.org.

Vous pouvez également fournir des formats d'URL pour les parties de sites Web que vous souhaitez exclure, par exemple example.com/events/members-only/* ou example.com/events/past-*. Les URL exclues sont prioritaires par rapport à celles incluses.

Il existe deux types de datastores de données de sites Web :

  • Recherche de base sur les sites Web :

    • Fournit des fonctionnalités de recherche sur l'index de recherche Google existant pour les sites Web inclus.
    • Ne nécessite pas de validation de domaine.
  • Indexation avancée de sites Web:

    • Fournit des fonctionnalités de recherche avancées sur un index généré en fonction de l'un des éléments suivants :
      • Les propriétaires de l'application Agent Search peuvent contrôler les pages Web indexées en envoyant des sitemaps et en les gérant. Pour en savoir plus, consultez Indexer et actualiser des pages Web à l'aide de sitemaps. Ce processus permet de maintenir l'index à jour sans intervention manuelle.
      • Les propriétaires de l'application Agent Search peuvent effectuer une indexation initiale qui reflète l'index de recherche Google, puis étendre la couverture de l'index en explorant à nouveau les sites Web chaque fois que cela est nécessaire, afin de le maintenir à jour. Pour en savoir plus, consultez Actualiser des pages Web. Les fonctionnalités avancées de l'indexation avancée de sites Web sont listées dans Indexation avancée de sites Web.
    • Exige que les propriétaires des datastores Agent Search valident les domaines auxquels appartiennent les sites Web inclus. Pour en savoir plus, consultez Valider des domaines de sites Web.
    • Permet d'ajouter des données structurées au schéma du data store. Un site Web contient des données non structurées, mais vous pouvez ajouter des données structurées sous forme de balises meta, d'attributs PageMap et de données schema.org à vos pages Web. Vous pouvez ensuite utiliser ces données structurées pour modifier le schéma du data store comme expliqué dans Utiliser des données structurées pour l'indexation avancée de sites Web.

Étape suivante

Pour la recherche sur les sites Web :

Données structurées

Un data store avec des données structurées permet la recherche sémantique ou les recommandations basées sur des données structurées. Vous pouvez importer des données depuis BigQuery ou Cloud Storage. Vous pouvez également importer manuellement des données JSON structurées via l'API.

Par exemple, vous pouvez activer la recherche ou les recommandations sur un catalogue de produits pour votre expérience d'e-commerce ou sur un annuaire de médecins pour la recherche ou les recommandations de prestataires.

Agent Search détecte automatiquement le schéma à partir des données que vous importez. Vous pouvez également fournir un schéma pour vos données. Fournir un schéma pour vos données améliore généralement la qualité des résultats.

Étape suivante

Pour la recherche personnalisée :

Pour les recommandations personnalisées :

Données structurées pour les contenus multimédias

Les applications multimédias ne peuvent être associées qu'à des datastores multimédias. Les datastores multimédias sont des datastores de données structurées avec un schéma défini par Google ou avec votre propre schéma personnalisé contenant un ensemble spécifique de cinq champs liés aux contenus multimédias. Pour en savoir plus sur le schéma, consultez À propos des documents et des data stores multimédias.

Par exemple, vous pouvez activer les recommandations en créant une application de recommandations multimédias pour un catalogue de films ou un site d'actualités afin que vos utilisateurs reçoivent des suggestions adaptées et personnalisées.

En plus des documents multimédias, les datastores multimédias contiennent également les informations sur les événements utilisateur qui permettent à Agent Search de personnaliser les recommandations et la recherche pour vos utilisateurs. Les événements utilisateur sont requis pour les applications multimédias. Pour en savoir plus sur les événements utilisateur, consultez Enregistrer des événements utilisateur en temps réel.

Étape suivante

Données non structurées

Un data store non structurées permet la recherche sémantique sur des données telles que des documents et des images.

Les datastores de données non structurées sont compatibles avec les documents aux formats TXT, PDF, HTML, DOCX, PPTX, XLSX et XLSM.

La recherche fournit des résultats sous la forme de 10 URL et de réponses résumées pour les requêtes en langage naturel. Les documents doivent être importés dans un bucket Cloud Storage avec les autorisations d'accès appropriées. Par exemple, un établissement financier peut activer la recherche sur son corpus privé de publications de recherche financière, ou une entreprise de biotechnologie peut activer la recherche ou les recommandations sur son dépôt privé de recherches médicales.

Étape suivante

Pour la recherche :

Données de santé FHIR

Une application de recherche de données de santé utilise des données FHIR R4 importées à partir d'un datastore FHIR de l'API Cloud Healthcare. Pour obtenir la liste des ressources FHIR R4 compatibles avec Agent Search, consultez la documentation de référence sur le schéma de données de santé FHIR R4. Un data store FHIR R4 doit répondre à certaines exigences pour pouvoir être utilisé comme source de données pour un data store Agent Search. Pour en savoir plus, consultez comment préparer des données de santé FHIR pour l'ingestion.

Étape suivante

À propos de la recherche combinée

Vous pouvez créer une application de recherche combinée, dans laquelle plusieurs datastores peuvent être associés à une seule application de recherche personnalisée. Cette fonctionnalité vous permet d'utiliser une seule application pour effectuer des recherches dans plusieurs sources et types de données.

Pour créer une application de recherche combinée, sélectionnez plusieurs datastores lorsque vous créez une application de recherche personnalisée. Si vous ne sélectionnez pas plusieurs datastores lors de la création, vous ne pourrez pas en ajouter d'autres ultérieurement.

Lorsque vous obtenez des résultats de recherche, vous pouvez effectuer une recherche dans tous les datastores ou filtrer les résultats d'un seul data store.

Les limites suivantes s'appliquent :

  • Ajouter et supprimer des datastores :
    • Pour activer la recherche combinée pour une application, vous devez y associer au moins deux datastores lors de la création de l'application.
    • Vous pouvez ajouter ou supprimer des datastores d'une application de recherche combinée, mais l'application ne peut jamais avoir moins de deux datastores associés.
    • Si vous associez un seul data store à une application de recherche lors de la création de l'application, vous ne pourrez pas ajouter ni supprimer ce data store.
  • L'indexation avancée de sites Web doit être activée pour que les datastores de données de sites Web puissent être utilisés pour la recherche combinée. Pour en savoir plus, consultez Indexation avancée de sites Web.
  • Les datastores contenant des données non structurées importées à l'aide de BigQuery ne sont pas compatibles.
  • La recherche combinée autorise les champs suivants dans les requêtes de recherche:
    • boostSpec
    • contentSearchSpec
    • dataStoreSpecs
    • facetSpecs
    • filter
    • languageCode
    • offset
    • oneBoxPageSize
    • orderBy
    • query
    • pageSize
    • pageToken
    • relevanceScoreSpec
    • relevanceThreshold
    • session
    • sessionSpec
    • spellCorrectionSpec
    • userInfo
    • userPseudoId
  • La recherche combinée autorise les champs suivants dans DataStoreSpec:
    • dataStore
    • boostSpec: si des spécifications d'amplification sont spécifiées pour SearchRequest et dataStoreSpecs, les deux spécifications d'amplification sont appliquées aux résultats de recherche.
    • filter: si des filtres sont spécifiés pour SearchRequest et dataStoreSpecs, les deux filtres sont appliqués aux résultats de recherche.
  • Les opérations CRUD (création, lecture, mise à jour et suppression) sur les configurations de diffusion sont compatibles avec les applications combinées. Seuls les champs suivants peuvent être ajoutés ou mis à jour dans une configuration de diffusion :
    • boostControlIds
    • displayName
    • filterControlIds
    • genericConfig:
      • contentSearchSpec
    • name
    • solutionType
    • synonymsControlIds
  • Les opérations CRUD sur les commandes suivantes sont compatibles avec les applications de recherche combinée :
    • boostAction
    • synonymAction
    • filterAction
  • Une application de recherche est limitée à 50 datastores.
  • Si un data store utilise une configuration CMEK, tous les autres datastores doivent également utiliser la même configuration CMEK.