Informazioni su app e datastore

Questa pagina descrive le app e i datastore di Agent Search.

Con Agent Search, puoi creare un'app di ricerca o di suggerimenti e collegarla a un datastore. Un Google Cloud progetto può contenere più app.

Relazione tra app e datastore

La relazione tra app e datastore dipende dal tipo di app:

  • Le app di ricerca personalizzata hanno una relazione molti-a-molti con i datastore. Quando più datastore sono collegati a una singola app di ricerca personalizzata, si parla di ricerca combinata. Per informazioni sui limiti del collegamento di un'app di ricerca a più di un datastore, consulta Informazioni sulla ricerca combinata.

  • Un'app di suggerimenti personalizzata ha una connessione uno-a-uno con il relativo datastore.

  • Un'app multimediale ha una relazione molti-a-uno con il relativo datastore. Un'app può connettersi a un solo datastore, mentre un determinato datastore può essere connesso a più app. Ad esempio, un'app di ricerca di contenuti multimediali e un'app di suggerimenti sui contenuti multimediali possono condividere un datastore.

  • Un'app di ricerca dei dati sanitari ha una relazione molti-a-uno con il relativo datastore. Un'app può connettersi a un solo datastore, mentre un determinato datastore può essere connesso a più app. Ad esempio, un'app rivolta ai pazienti e un'app rivolta ai fornitori possono connettersi allo stesso datastore.

    Per un'importazione batch di dati sanitari, i dati vengono importati in un data store all'interno di un'app. Per l'importazione di dati in streaming (anteprima) di dati sanitari, i dati vengono importati in un'entità, che è un tipo di data store all'interno di un connettore di dati. Un connettore di dati è anche un tipo di datastore all'interno di un'app.

Una volta collegato un datastore a un'app, non è possibile scollegarlo.

Metodo di creazione dell'app e di importazione dati

La modalità di creazione di un'app e di importazione dei dati dipende dal tipo di dati che hai:

  • Per i dati dei siti web, puoi utilizzare la Google Cloud console o l'API. Per utilizzare i dati di un sito web creati con l'API, devi collegarli a un'app con le funzionalità Enterprise attivate nella Google Cloud console.

  • Per i dati strutturati o non strutturati, puoi utilizzare la Google Cloud console o l'API.

  • Per i dati sanitari, puoi utilizzare la Google Cloud console o l'API.

Documenti

Ogni datastore contiene uno o più record di dati, chiamati documenti. Ciò che rappresenta un documento varia a seconda del tipo di dati nel datastore:

  • Sito web. Un documento è una pagina web.

  • Dati strutturati. Un documento è una riga in una tabella o un record JSON che segue uno schema specifico. Puoi fornire tu stesso questo schema oppure lasciare che Agent Search lo ricavi dai dati importati.

  • Dati strutturati per i contenuti multimediali. Un documento è una riga in una tabella o un record JSON che segue uno schema specifico per i contenuti multimediali. I documenti sono record relativi a contenuti multimediali, come video, articoli di notizie, file musicali e podcast. Un documento contiene informazioni che descrivono l'elemento multimediale, come minimo: titolo, URI alla posizione dei contenuti, categorie, durata e data di disponibilità.

  • Dati non strutturati. Un documento è un file in uno dei seguenti formati: TXT, PDF, HTML, DOCX, PPTX, XLSX e XLSM.

  • Dati FHIR Healthcare. Un documento è una risorsa FHIR R4 supportata. Per un elenco delle risorse FHIR R4 supportate da Agent Search, consulta la documentazione di riferimento sullo schema dei dati FHIR R4 Healthcare.

Datastore e app

In Agent Search esistono vari tipi di datastore. Un datastore può contenere un solo tipo di dati.

Dati dei siti web

Un datastore con dati di siti web utilizza i dati indicizzati dai siti web pubblici. Puoi fornire un insieme di pattern URL da includere nel datastore. Le pagine web che corrispondono ai pattern URL sono chiamate pagine web incluse. Puoi quindi configurare la ricerca nei dati sottoposti a crawling dalle pagine web incluse.

Ad esempio, puoi fornire pattern URL come example.com/faq/* e example.com/events/* e attivare la ricerca nei dati sottoposti a crawling da queste pagine web che corrispondono al pattern. Questi dati includono testo, immagini con tag di metadati e altri dati strutturati come tag meta, attributi PageMap e dati schema.org.

Puoi anche fornire pattern URL per le parti dei siti web che vuoi escludere, ad esempio example.com/events/members-only/* o example.com/events/past-*. Gli URL esclusi hanno la priorità rispetto a quelli inclusi.

Esistono due tipi di datastore di siti web:

  • Ricerca di base sui siti web:

    • Fornisce funzionalità di ricerca nell'indice della Ricerca Google esistente per i siti web inclusi.
    • Non richiede la verifica del dominio.
  • Indicizzazione avanzata dei siti web:

    • Fornisce funzionalità di ricerca avanzate su un indice generato in base a una delle seguenti opzioni:
      • I proprietari delle app di Agent Search possono controllare le pagine web indicizzate inviando e gestendo le Sitemap. Per saperne di più, consulta Indicizzare e aggiornare le pagine web utilizzando le Sitemap. Questo processo mantiene aggiornato l'indice senza intervento manuale.
      • I proprietari delle app di Agent Search possono eseguire un'indicizzazione iniziale che rispecchia l'indice della Ricerca Google e poi espandere la copertura dell'indice eseguendo nuovamente il crawling dei siti web ogni volta che è necessario, mantenendolo aggiornato. Per saperne di più, consulta Aggiornare le pagine web. Le funzionalità avanzate dell'indicizzazione avanzata dei siti web sono elencate in Indicizzazione avanzata dei siti web.
    • Richiede ai proprietari dei datastore di Agent Search di verificare i domini a cui appartengono i siti web inclusi. Per saperne di più, consulta Verificare i domini dei siti web.
    • Offre la possibilità di aggiungere dati strutturati allo schema del datastore. Un sito web contiene dati non strutturati, ma puoi aggiungere dati strutturati sotto forma di tag meta, attributi PageMap e dati schema.org alle tue pagine web. Puoi quindi utilizzare questi dati strutturati per modificare lo schema del datastore come spiegato in Utilizzare i dati strutturati per l'indicizzazione avanzata dei siti web.

Passaggi successivi

Per la ricerca sui siti web:

Dati strutturati

Un datastore con dati strutturati consente la ricerca semantica o i suggerimenti sui dati strutturati. Puoi importare i dati da BigQuery o Cloud Storage. Puoi anche caricare manualmente i dati JSON strutturati tramite l'API.

Ad esempio, puoi attivare la ricerca o i suggerimenti su un catalogo di prodotti per la tua esperienza di e-commerce o su un elenco di medici per la ricerca o i suggerimenti sui fornitori.

Agent Search rileva automaticamente lo schema dai dati che importi. Facoltativamente, puoi fornire uno schema per i tuoi dati. In genere, fornire uno schema per i dati migliora la qualità dei risultati.

Passaggi successivi

Per la ricerca personalizzata:

Per i suggerimenti personalizzati:

Dati strutturati per i contenuti multimediali

Le app multimediali possono essere collegate solo ai datastore di contenuti multimediali. I datastore di contenuti multimediali sono datastore di dati strutturati con uno schema definito da Google o con un tuo schema personalizzato che contiene un insieme specifico di cinque campi relativi ai contenuti multimediali. Per saperne di più sullo schema, consulta Informazioni sui documenti e sui datastore di contenuti multimediali.

Ad esempio, puoi attivare i suggerimenti creando un'app di suggerimenti sui contenuti multimediali per un catalogo di film o un sito di notizie in modo che gli utenti ricevano suggerimenti adatti e personalizzati.

Oltre ai documenti multimediali, i datastore di contenuti multimediali contengono anche le informazioni sugli eventi utente che consentono ad Agent Search di personalizzare i suggerimenti e la ricerca per gli utenti. Gli eventi utente sono obbligatori per le app multimediali. Per informazioni sugli eventi utente, consulta Registrare gli eventi utente in tempo tempo reale.

Passaggi successivi

Dati non strutturati

Un datastore di dati non strutturati consente la ricerca semantica su dati come documenti e immagini.

I datastore di dati non strutturati supportano documenti in formato TXT, PDF, HTML, DOCX, PPTX, XLSX e XLSM.

La ricerca fornisce risultati sotto forma di 10 URL e risposte riassuntive per le query in linguaggio naturale. I documenti devono essere caricati in un bucket Cloud Storage con le autorizzazioni di accesso appropriate. Ad esempio, un istituto finanziario può attivare la ricerca nel proprio corpus privato di pubblicazioni di ricerca finanziaria oppure un'azienda di biotecnologie può attivare la ricerca o i suggerimenti nel proprio repository privato di ricerca medica.

Passaggi successivi

Per la ricerca:

Dati FHIR Healthcare

Un'app di ricerca dei dati sanitari utilizza i dati FHIR R4 importati da un datastore FHIR dell'API Cloud Healthcare. Per un elenco delle risorse FHIR R4 supportate da Agent Search, consulta la documentazione di riferimento sullo schema dei dati FHIR R4 Healthcare. Un datastore di dati FHIR R4 deve soddisfare alcuni requisiti prima di poter essere utilizzato come origine dati per il datastore di Agent Search. Per saperne di più, consulta come preparare i dati FHIR Healthcare per l'importazione.

Passaggi successivi

Informazioni sulla ricerca combinata

Puoi creare un'app di ricerca combinata, in cui più datastore possono essere collegati a una singola app di ricerca personalizzata. Questa funzionalità ti consente di utilizzare un'unica app per eseguire ricerche in più origini e tipi di dati.

Per creare un'app di ricerca combinata, seleziona più datastore durante la creazione di una nuova app di ricerca personalizzata. Se non selezioni più datastore durante la creazione, non potrai aggiungerne altri in un secondo momento.

Quando ottieni i risultati di ricerca, puoi eseguire la ricerca in tutti i datastore o filtrare i risultati di un singolo datastore.

Si applicano le seguenti limitazioni:

  • Aggiunta e rimozione di datastore:
    • Per attivare la ricerca combinata per un'app, devi collegare almeno due datastore durante la creazione dell'app.
    • Puoi aggiungere o rimuovere datastore da un'app di ricerca combinata, ma l'app non può avere meno di due datastore collegati in qualsiasi momento.
    • Se colleghi un singolo datastore a un'app di ricerca durante la creazione dell'app, non puoi aggiungere o rimuovere quel datastore.
  • I datastore di dati di siti web devono avere l'indicizzazione avanzata dei siti web attivata per poter essere utilizzati per la ricerca combinata. Per saperne di più, consulta Indicizzazione avanzata dei siti web.
  • I datastore che contengono dati non strutturati importati utilizzando BigQuery non sono supportati.
  • La ricerca combinata consente i seguenti campi nelle richieste di ricerca:
    • boostSpec
    • contentSearchSpec
    • dataStoreSpecs
    • facetSpecs
    • filter
    • languageCode
    • offset
    • oneBoxPageSize
    • orderBy
    • query
    • pageSize
    • pageToken
    • relevanceScoreSpec
    • relevanceThreshold
    • session
    • sessionSpec
    • spellCorrectionSpec
    • userInfo
    • userPseudoId
  • La ricerca combinata consente i seguenti campi in DataStoreSpec:
    • dataStore
    • boostSpec: se sono specificate specifiche di aumento sia per SearchRequest sia per dataStoreSpecs, entrambe le specifiche di aumento vengono applicate ai risultati di ricerca
    • filter: se sono specificati filtri sia per SearchRequest sia per dataStoreSpecs, entrambi i filtri vengono applicati ai risultati di ricerca
  • Le operazioni di creazione, lettura, aggiornamento ed eliminazione (CRUD) sulle configurazioni di pubblicazione sono supportate per le app combinate. Nelle configurazioni di pubblicazione è possibile aggiungere o aggiornare solo i seguenti campi:
    • boostControlIds
    • displayName
    • filterControlIds
    • genericConfig:
      • contentSearchSpec
    • name
    • solutionType
    • synonymsControlIds
  • Le operazioni CRUD sui seguenti controlli sono supportate per le app di ricerca combinata:
    • boostAction
    • synonymAction
    • filterAction
  • È previsto un limite di 50 datastore per app di ricerca.
  • Se un datastore utilizza una configurazione CMEK, anche tutti gli altri datastore devono utilizzare la stessa configurazione CMEK.