Informazioni su app e datastore

Questa pagina descrive le app Gemini Enterprise e i datastore.

Con Gemini Enterprise, crei un'app e la colleghi a un datastore. Un Google Cloud progetto può contenere più app.

Termini chiave:

  • App: un'app Gemini Enterprise fornisce risultati di ricerca, azioni e agenti agli utenti finali. Il termine app può essere utilizzato in modo intercambiabile con il termine motore nel contesto delle API.

  • Datastore: un datastore è un'entità che contiene i dati importati da un'origine dati proprietaria come Cloud Storage o da applicazioni di terze parti come Jira o Salesforce. I datastore che contengono dati di applicazioni di terze parti sono chiamati anche connettori dati.

Relazione tra app e datastore

Un'app deve essere connessa a un datastore per utilizzare i dati per mostrare risultati di ricerca, risposte o azioni.

Le app hanno una relazione many-to-many con i datastore. Quando più data store sono collegati a una singola app, si parla di ricerca combinata. Per informazioni sulle limitazioni del collegamento di un'app di ricerca a più di un datastore, consulta Informazioni sulla ricerca combinata.

Metodo di creazione dell'app e importazione dati

Il modo in cui crei un'app e importi i dati dipende dal tipo di dati che hai:

  • Per i dati di terze parti, utilizza la console Google Cloud , non l'API, per creare l'app e importare i dati.

  • Per gli altri dati, puoi utilizzare la console Google Cloud o l'API.

Documenti

Ogni datastore contiene uno o più record di dati, chiamati documenti. Ciò che rappresenta un documento varia a seconda del tipo di dati nel datastore:

  • Dati per origini dati di terze parti. Un documento è un'entità specifica dell'origine dati di terze parti, ad esempio un problema Jira o uno spazio Confluence.

  • Dati strutturati. Un documento è una riga di una tabella o un record JSON che segue uno schema specifico. Puoi fornire questo schema oppure puoi lasciare che Gemini Enterprise lo derivi dai dati inseriti.

  • Dati non strutturati. Un documento è un file in formato HTML, PDF con testo incorporato o TXT. I formati PPTX e DOCX sono disponibili in anteprima.

Datastore e app

In Gemini Enterprise esistono vari tipi di datastore. Un datastore può contenere un solo tipo di dati.

Dati strutturati per datastore di terze parti

I seguenti connettori di origini dati di terze parti sono disponibili in anteprima con lista consentita:

  • Confluence
  • Jira
  • Salesforce
  • SharePoint Online
  • Slack

I dati di queste terze parti sono considerati dati strutturati.

Quando configuri un nuovo connettore, selezioni una frequenza di sincronizzazione. Puoi anche selezionare le entità da sincronizzare. Le entità variano a seconda della fonte, ad esempio i problemi per Jira e i contenuti e gli spazi per Confluence. Per ogni entità viene creato un datastore univoco. I datastore delle entità sono raggruppati per istanza del connettore.

Passaggi successivi

Dati strutturati

Un datastore con dati strutturati consente la ricerca semantica o i suggerimenti sui dati strutturati. Puoi importare i dati da BigQuery o Cloud Storage. Puoi anche caricare manualmente i dati JSON strutturati tramite l'API.

Ad esempio, puoi attivare la ricerca o i consigli su un catalogo di prodotti per la tua esperienza di e-commerce o una directory di medici per la ricerca o i consigli sui fornitori.

Gemini Enterprise rileva automaticamente lo schema dai dati che importi. Se vuoi, puoi fornire uno schema per i tuoi dati. Fornire uno schema per i tuoi dati in genere migliora la qualità dei risultati.

Passaggi successivi

Dati non strutturati

Un datastore di dati non strutturati consente la ricerca semantica o i suggerimenti sui dati come documenti e immagini.

I datastore non strutturati supportano documenti in formato HTML, PDF con testo incorporato e TXT. I formati PPTX e DOCX sono disponibili in anteprima.

La ricerca fornisce risultati sotto forma di 10 URL e risposte riepilogative per le query in linguaggio naturale. I documenti devono essere caricati in un bucket Cloud Storage con le autorizzazioni di accesso appropriate. Ad esempio, un istituto finanziario può attivare la ricerca o i consigli sul proprio corpus privato di pubblicazioni di ricerca finanziaria oppure un'azienda biotecnologica può attivare la ricerca o i consigli sul proprio repository privato di ricerca medica.

Passaggi successivi

Informazioni sulla ricerca combinata

Con la ricerca combinata, è possibile collegare più datastore a una singola app. In questo modo, l'app può eseguire ricerche in più origini e tipi di dati.

Per creare un'app di ricerca combinata, collega uno o più datastore a un'app dopo la sua creazione.

Quando ottieni i risultati di ricerca, puoi eseguire la ricerca in tutti i datastore o filtrare i risultati di un singolo datastore.

La ricerca combinata presenta le seguenti limitazioni:

  • I datastore che contengono dati non strutturati importati utilizzando BigQuery non sono supportati.
  • La ricerca combinata consente i seguenti campi nelle richieste di ricerca:
    • boostSpec
    • contentSearchSpec
    • dataStoreSpecs
    • facetSpecs
    • filter
    • languageCode
    • offset
    • oneBoxPageSize
    • orderBy
    • query
    • pageSize
    • pageToken
    • relevanceScoreSpec
    • relevanceThreshold
    • session
    • sessionSpec
    • spellCorrectionSpec
    • userInfo
    • userPseudoId
  • La ricerca combinata consente di utilizzare i seguenti campi in dataStoreSpecs:
    • dataStore
    • boostSpec: se sono specificate le specifiche di boost sia per SearchRequest che per dataStoreSpecs, entrambe vengono applicate ai risultati di ricerca
    • filter: Se sono specificati filtri sia per SearchRequest sia per dataStoreSpecs, entrambi vengono applicati ai risultati di ricerca
  • Le operazioni di creazione, lettura, aggiornamento ed eliminazione (CRUD) delle configurazioni di pubblicazione sono supportate per le app ibride. Solo i seguenti campi possono essere aggiunti o aggiornati in una configurazione di pubblicazione:
    • boostControlIds
    • displayName
    • filterControlIds
    • genericConfig:
      • contentSearchSpec
    • name
    • solutionType
    • synonymsControlIds
  • Le operazioni CRUD sui seguenti controlli sono supportate per le app di ricerca ibrida:
    • boostAction
    • synonymAction
    • filterAction
  • Esiste un limite di 50 datastore per app di ricerca.
  • Se un datastore utilizza una configurazione CMEK, anche tutti gli altri datastore devono utilizzare la stessa configurazione CMEK.