Informazioni su app e datastore

Questa pagina descrive le app e i datastore Gemini Enterprise.

Con Gemini Enterprise, crei un'app e la colleghi a un datastore. Un Google Cloud progetto può contenere più app.

Termini chiave:

  • App: un'app Gemini Enterprise fornisce risultati di ricerca, azioni e agenti agli utenti finali. Il termine app può essere utilizzato in modo intercambiabile con il termine motore nel contesto delle API.

  • Datastore: un datastore è un'entità che contiene i dati importati da un'origine dati proprietaria come Cloud Storage o da applicazioni di terze parti come Jira o Salesforce. I datastore che contengono dati di applicazioni di terze parti sono chiamati anche connettori dati.

Relazione tra app e datastore

Un'app deve essere connessa a un datastore per utilizzare i dati al suo interno per mostrare risultati di ricerca, risposte o azioni.

Le app hanno una relazione di tipo "many-to-many" con i datastore. Quando più data store sono collegati a una singola app, si parla di ricerca combinata. Per informazioni sulle limitazioni del collegamento di un'app di ricerca a più di un datastore, consulta Informazioni sulla ricerca combinata.

Metodo di creazione dell'app e importazione dati

Il modo in cui crei un'app e importi i dati dipende dal tipo di dati che hai:

  • Per i dati di terze parti, utilizza la console Google Cloud , non l'API, per creare l'app e importare i dati.

  • Per gli altri dati, puoi utilizzare la console Google Cloud o l'API.

Documenti

Ogni datastore contiene uno o più record di dati, chiamati documenti. Ciò che rappresenta un documento varia a seconda del tipo di dati nel datastore:

  • Dati per origini dati di terze parti. Un documento è un'entità specifica dell'origine dati di terze parti, ad esempio un problema Jira o uno spazio Confluence.

  • Dati strutturati. Un documento è una riga di una tabella o un record JSON che segue uno schema specifico. Puoi fornire questo schema oppure puoi lasciare che Gemini Enterprise lo derivi dai dati inseriti.

  • Dati non strutturati. Un documento è un file in formato HTML, PDF con testo incorporato o TXT. I formati PPTX e DOCX sono disponibili in anteprima.

Datastore e app

In Gemini Enterprise esistono vari tipi di datastore. Un datastore può contenere un solo tipo di dati.

Dati strutturati per datastore di terze parti

I seguenti connettori di origini dati di terze parti sono disponibili in anteprima con lista consentita:

  • Confluence
  • Jira
  • Salesforce
  • SharePoint Online
  • Slack

I dati di queste terze parti sono considerati dati strutturati.

Quando configuri un nuovo connettore, selezioni una frequenza di sincronizzazione. Puoi anche selezionare le entità da sincronizzare. Le entità variano a seconda della fonte, ad esempio i problemi per Jira e i contenuti e gli spazi per Confluence. Per ogni entità viene creato un datastore univoco. I datastore delle entità sono raggruppati per istanza del connettore.

Passaggi successivi

Dati strutturati

Un datastore con dati strutturati consente la ricerca semantica o i suggerimenti sui dati strutturati. Puoi importare i dati da BigQuery o Cloud Storage. Puoi anche caricare manualmente dati JSON strutturati tramite l'API.

Ad esempio, puoi attivare la ricerca o i consigli su un catalogo dei prodotti per la tua esperienza di e-commerce o una directory di medici per la ricerca di fornitori o consigli.

Gemini Enterprise rileva automaticamente lo schema dai dati che importi. Se vuoi, puoi fornire uno schema per i tuoi dati. Fornire uno schema per i tuoi dati in genere migliora la qualità dei risultati.

Passaggi successivi

Dati non strutturati

Un datastore non strutturati consente la ricerca semantica o i suggerimenti sui dati come documenti e immagini.

I datastore non strutturati supportano documenti in formato HTML, PDF con testo incorporato e TXT. I formati PPTX e DOCX sono disponibili in anteprima.

La ricerca fornisce risultati sotto forma di 10 URL e risposte riepilogative per query in linguaggio naturale. I documenti devono essere caricati in un bucket Cloud Storage con le autorizzazioni di accesso appropriate. Ad esempio, un istituto finanziario può attivare la ricerca o i consigli sul proprio corpus privato di pubblicazioni di ricerca finanziaria oppure un'azienda biotecnologica può attivare la ricerca o i consigli sul proprio repository privato di ricerche mediche.

Passaggi successivi

Informazioni sulla ricerca combinata

Con la ricerca combinata, è possibile collegare più datastore a una singola app. In questo modo, l'app può eseguire ricerche in più origini e tipi di dati.

Per creare un'app di ricerca combinata, seleziona più datastore durante la creazione di una nuova app. Se non selezioni più datastore durante la creazione, non potrai aggiungerne altri in un secondo momento.

Quando ottieni i risultati di ricerca, puoi eseguire la ricerca in tutti i datastore o filtrare i risultati di un singolo datastore.

La ricerca combinata presenta le seguenti limitazioni:

  • Aggiunta e rimozione di data store:
    • Per attivare la ricerca ibrida per un'app, devi collegare almeno due datastore durante la creazione dell'app.
    • Puoi aggiungere o rimuovere datastore da un'app di ricerca combinata, ma l'app non può avere meno di due datastore collegati in qualsiasi momento.
    • Se colleghi un singolo datastore a un'app di ricerca durante la creazione dell'app, non puoi aggiungere o rimuovere il datastore.
  • I datastore che contengono dati non strutturati importati utilizzando BigQuery non sono supportati.
  • La ricerca combinata consente di utilizzare i seguenti campi nelle richieste di ricerca:
    • boostSpec
    • contentSearchSpec
    • dataStoreSpecs
    • facetSpecs
    • filter
    • languageCode
    • offset
    • oneBoxPageSize
    • orderBy
    • query
    • pageSize
    • pageToken
    • relevanceScoreSpec
    • relevanceThreshold
    • session
    • sessionSpec
    • spellCorrectionSpec
    • userInfo
    • userPseudoId
  • La ricerca combinata consente di utilizzare i seguenti campi in dataStoreSpecs:
    • dataStore
    • boostSpec: se sono specificate le specifiche di boost sia per SearchRequest che per dataStoreSpecs, entrambe vengono applicate ai risultati di ricerca
    • filter: se sono specificati filtri sia per SearchRequest sia per dataStoreSpecs, entrambi vengono applicati ai risultati di ricerca
  • Le operazioni di creazione, lettura, aggiornamento ed eliminazione (CRUD) sulle configurazioni di pubblicazione sono supportate per le app ibride. Solo i seguenti campi possono essere aggiunti o aggiornati in una configurazione di pubblicazione:
    • boostControlIds
    • displayName
    • filterControlIds
    • genericConfig:
      • contentSearchSpec
    • name
    • solutionType
    • synonymsControlIds
  • Le operazioni CRUD sui seguenti controlli sono supportate per le app di ricerca ibrida:
    • boostAction
    • synonymAction
    • filterAction
  • Esiste un limite di 50 datastore per app di ricerca.
  • Se un datastore utilizza una configurazione CMEK, anche tutti gli altri datastore devono utilizzare la stessa configurazione CMEK.