Esegui query sui dati BigLake con il linguaggio naturale

Questa guida mostra come utilizzare l'analisi conversazionale in BigQuery per eseguire query sui dati nelle tabelle BigLake con prompt in linguaggio naturale. Sfruttando Google CloudBigLake, puoi interagire con i tuoi dati in BigLake come se fossero una tabella BigQuery standard.

Come funziona l'analisi conversazionale

L'analisi conversazionale utilizza modelli linguistici di grandi dimensioni (LLM) per comprendere le tue domande in linguaggio naturale e mapparle allo schema delle tue tabelle BigLake. La procedura segue questi passaggi:

  1. Rilevamento dello schema: il sistema recupera i metadati dal metastore BigLake per comprendere le strutture delle tabelle, i nomi delle colonne e i tipi di dati.
  2. Generazione di SQL: il LLM genera una query SQL compatibile con il motore BigQuery e il formato dei dati sottostante.
  3. Esecuzione: BigQuery esegue la query SQL generata direttamente sui dati in formato aperto in BigLake.
  4. Risposta: i risultati vengono restituiti all'interfaccia conversazionale, spesso accompagnati da un riepilogo o da una visualizzazione.

Per saperne di più sull'analisi conversazionale, ad esempio su come gestire gli agenti dati, sui prezzi o sulle best practice, consulta la panoramica dell'analisi conversazionale.

Formati supportati

L'analisi conversazionale traduce le domande in linguaggio naturale in query SQL. Supporta i formati di tabelle aperte supportati dal metastore BigLake, come le tabelle Apache Iceberg.

Prima di iniziare

Prima di poter eseguire query sui dati, registra le tabelle esterne nel metastore BigLake. Il metastore BigLake funge da hub unificato che collega BigQuery Studio ai tuoi dati esterni in formato aperto. Una volta connesse, le tabelle diventano asset rilevabili in BigQuery.

Eseguire query sulle tabelle con l'analisi conversazionale

  1. Nella console Google Cloud , vai all'hub degli agenti BigQuery Studio.

    Vai all'hub degli agenti

  2. Crea un agente dati o avvia una conversazione diretta con un agente dati esistente.

  3. Seleziona le tabelle BigLake.

    Poiché il metastore BigLake unifica tutti questi formati diversi, l'esperienza di rilevamento è identica a quella per trovare tabelle BigQuery standard.

    1. Ricerca: quando aggiungi l'origine della conoscenza, cerca i nomi delle tabelle nell'interfaccia di ricerca e selezione delle tabelle. Puoi utilizzare le parole chiave di ricerca per filtrare i risultati, tra cui:

      • TABLE_NAME
      • catalog: CATALOG_NAME
      • project: PROJECT_ID
      • namespace: NAMESPACE_NAME
    2. Verifica l'origine: presta attenzione alla parte del set di dati del nome completo. Le tabelle BigLake create da origini esterne e gestite da BigLake Metastore in genere seguono un formato che combina il catalogo e lo spazio dei nomi. Ad esempio: PROJECT_ID.biglake_catalog.finance_namespace.my_iceberg_table o PROJECT_ID.sap_catalog.sales.delta_table.

    3. Seleziona: aggiungi la tabella BigLake selezionata al contesto conversazionale attivo.

  4. Porre domande in linguaggio naturale. Il sistema traduce automaticamente il tuo prompt in una query SQL federata.

Migliorare l'accuratezza delle query

Per aiutare Conversational Analytics a comprendere meglio gli schemi e la terminologia di BigLake, utilizza le opzioni di configurazione di Data Agent. Queste opzioni includono glossari aziendali, query SQL verificate e istruzioni di sistema.

Passaggi successivi