Eseguire query sulle tabelle Lakehouse con il linguaggio naturale

L'analisi conversazionale in BigQuery ti consente di eseguire query sui tuoi dati in formato aperto utilizzando prompt in linguaggio naturale. Questa funzionalità si basa sul catalogo runtime Lakehouse all'interno di Lakehouse per Apache Iceberg per mappare automaticamente le domande agli schemi delle tabelle sottostanti, in modo da poter generare ed eseguire query SQL senza scrivere il codice manualmente.

Quando configuri le query, puoi utilizzare gli agenti di dati per fornire glossari aziendali e istruzioni di sistema per una maggiore precisione.

Come funziona l'analisi conversazionale

L'analisi conversazionale utilizza modelli linguistici di grandi dimensioni (LLM) per comprendere le tue domande in linguaggio naturale e mapparle allo schema delle tue tabelle. La procedura segue questi passaggi:

  1. Rilevamento dello schema: il sistema recupera i metadati dal catalogo di runtime di Lakehouse per comprendere le strutture delle tabelle, i nomi delle colonne e i tipi di dati.
  2. Generazione di SQL: il LLM genera una query SQL compatibile con il motore BigQuery e il formato dei dati sottostante.
  3. Esecuzione: BigQuery esegue la query SQL generata direttamente sui dati in formato aperto in Lakehouse di Google Cloud.
  4. Risposta: i risultati vengono restituiti all'interfaccia conversazionale, spesso accompagnati da un riepilogo o da una visualizzazione.

Per saperne di più sull'analisi conversazionale, ad esempio sulla gestione degli agenti di dati, sui prezzi o sulle best practice, consulta la panoramica dell'analisi conversazionale.

Formati supportati

L'analisi conversazionale traduce le domande in linguaggio naturale in query SQL. Supporta i formati di tabelle aperte supportati dal catalogo runtime Lakehouse, come le tabelle Apache Iceberg.

Prima di iniziare

Prima di poter eseguire query sui dati, registra le tabelle esterne nel catalogo runtime Lakehouse. Il catalogo del runtime Lakehouse funge da hub unificato che collega BigQuery Studio ai tuoi dati esterni in formato aperto. Una volta connesse, le tabelle diventano asset rilevabili in BigQuery.

Eseguire query sulle tabelle con l'analisi conversazionale

  1. Nella console Google Cloud , vai all'hub degli agenti BigQuery Studio.

    Vai all'hub degli agenti

  2. Crea un agente dati o avvia una conversazione diretta con un agente dati esistente.

  3. Seleziona le tabelle.

    Poiché il catalogo del runtime Lakehouse unifica tutti questi diversi formati, l'esperienza di rilevamento è identica a quella per trovare tabelle BigQuery standard.

    1. Ricerca: quando aggiungi l'origine della conoscenza, cerca i nomi delle tabelle nell'interfaccia di ricerca e selezione delle tabelle. Puoi utilizzare le parole chiave di ricerca per filtrare i risultati, tra cui:

      • TABLE_NAME
      • catalog: CATALOG_NAME
      • project: PROJECT_ID
      • namespace: NAMESPACE_NAME
    2. Verifica l'origine: presta attenzione alla parte del nome completo che riguarda il set di dati. Le tabelle create da origini esterne e gestite dal catalogo del runtime Lakehouse in genere seguono un formato che combina il catalogo e lo spazio dei nomi. Ad esempio: PROJECT_ID.biglake_catalog.finance_namespace.my_iceberg_table o PROJECT_ID.sap_catalog.sales.delta_table.

    3. Seleziona: aggiungi la tabella selezionata al contesto conversazionale attivo.

  4. Porre domande in linguaggio naturale. Il sistema traduce automaticamente il tuo prompt in una query SQL federata.

Migliorare l'accuratezza delle query

Per aiutare l'analisi conversazionale a comprendere meglio gli schemi e la terminologia, utilizza le opzioni di configurazione dell'agente dati. Queste opzioni includono glossari aziendali, query SQL verificate e istruzioni di sistema.

Passaggi successivi