Eseguire query sulle tabelle Lakehouse con il linguaggio naturale

L'analisi conversazionale in BigQuery ti consente di eseguire query sui tuoi dati in formato aperto utilizzando prompt in linguaggio naturale. Questa funzionalità si basa sul catalogo runtime Lakehouse all'interno di Lakehouse for Apache Iceberg per mappare automaticamente le domande agli schemi delle tabelle sottostanti, in modo da poter generare ed eseguire query SQL senza scrivere manualmente il codice.

Quando configuri le query, puoi utilizzare gli agenti di dati per fornire glossari aziendali e istruzioni di sistema per una maggiore accuratezza.

Come funziona l'analisi conversazionale

L'analisi conversazionale utilizza modelli linguistici di grandi dimensioni (LLM) per comprendere le domande in linguaggio naturale e mapparle allo schema delle tabelle. La procedura prevede i seguenti passaggi:

  1. Rilevamento dello schema: il sistema recupera i metadati dal catalogo runtime Lakehouse per comprendere le strutture delle tabelle, i nomi delle colonne e i tipi di dati.
  2. Generazione SQL: l'LLM genera una query SQL compatibile con il motore BigQuery e il formato dei dati sottostante.
  3. Esecuzione: BigQuery esegue la query SQL generata direttamente sui dati in formato aperto in Lakehouse di Google Cloud.
  4. Risposta: i risultati vengono restituiti all'interfaccia conversazionale, spesso accompagnati da un riepilogo o da una visualizzazione.

Per ulteriori informazioni sull'analisi conversazionale, ad esempio sulla gestione degli agenti di dati , sui prezzi o sulle best practice, consulta la panoramica dell'analisi conversazionale.

Formati supportati

L'analisi conversazionale traduce le domande in linguaggio naturale in query SQL. Supporta i formati di tabelle aperte supportati dal runtime Lakehouse catalogo, come le tabelle Apache Iceberg.

Prima di iniziare

Prima di poter eseguire query sui dati, registra le tabelle esterne nel catalogo runtime Lakehouse. Il catalogo runtime Lakehouse funge da hub unificato che collega BigQuery Studio ai dati esterni in formato aperto. Una volta connesse, le tabelle diventano asset rilevabili in BigQuery.

Eseguire query sulle tabelle con l'analisi conversazionale

  1. Nella Google Cloud console, vai all'hub degli agenti di BigQuery Studio.

    Vai all'hub degli agenti

  2. Crea un agente di dati o avvia una conversazione diretta con un agente di dati esistente.

  3. Seleziona le tabelle.

    Poiché il catalogo runtime Lakehouse unifica tutti questi formati diversi, l'esperienza di rilevamento è identica alla ricerca delle tabelle BigQuery standard.

    1. Cerca: quando aggiungi l'origine di conoscenza, cerca i nomi delle tabelle nell'interfaccia di ricerca e selezione delle tabelle. Puoi utilizzare le parole chiave di ricerca per filtrare i risultati, tra cui:

      • TABLE_NAME
      • catalog: CATALOG_NAME
      • project: PROJECT_ID
      • namespace: NAMESPACE_NAME
    2. Verifica l'origine: presta attenzione alla parte del set di dati del nome completo. In genere, le tabelle create da origini esterne e gestite dal catalogo runtime Lakehouse seguono un formato che combina il catalogo e lo spazio dei nomi. Ad esempio: PROJECT_ID.biglake_catalog.finance_namespace.my_iceberg_table o PROJECT_ID.sap_catalog.sales.delta_table.

    3. Seleziona: aggiungi la tabella selezionata al contesto conversazionale attivo.

  4. Poni domande in linguaggio naturale. Il sistema traduce automaticamente il prompt in una query SQL federata.

Migliorare l'accuratezza delle query

Per aiutare l'analisi conversazionale a comprendere meglio gli schemi e la terminologia, utilizza le opzioni di configurazione dell'agente di dati. Queste opzioni includono glossari aziendali, query SQL verificate e istruzioni di sistema.

Passaggi successivi