Interroger des tables Lakehouse en langage naturel

Ce guide vous explique comment utiliser Conversational Analytics dans BigQuery pour interroger des données dans vos tables Google Cloud Lakehouse à l'aide d'invites en langage naturel.

Fonctionnement de Conversational Analytics

Conversational Analytics utilise de grands modèles de langage (LLM) pour comprendre vos questions en langage naturel et les mapper au schéma de vos tables. Le processus se déroule comme suit :

  1. Découverte du schéma : le système récupère les métadonnées du catalogue d'exécution Lakehouse pour comprendre les structures de table, les noms de colonnes et les types de données.
  2. Génération SQL : le LLM génère une requête SQL compatible avec le moteur BigQuery et le format de données sous-jacent.
  3. Exécution : BigQuery exécute la requête SQL générée directement sur les données au format ouvert dans Google Cloud Lakehouse.
  4. Réponse : les résultats sont renvoyés à l’interface de conversation, souvent accompagnés d’un résumé ou d’une visualisation.

Pour en savoir plus sur Conversational Analytics, par exemple sur la gestion des agents de données , les tarifs ou les bonnes pratiques, consultez la présentation de Conversational Analytics.

Formats compatibles

Conversational Analytics traduit vos questions en langage naturel en requêtes SQL. Il est compatible avec les formats de table ouverts compatibles avec le catalogue d'exécution Lakehouse, tels que les tables Apache Iceberg.

Avant de commencer

Avant de pouvoir interroger vos données, enregistrez vos tables externes dans le catalogue d'exécution Lakehouse. Le catalogue d'exécution Lakehouse sert de hub unifié qui connecte BigQuery Studio à vos données externes au format ouvert. Une fois connectées, les tables deviennent des éléments détectables dans BigQuery.

Interroger des tables avec Conversational Analytics

  1. Dans la Google Cloud console, accédez au hub d'agents BigQuery Studio.

    Accéder au hub d'agents

  2. Créez un agent de données ou démarrez une conversation directe avec un agent de données existant.

  3. Sélectionnez vos tables.

    Étant donné que le catalogue d'exécution Lakehouse unifie tous ces formats différents, l'expérience de découverte est identique à celle de la recherche de tables BigQuery standards.

    1. Rechercher : lorsque vous ajoutez votre source de connaissances, recherchez les noms de vos tables dans l’interface de recherche et de sélection de tables. Vous pouvez utiliser des mots clés de recherche pour filtrer les résultats, y compris :

      • TABLE_NAME
      • catalog: CATALOG_NAME
      • project: PROJECT_ID
      • namespace: NAMESPACE_NAME
    2. Vérifier la source : faites attention à la partie de l'ensemble de données du nom complet. Les tables créées par des sources externes et gérées par le catalogue d'exécution Lakehouse suivent généralement un format combinant le catalogue et l'espace de noms. Par exemple : PROJECT_ID.biglake_catalog.finance_namespace.my_iceberg_table ou PROJECT_ID.sap_catalog.sales.delta_table.

    3. Sélectionner : ajoutez la table sélectionnée à votre contexte de conversation actif.

  4. Posez des questions en langage naturel. Le système traduit automatiquement votre invite en requête SQL fédérée.

Améliorer la précision des requêtes

Pour aider Conversational Analytics à mieux comprendre vos schémas et votre terminologie, utilisez les options de configuration de l'agent de données. Ces options incluent des glossaires métier, des requêtes SQL validées et des instructions système.

Étape suivante