Interroger des tables Lakehouse en langage naturel

Conversational Analytics dans BigQuery vous permet d'interroger vos données au format ouvert à l'aide de requêtes en langage naturel. Cette fonctionnalité s'appuie sur le catalogue d'exécution Lakehouse dans Lakehouse pour Apache Iceberg afin de mapper automatiquement vos questions aux schémas de table sous-jacents. Vous pouvez ainsi générer et exécuter des requêtes SQL sans écrire le code manuellement.

Lorsque vous configurez vos requêtes, vous pouvez utiliser des agents de données pour fournir des glossaires d'entreprise et des instructions système afin d'améliorer la précision.

Fonctionnement de l'analyse conversationnelle

L'analyse conversationnelle utilise de grands modèles de langage (LLM) pour comprendre vos questions en langage naturel et les mapper au schéma de vos tables. Le processus se déroule comme suit :

  1. Découverte du schéma : le système récupère les métadonnées du catalogue du runtime Lakehouse pour comprendre les structures de table, les noms de colonnes et les types de données.
  2. Génération de requêtes SQL : le LLM génère une requête SQL compatible avec le moteur BigQuery et le format de données sous-jacent.
  3. Exécution : BigQuery exécute la requête SQL générée directement sur les données au format ouvert dans le *lakehouse* de Google Cloud.
  4. Réponse : les résultats sont renvoyés à l'interface conversationnelle, souvent accompagnés d'un résumé ou d'une visualisation.

Pour en savoir plus sur l'analyse conversationnelle, comme la gestion des agents de données, les tarifs ou les bonnes pratiques, consultez Présentation de l'analyse conversationnelle.

Formats compatibles

L'analyse conversationnelle traduit vos questions en langage naturel en requêtes SQL. Il est compatible avec les formats de table ouverts compatibles avec le catalogue du runtime Lakehouse, tels que les tables Apache Iceberg.

Avant de commencer

Avant de pouvoir interroger vos données, enregistrez vos tables externes dans le catalogue d'environnements d'exécution Lakehouse. Le catalogue du runtime Lakehouse sert de plate-forme unifiée qui connecte BigQuery Studio à vos données externes au format ouvert. Une fois connectées, les tables deviennent des ressources détectables dans BigQuery.

Interroger des tables avec Conversational Analytics

  1. Dans la console Google Cloud , accédez au hub d'agents BigQuery Studio.

    Accéder au hub d'agents

  2. Créez un agent de données ou démarrez une conversation directe avec un agent de données existant.

  3. Sélectionnez vos tables.

    Étant donné que le catalogue du runtime Lakehouse unifie tous ces formats, l'expérience de découverte est identique à celle des tables BigQuery standards.

    1. Rechercher : lorsque vous ajoutez votre source de connaissances, recherchez les noms de vos tables dans l'interface de recherche et de sélection des tables. Vous pouvez utiliser des mots clés de recherche pour filtrer les résultats, y compris :

      • TABLE_NAME
      • catalog: CATALOG_NAME
      • project: PROJECT_ID
      • namespace: NAMESPACE_NAME
    2. Vérifiez la source : faites attention à la partie "ensemble de données" du nom complet. Les tables créées par des sources externes et gérées par le catalogue d'exécution Lakehouse suivent généralement un format combinant le catalogue et l'espace de noms. Par exemple, PROJECT_ID.biglake_catalog.finance_namespace.my_iceberg_table ou PROJECT_ID.sap_catalog.sales.delta_table.

    3. Sélectionner : ajoutez le tableau sélectionné à votre contexte conversationnel actif.

  4. Posez des questions en langage naturel. Le système traduit automatiquement votre requête en requête SQL fédérée.

Améliorer la précision des requêtes

Pour aider l'analyse conversationnelle à mieux comprendre vos schémas et votre terminologie, utilisez les options de configuration de l'agent de données. Ces options incluent des glossaires d'entreprise, des requêtes SQL validées et des instructions système.

Étapes suivantes