Interroger des données BigLake en langage naturel

Ce guide vous explique comment utiliser Conversational Analytics dans BigQuery pour interroger les données de vos tables BigLake à l'aide de requêtes en langage naturel. En exploitantGoogle CloudBigLake, vous pouvez interagir avec vos propres données dans BigLake comme s'il s'agissait d'une table BigQuery standard.

Fonctionnement de l'analyse conversationnelle

L'analyse conversationnelle utilise de grands modèles de langage (LLM) pour comprendre vos questions en langage naturel et les mapper au schéma de vos tables BigLake. Le processus se déroule comme suit :

  1. Découverte du schéma : le système récupère les métadonnées du metastore BigLake pour comprendre les structures de table, les noms de colonnes et les types de données.
  2. Génération de requêtes SQL : le LLM génère une requête SQL compatible avec le moteur BigQuery et le format de données sous-jacent.
  3. Exécution : BigQuery exécute la requête SQL générée directement sur les données au format ouvert dans BigLake.
  4. Réponse : les résultats sont renvoyés à l'interface conversationnelle, souvent accompagnés d'un résumé ou d'une visualisation.

Pour en savoir plus sur l'analyse conversationnelle, comme la gestion des agents de données, les tarifs ou les bonnes pratiques, consultez Présentation de l'analyse conversationnelle.

Formats compatibles

L'analyse conversationnelle traduit vos questions en langage naturel en requêtes SQL. Il est compatible avec les formats de table ouverts pris en charge par le metastore BigLake, comme les tables Apache Iceberg.

Avant de commencer

Avant de pouvoir interroger vos données, enregistrez vos tables externes dans le métastore BigLake. Le metastore BigLake sert de plate-forme unifiée qui connecte BigQuery Studio à vos données externes au format ouvert. Une fois connectées, les tables deviennent des éléments détectables dans BigQuery.

Interroger des tables avec Conversational Analytics

  1. Dans la console Google Cloud , accédez au hub d'agents BigQuery Studio.

    Accéder au hub d'agents

  2. Créez un agent de données ou démarrez une conversation directe avec un agent de données existant.

  3. Sélectionnez vos tables BigLake.

    Étant donné que le metastore BigLake unifie tous ces formats différents, l'expérience de découverte est identique à celle des tables BigQuery standards.

    1. Rechercher : lorsque vous ajoutez votre source de connaissances, recherchez les noms de vos tables dans l'interface de recherche et de sélection des tables. Vous pouvez utiliser des mots clés de recherche pour filtrer les résultats, y compris :

      • TABLE_NAME
      • catalog: CATALOG_NAME
      • project: PROJECT_ID
      • namespace: NAMESPACE_NAME
    2. Vérifiez la source : faites attention à la partie "ensemble de données" du nom complet. Les tables BigLake créées par des sources externes et gérées par le metastore BigLake suivent généralement un format combinant le catalogue et l'espace de noms. Par exemple, PROJECT_ID.biglake_catalog.finance_namespace.my_iceberg_table ou PROJECT_ID.sap_catalog.sales.delta_table.

    3. Sélectionner : ajoutez la table BigLake sélectionnée à votre contexte conversationnel actif.

  4. poser des questions en langage naturel ; Le système traduit automatiquement votre requête en requête SQL fédérée.

Améliorer la précision des requêtes

Pour aider l'analyse conversationnelle à mieux comprendre vos schémas et votre terminologie BigLake, utilisez les options de configuration de l'agent de données. Ces options incluent des glossaires d'entreprise, des requêtes SQL validées et des instructions système.

Étapes suivantes