Consulta datos de BigLake con lenguaje natural

En esta guía, se muestra cómo usar Conversation Analytics en BigQuery para consultar datos en tus tablas de BigLake con instrucciones de lenguaje natural. Si aprovechasGoogle CloudBigLake, puedes interactuar con tus propios datos en BigLake como si fueran una tabla estándar de BigQuery.

Cómo funcionan las estadísticas de conversaciones

El análisis conversacional usa modelos de lenguaje grandes (LLMs) para comprender tus preguntas en lenguaje natural y asignarlas al esquema de tus tablas de BigLake. El proceso sigue estos pasos:

  1. Descubrimiento de esquemas: El sistema recupera metadatos del metastore de BigLake para comprender las estructuras de las tablas, los nombres de las columnas y los tipos de datos.
  2. Generación de SQL: El LLM genera una consulta en SQL que es compatible con el motor de BigQuery y el formato de datos subyacente.
  3. Ejecución: BigQuery ejecuta la consulta en SQL generada directamente en los datos de formato abierto en BigLake.
  4. Respuesta: Los resultados se devuelven a la interfaz de conversación, a menudo acompañados de un resumen o una visualización.

Para obtener más información sobre el análisis conversacional, como la administración de agentes de datos, los precios o las prácticas recomendadas, consulta la Descripción general del análisis conversacional.

Formatos admitidos

El análisis conversacional traduce tus preguntas en lenguaje natural a consultas de SQL. Es compatible con los formatos de tabla abiertos que admite BigLake Metastore, como las tablas de Apache Iceberg.

Antes de comenzar

Antes de consultar tus datos, registra tus tablas externas en el almacén de metadatos de BigLake. El metastore de BigLake actúa como el centro unificado que conecta BigQuery Studio con tus datos externos en formato abierto. Una vez que se conectan, las tablas se convierten en recursos detectables dentro de BigQuery.

Consultar tablas con Conversational Analytics

  1. En la consola de Google Cloud , ve a BigQuery Studio Agents Hub.

    Ir a Agents Hub

  2. Crea un agente de datos o inicia una conversación directa con un agente de datos existente.

  3. Selecciona tus tablas de BigLake.

    Dado que el metastore de BigLake unifica todos estos formatos diferentes, la experiencia de descubrimiento es idéntica a la de encontrar tablas estándar de BigQuery.

    1. Búsqueda: Cuando agregues tu fuente de conocimiento, busca los nombres de tus tablas en la interfaz de búsqueda y selección de tablas. Puedes usar palabras clave de búsqueda para filtrar los resultados, incluidas las siguientes:

      • TABLE_NAME
      • catalog: CATALOG_NAME
      • project: PROJECT_ID
      • namespace: NAMESPACE_NAME
    2. Verifica la fuente: Presta atención a la parte del conjunto de datos del nombre completamente calificado. Por lo general, las tablas de BigLake creadas por fuentes externas y administradas por el metastore de BigLake seguirán un formato que combina el catálogo y el espacio de nombres. Por ejemplo: PROJECT_ID.biglake_catalog.finance_namespace.my_iceberg_table o PROJECT_ID.sap_catalog.sales.delta_table.

    3. Seleccionar: Agrega la tabla de BigLake seleccionada a tu contexto conversacional activo.

  4. Haz preguntas en lenguaje natural. El sistema traduce automáticamente tu instrucción a una consulta en SQL federada.

Mejora la precisión de las búsquedas

Para ayudar a Conversational Analytics a comprender mejor tus esquemas y terminología de BigLake, usa las opciones de configuración del agente de datos. Estas opciones incluyen glosarios de la empresa, consultas SQL verificadas e instrucciones del sistema.

¿Qué sigue?