Analiza datos con la CLI de Gemini

En esta página, se explica cómo interactuar con los datos de BigQuery en tu terminal mediante instrucciones de lenguaje natural con la CLI de Gemini. El uso de las extensiones dedicadas de BigQuery con la CLI de Gemini permite el análisis de datos y las estadísticas impulsados por IA directamente en tu línea de comandos. Puedes analizar datos de tus tablas de BigQuery o de tablas en los conjuntos de datos públicos de BigQuery.

Estas extensiones propias proporcionan algunas herramientas comunes para el análisis de datos y las estadísticas. Para compilar tus propias herramientas, consulta Usa BigQuery con MCP, Gemini CLI y otros agentes.

Acerca de la CLI de Gemini y las extensiones

La CLI de Gemini es un agente de IA conversacional de código abierto de Google que acelera los flujos de trabajo de desarrollo y ayuda con la codificación, la depuración, la exploración de datos y la creación de contenido. Ofrece una experiencia basada en agentes para interactuar con los servicios de Data Cloud, como BigQuery, y otras bases de datos Google Cloud populares y de código abierto.

Para obtener más información sobre la CLI de Gemini, consulta la documentación sobre la CLI de Gemini.

Cómo funcionan las extensiones

Las extensiones amplían las capacidades de la CLI de Gemini, lo que le permite conectarse a servicios específicos y otras herramientas, y controlarlos. Google Cloud Las extensiones proporcionan a Gemini contexto y comprensión de la API, lo que permite la interacción conversacional. Puedes cargar las extensiones desde URLs de GitHub, directorios locales o registros. Estas extensiones ofrecen herramientas, comandos de barra y mensajes. Estos son independientes de las extensiones del IDE, como Gemini Code Assist, que se integran con la caja de herramientas del MCP.

Acerca de las extensiones de BigQuery

BigQuery ofrece las siguientes extensiones para trabajar con datos de BigQuery a través de la CLI de Gemini:

Extensión de BigQuery Data Analytics
Usa esta extensión para descubrir datos, obtener más información sobre las tablas y los conjuntos de datos de BigQuery, y hacer preguntas en lenguaje natural sobre tus conjuntos de datos. También puedes generar previsiones o ejecutar un análisis de contribuciones con herramientas avanzadas integradas. Las herramientas de esta extensión ayudan a la CLI de Gemini a escribir consultas en SQL en función de tus preguntas en lenguaje natural y, luego, ejecutar las consultas para proporcionar respuestas a tus preguntas.
Extensión de BigQuery Conversational Analytics
Usa esta extensión para obtener estadísticas avanzadas de tus datos de BigQuery con un agente de estadísticas del servidor alojado previamente. Las herramientas de esta extensión ayudan a la CLI de Gemini a enviar tu pregunta en lenguaje natural a un agente integrado y alojado, y a responder con estadísticas más detalladas de tus datos.

Herramientas de BigQuery Data Analytics

La extensión de BigQuery Data Analytics proporciona las siguientes herramientas:

Categoría Herramienta Ejemplo de instrucción en lenguaje natural
Información del conjunto de datos y la tabla get_dataset_info Obtén información sobre el conjunto de datos bigquery-public-data.pypi
get_table_info Obtén información sobre la tabla bigquery-public-data.pypi.file_downloads
list_dataset_ids Enumera todos los conjuntos de datos de AA en el proyecto bigquery-public-data
list_table_ids Enumera todas las tablas del conjunto de datos bigquery-public-data.pypi
Buscar search_catalog Busca tablas relacionadas con las descargas de PyPi
Ejecución de SQL execute_sql Con bigquery-public-data.pypi.file_downloads, muéstrame los 10 paquetes de pypi más descargados este mes
Previsión de series temporales forecast Con bigquery-public-data.pypi.file_downloads, pronostica las descargas para los últimos cuatro meses de 2025 para el paquete urllib3
Análisis de contribuciones analyze_contribution Analiza la contribución del país a los ingresos en la tabla bigquery-public-data.google_analytics_sample.ga_sessions_20170801

Herramientas de Conversational Analytics

La extensión de Conversational Analytics proporciona las siguientes herramientas:

Categoría Herramienta Ejemplo de instrucción en lenguaje natural
Buscar search_catalog Busca tablas relacionadas con las descargas de PyPi
Conversational Analytics ask_data_insights Con la herramienta ask_data_insights y las tablas en bigquery-public-data.google_analytics_sample, dime en qué canales debo enfocarme y por qué

Antes de comenzar

Antes de comenzar, necesitas lo siguiente:

  • Acceso a al menos un Google Cloud proyecto.
  • Para la extensión de Data Analytics, habilita las siguientes APIs:

    • BigQuery
    • Para usar la herramienta search_catalog: Knowledge Catalog
  • Para la extensión de Conversational Analytics, habilita las siguientes APIs:

    • BigQuery
    • Knowledge Catalog
    • Para usar la herramienta ask_data_insights: API de Gemini for Google Cloud, Gemini y API de Data Analytics con Gemini

Roles obligatorios

Para obtener los permisos que necesitas para usar las extensiones de BigQuery con la CLI de Gemini, pídele a tu administrador que te otorgue los siguientes roles de IAM en los recursos de Resource Manager (proyectos, carpetas y organizaciones) o en recursos de nivel inferior, como conjuntos de datos:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

También puedes obtener los permisos necesarios a través de roles personalizados o cualquier otro rol predefinido.

Instala las extensiones de BigQuery

Instala las extensiones de BigQuery y, luego, úsalas para explorar y analizar tus datos.

  1. Instala la CLI de Gemini.

  2. Configura las variables de entorno para conectarte a tu proyecto de BigQuery:

    export BIGQUERY_PROJECT="PROJECT_ID"
    

    Reemplaza PROJECT_ID por el ID de tu Google Cloud proyecto.

    También puedes configurar estas variables de entorno opcionales:

    • BIGQUERY_LOCATION: La ubicación del conjunto de datos, por ejemplo: export BIGQUERY_LOCATION="us"
    • BIGQUERY_USE_CLIENT_OAUTH: Indica si se debe usar OAuth del cliente, por ejemplo: export BIGQUERY_USE_CLIENT_OAUTH=true
  3. Instala la extensión de BigQuery Data Analytics o Conversational Analytics con el comando gemini extension install:

    • Opcional: Instala la extensión de BigQuery Data Analytics:

      gemini extensions install https://github.com/gemini-cli-extensions/bigquery-data-analytics
      
    • Opcional: Instala la extensión de BigQuery Conversational Analytics:

      gemini extensions install https://github.com/gemini-cli-extensions/bigquery-conversational-analytics
      
  4. Inicia la CLI de Gemini en modo interactivo para explorar y analizar tus datos:

    gemini
    

    La CLI carga automáticamente la extensión de BigQuery y sus herramientas, que puedes usar para interactuar con tus datos.

Ejemplos de instrucciones para explorar y analizar tus datos

Ingresa instrucciones en la Gemini CLI. Puedes usar los siguientes ejemplos para comenzar.

Explora y analiza tablas

Las siguientes instrucciones de ejemplo te permiten explorar y analizar tus tablas.

  • Instrucción de ejemplo para buscar tablas relacionadas con las descargas de PyPi:

    Find tables related to PyPi downloads
    

    Respuesta de ejemplo

    La CLI de Gemini muestra una lista de tablas relacionadas:

    ✦ I found the following tables related to PyPi downloads:
    
        *   file_downloads: projects/bigquery-public-data/datasets/pypi/tables/file_downloads
        *   distribution_metadata: projects/bigquery-public-data/datasets/pypi/tables/distribution_metadata
    
  • Instrucción de ejemplo para mostrar los diez paquetes de PyPI más descargados este mes:

    Using bigquery-public-data.pypi.file_downloads, show me the top 10
    downloaded pypi packages this month
    

    Respuesta de ejemplo

    La CLI de Gemini muestra los 10 paquetes principales:

    ✦ Here are the top 10 most downloaded PyPI packages this month:
    
        1.  boto3: 685,007,866 downloads
        2.  botocore: 531,034,851 downloads
        3.  urllib3: 512,611,825 downloads
        4.  requests: 464,595,806 downloads
        5.  typing-extensions: 459,505,780 downloads
        6.  certifi: 451,929,759 downloads
        7.  charset-normalizer: 428,716,731 downloads
        8.  idna: 409,262,986 downloads
        9.  grpcio-status: 402,535,938 downloads
        10. aiobotocore: 399,650,559 downloads
    

Ejecuta estadísticas más detalladas con la herramienta ask_data_insights

La herramienta ask_data_insights activa un agente en la API de BigQuery Conversational Analytics para responder tus preguntas. El agente del servidor recopila contexto adicional sobre tus datos y ofrece más estadísticas.

  • Instrucción de ejemplo para obtener estadísticas sobre los canales en los que debes enfocarte:

    Using ask_data_insights and using the tables under
    bigquery-public-data.google_analytics_sample, tell me the channels I should
    focus on and why
    

    Respuesta de ejemplo

    La CLI de Gemini muestra recomendaciones basadas en el análisis:

    Based on the analysis of the Google Analytics sample data, here are the
    channels you should focus on and why:
    
    |     Channel      | Total Visits | Total Pageviews | Total Transactions | Total Revenue |
    | ---------------- | ------------ | --------------- | ------------------ | ------------- |
    | Referral         |      104,838 |         707,597 |              5,543 |   $651,429.91 |
    | Direct           |      143,026 |         584,840 |              2,219 |   $434,840.55 |
    | Organic Search   |      381,561 |       1,569,218 |              3,581 |   $326,380.51 |
    | Display          |        6,262 |          34,202 |                152 |    $78,337.46 |
    | Paid Search      |       25,326 |         136,060 |                479 |    $43,558.90 |
    | Social           |      226,117 |         398,690 |                131 |     $4,916.54 |
    | Affiliates       |       16,403 |          47,417 |                  9 |       $597.38 |
    | (Other)          |          120 |             442 |                  1 |         $9.99 |
    
      Recommendations:
    
        1.  Prioritize referral traffic:
            *   Why: This is a highly valuable channel. It brings in the most
                revenue and has a high number of transactions, despite not
                having the highest number of visits. This indicates that
                traffic from referrals is highly qualified and converts
                well.
            *   Action: Identify your top referring websites and build
                stronger relationships with them. Look for similar websites
                to partner with.
    
        2.  Nurture your direct traffic:
            *   Why: Direct traffic is your second-highest revenue source.
                These are likely returning customers or people who know your
                brand well.
    

Precios

No hay costo adicional por usar herramientas de metadatos (como get_dataset_info, get_table_info, list_dataset_ids y list_table_ids) ni la herramienta search_catalog.

Las herramientas que ejecutan consultas, incluidas execute_sql, forecast, y analyze_contribution, se facturan según los precios de BigQuery según demanda o los precios de capacidad de BigQuery, según la configuración de tu proyecto.

Durante la versión beta (anterior a la v1.0), la herramienta ask_data_insights se ofrece sin costo adicional; sin embargo, cualquier consulta de BigQuery que active esta herramienta se factura según los precios estándar de BigQuery.

¿Qué sigue?