Introducción a la IA en BigQuery

BigQuery ofrece varias capacidades basadas en IA que te permiten hacer lo siguiente:

  • Realizar aprendizaje automático (AA) predictivo
  • Ejecuta inferencias con modelos de lenguaje grandes (LLM) como Gemini.
  • Crea aplicaciones con embeddings y búsqueda de vectores.
  • Usar agentes integrados para ayudar con la programación
  • Crear canalizaciones de datos
  • Acceder a la funcionalidad de BigQuery con herramientas del agente

Aprendizaje automático

Con BigQuery ML, puedes entrenar, evaluar y ejecutar inferencias en modelos para tareas como la previsión de series temporales, la detección de anomalías, la clasificación, la regresión, el agrupamiento en clústeres, la reducción de dimensiones y las recomendaciones.

Puedes trabajar con las capacidades de BigQuery ML a través de la consola deGoogle Cloud , la herramienta de línea de comandos de bq, la API de REST o en los notebooks de Colab Enterprise. Dado que BigQuery ML permite que los profesionales de SQL usen las herramientas y habilidades existentes de SQL para compilar y evaluar modelos, democratiza el AA y acelera el desarrollo de modelos, ya que lleva el AA a los datos en lugar de requerir el movimiento de datos. Puedes usar BigQuery ML para ayudarte con los siguientes tipos de tareas de AA:

Para obtener más información, consulta la Introducción al aprendizaje automático en BigQuery.

Funciones de IA

BigQuery ofrece varias funciones de SQL que puedes usar para tareas de IA, como generación de texto, análisis de texto o datos no estructurados, y traducción. Estas funciones acceden a los modelos de LLM de Gemini y de socios disponibles en Vertex AI, las APIs de Cloud AI o los modelos integrados de BigQuery para realizar estas tareas.

Existen varias categorías de funciones potenciadas por IA:

Para obtener más información, consulta Descripción general de las soluciones específicas para tareas.

BigQuery ofrece una variedad de funciones y características de búsqueda para ayudarte a encontrar datos específicos de manera eficiente o descubrir similitudes entre datos, incluidos los datos multimodales.

  • Búsqueda de texto. Puedes usar la función SEARCH para realizar búsquedas con asignación de tokens en texto no estructurado o datos JSON semiestructurados. Puedes mejorar el rendimiento de la búsqueda creando un índice de búsqueda, que permite que BigQuery optimice las consultas que usan la función SEARCH, así como otras funciones y operadores. Para obtener más información, consulta Cómo buscar datos indexados.

  • Generación de embeddings. Los embeddings son vectores numéricos de alta dimensión que representan entidades, como texto o imágenes, y, a menudo, los generan modelos de AA. Puedes generar embeddings multimodales con los modelos proporcionados o alojados en Vertex AI, o bien con los modelos importados y ejecutados en BigQuery.

    También puedes hacer que BigQuery mantenga automáticamente una columna de incorporaciones habilitando la generación autónoma de incorporaciones (versión preliminar).

  • Búsqueda de vectores: Puedes usar la función VECTOR_SEARCH para buscar incorporaciones y encontrar elementos semánticamente similares. Puedes usar la función AI.SEARCH (vista previa) para realizar búsquedas en tablas que tengan habilitada la generación autónoma de incorporaciones. Puedes mejorar el rendimiento de la búsqueda de vectores creando un índice de vectores, que usa técnicas de búsqueda del vecino más cercano aproximado para proporcionar resultados más rápidos y aproximados.

    Entre los casos de uso habituales de la búsqueda de vectores, se incluyen la búsqueda semántica, la recomendación y la generación mejorada por recuperación (RAG). Para obtener más información, consulta Introducción a la búsqueda vectorial.

Funciones de IA asistivas

Las funciones de asistencia potenciadas por IA en BigQuery, denominadas en conjunto Gemini en BigQuery, te ayudan a descubrir, preparar, consultar y visualizar tus datos.

  • Estadísticas de datos. Genera preguntas en lenguaje natural sobre tus datos, junto con las consultas en SQL para responderlas.
  • Preparación de datos. Genera recomendaciones contextuales para limpiar, transformar y enriquecer tus datos.
  • Asistencia para código SQL. Generar, completar y explicar consultas en SQL
  • Asistencia de código de Python. Generar, completar y explicar código de Python, incluidos PySpark y BigQuery DataFrames
  • Lienzo de datos. Consulta tus datos con lenguaje natural, visualiza los resultados con gráficos y haz preguntas de seguimiento.
  • Traductor de SQL. Crea reglas de traducción de SQL mejoradas con Gemini para ayudarte a migrar consultas escritas en un dialecto diferente a GoogleSQL.

Agentes

Los agentes son herramientas de software que pueden usar la IA para completar tareas en tu nombre. Puedes usar agentes integrados o crear tus propios agentes para ayudarte a procesar, administrar, analizar y visualizar tus datos:

  • Usa el Agente de ciencia de datos para automatizar el análisis exploratorio de datos, el procesamiento de datos, las tareas de AA y las estadísticas de visualización en un notebook de Colab Enterprise.

  • Usa el Agente de ingeniería de datos para compilar, modificar y administrar canalizaciones de datos para cargar y procesar datos en BigQuery. Puedes usar instrucciones en lenguaje natural para generar canalizaciones de datos a partir de diversas fuentes de datos o adaptar las canalizaciones de datos existentes para que se ajusten a tus necesidades de ingeniería de datos.

  • Usa la CLI de Gemini para interactuar con los datos de BigQuery en tu terminal a través de instrucciones en lenguaje natural.

  • Usa la caja de herramientas de MCP para conectar tu propia herramienta de IA a BigQuery y, luego, interactuar con tus datos.

¿Qué sigue?