Introducción a la IA en BigQuery

BigQuery ofrece varias capacidades de IA que te permiten hacer lo siguiente:

  • Realizar aprendizaje automático (AA) predictivo
  • Ejecutar inferencias en modelos de lenguaje grandes (LLM) como Gemini
  • Crear aplicaciones con embeddings y búsqueda de vectores
  • Usar agentes integrados para ayudar con la codificación
  • Crear canalizaciones de datos
  • Acceder a la funcionalidad de BigQuery con herramientas de agentes

Aprendizaje automático

Con BigQuery ML, puedes entrenar, evaluar y ejecutar inferencias en modelos para tareas como la previsión de series temporales, la detección de anomalías, la clasificación, la regresión, el agrupamiento, la reducción de dimensionalidad y las recomendaciones.

Puedes trabajar con las capacidades de BigQuery ML a través de la Google Cloud consola, la herramienta de línea de comandos de bq, la API de REST o en notebooks de Colab Enterprise. Debido a que BigQuery ML permite que los profesionales de SQL usen las herramientas y habilidades de SQL existentes para compilar y evaluar modelos, democratiza el AA y acelera el desarrollo de modelos, ya que lleva el AA a los datos en lugar de requerir el movimiento de datos. Puedes usar BigQuery ML para ayudarte con los siguientes tipos de tareas de AA:

Para obtener más información, consulta Introducción a ML en BigQuery.

Funciones de IA

BigQuery ofrece varias funciones de SQL que puedes usar para tareas de IA, como la generación de texto, el análisis de texto o datos no estructurados y la traducción. Estas funciones acceden a los modelos de LLM de Gemini y de socios disponibles en la plataforma de agentes de Gemini Enterprise, las APIs de IA de Cloud o los modelos integrados de BigQuery para realizar estas tareas.

Existen varias categorías de funciones de IA:

Para obtener más información, consulta Descripción general de las soluciones específicas de la tarea.

BigQuery ofrece una variedad de funciones y características de búsqueda para ayudarte a encontrar datos específicos de manera eficiente o descubrir similitudes entre los datos, incluidos los datos multimodales.

  • Búsqueda de texto. Puedes usar la SEARCH función para realizar búsquedas tokenizadas en texto no estructurado o datos JSON semiestructurados. Puedes mejorar el rendimiento de la búsqueda si creas un índice de búsqueda, que permite que BigQuery optimice las consultas que usan la función SEARCH, así como otras funciones y operadores. Para obtener más información, consulta Busca datos indexados.

  • Generación de embeddings. Los embeddings son vectores numéricos de alta dimensión que representan entidades como texto o imágenes y, a menudo, se generan con modelos de AA. Puedes generar embeddings multimodales con los modelos que proporciona o aloja Agent Platform, o bien con los modelos importados y ejecutados en BigQuery.

    También puedes hacer que BigQuery mantenga automáticamente una columna de embeddings si habilitas la generación autónoma de embeddings (versión preliminar).

  • Búsqueda de vectores. Puedes usar la VECTOR_SEARCH función para buscar embeddings y encontrar elementos semánticamente similares. Puedes usar la AI.SEARCH función (versión preliminar) para buscar en tablas que tengan habilitada la generación autónoma de embeddings. Puedes mejorar el rendimiento de la búsqueda de vectores si creas un índice vectorial, que usa técnicas de búsqueda de vecinos más cercanos aproximados para proporcionar resultados más rápidos y aproximados.

    Los casos de uso comunes para la búsqueda de vectores incluyen la búsqueda semántica, la recomendación y la Generación mejorada por recuperación (RAG). Para obtener más información, consulta Introducción a la búsqueda de vectores.

Funciones de IA asistenciales

Las funciones de asistencia potenciadas por IA en BigQuery, denominadas en conjunto como Gemini en BigQuery, te ayudan a descubrir, preparar, consultar y visualizar tus datos.

  • Estadísticas de datos. Genera preguntas en lenguaje natural sobre tus datos, junto con las consultas de SQL para responderlas.
  • Preparación de datos. Genera recomendaciones contextuales para limpiar, transformar y enriquecer tus datos.
  • Asistencia para código SQL. Genera, completa y explica consultas en SQL.
  • Asistencia para código de Python. Genera, completa y explica el código de Python, incluidos PySpark y BigQuery DataFrames.
  • Lienzo de datos. Consulta tus datos con lenguaje natural, visualiza los resultados con gráficos y haz preguntas de seguimiento.
  • Traductor de SQL. Crea reglas de traducción de SQL mejoradas con Gemini para ayudarte a migrar consultas escritas en un dialecto diferente a GoogleSQL.

Agentes

Los agentes son herramientas de software que pueden usar IA para completar tareas en tu nombre. Puedes usar agentes integrados o crear tus propios agentes para ayudarte a procesar, administrar, analizar y visualizar tus datos:

  • Usa el Agente de ciencia de datos para automatizar el análisis exploratorio de datos, el procesamiento de datos, las tareas de AA y las estadísticas de visualización en un notebook de Colab Enterprise.

  • Usa el Agente de ingeniería de datos para compilar, modificar y administrar canalizaciones de datos para cargar y procesar datos en BigQuery. Puedes usar instrucciones en lenguaje natural para generar canalizaciones de datos desde varias fuentes de datos o adaptar las canalizaciones de datos existentes para satisfacer tus necesidades de ingeniería de datos.

  • Usa el Agente de Conversational Analytics para chatear con tus datos con lenguaje conversacional. Este agente consta de una o más fuentes de datos y un conjunto de instrucciones específicas del caso de uso para procesar esos datos. El análisis de conversaciones admite el uso de algunas funciones de BigQuery ML.

  • Usa el Gemini CLI para interactuar con los datos de BigQuery en tu terminal con instrucciones en lenguaje natural.

  • Compila con el kit de herramientas de MCP de código abierto o las herramientas del ADK para un desarrollo de agentes rápido e iterativo.

¿Qué sigue?