Introducción a la IA en BigQuery
BigQuery ofrece varias capacidades de IA que te permiten hacer lo siguiente:
- Realizar aprendizaje automático (AA) predictivo
- Ejecutar inferencias en modelos de lenguaje grandes (LLM) como Gemini
- Crear aplicaciones con embeddings y búsqueda de vectores
- Usar agentes integrados para ayudar con la codificación
- Crear canalizaciones de datos
- Acceder a la funcionalidad de BigQuery con herramientas de agentes
Aprendizaje automático
Con BigQuery ML, puedes entrenar, evaluar y ejecutar inferencias en modelos para tareas como la previsión de series temporales, la detección de anomalías, la clasificación, la regresión, el agrupamiento, la reducción de dimensionalidad y las recomendaciones.
Puedes trabajar con las capacidades de BigQuery ML a través de la Google Cloud consola, la herramienta de línea de comandos de bq, la API de REST o en notebooks de Colab Enterprise. Debido a que BigQuery ML permite que los profesionales de SQL usen las herramientas y habilidades de SQL existentes para compilar y evaluar modelos, democratiza el AA y acelera el desarrollo de modelos, ya que lleva el AA a los datos en lugar de requerir el movimiento de datos. Puedes usar BigQuery ML para ayudarte con los siguientes tipos de tareas de AA:
- Crear y ejecutar modelos de AA con consultas de GoogleSQL
- Crear notebooks de Colab Enterprise para realizar flujos de trabajo de AA. Los notebooks te permiten usar SQL y Python de forma intercambiable, y usar cualquier biblioteca de Python de IA o AA para tu desarrollo.
- Comprender los resultados de tus modelos de AA predictivos con IA explicable.
- Usar los modelos
TimesFM,ARIMA_PLUSyARIMA_PLUS_XREGpara realizar la previsión y la detección de anomalías en datos de series temporales. - Generar estadísticas sobre los cambios en las métricas clave de tus datos multidimensionales con el análisis de contribución.
Para obtener más información, consulta Introducción a ML en BigQuery.
Funciones de IA
BigQuery ofrece varias funciones de SQL que puedes usar para tareas de IA, como la generación de texto, el análisis de texto o datos no estructurados y la traducción. Estas funciones acceden a los modelos de LLM de Gemini y de socios disponibles en la plataforma de agentes de Gemini Enterprise, las APIs de IA de Cloud o los modelos integrados de BigQuery para realizar estas tareas.
Existen varias categorías de funciones de IA:
Funciones de IA generativa. Estas funciones te ayudan a realizar tareas como la generación de contenido, el análisis, el resumen, la extracción de datos estructurados, la clasificación, la generación de embeddings y el enriquecimiento de datos. Existen dos tipos de funciones de IA generativa:
- Las funciones de IA de uso general te brindan control total y transparencia sobre la elección del modelo, la instrucción, y los parámetros que se usarán.
- Las funciones de IA administradas ofrecen una sintaxis optimizada para tareas de rutina, como el filtrado, la calificación y la clasificación. BigQuery puede elegir un modelo para que lo optimices en función del costo y la calidad.
Funciones específicas de la tarea. Estas funciones te ayudan a usar las APIs de IA de Cloud para tareas como las siguientes:
Para obtener más información, consulta Descripción general de las soluciones específicas de la tarea.
Buscar
BigQuery ofrece una variedad de funciones y características de búsqueda para ayudarte a encontrar datos específicos de manera eficiente o descubrir similitudes entre los datos, incluidos los datos multimodales.
Búsqueda de texto. Puedes usar la
SEARCHfunción para realizar búsquedas tokenizadas en texto no estructurado o datosJSONsemiestructurados. Puedes mejorar el rendimiento de la búsqueda si creas un índice de búsqueda, que permite que BigQuery optimice las consultas que usan la funciónSEARCH, así como otras funciones y operadores. Para obtener más información, consulta Busca datos indexados.Generación de embeddings. Los embeddings son vectores numéricos de alta dimensión que representan entidades como texto o imágenes y, a menudo, se generan con modelos de AA. Puedes generar embeddings multimodales con los modelos que proporciona o aloja Agent Platform, o bien con los modelos importados y ejecutados en BigQuery.
También puedes hacer que BigQuery mantenga automáticamente una columna de embeddings si habilitas la generación autónoma de embeddings (versión preliminar).
Búsqueda de vectores. Puedes usar la
VECTOR_SEARCHfunción para buscar embeddings y encontrar elementos semánticamente similares. Puedes usar laAI.SEARCHfunción (versión preliminar) para buscar en tablas que tengan habilitada la generación autónoma de embeddings. Puedes mejorar el rendimiento de la búsqueda de vectores si creas un índice vectorial, que usa técnicas de búsqueda de vecinos más cercanos aproximados para proporcionar resultados más rápidos y aproximados.Los casos de uso comunes para la búsqueda de vectores incluyen la búsqueda semántica, la recomendación y la Generación mejorada por recuperación (RAG). Para obtener más información, consulta Introducción a la búsqueda de vectores.
Funciones de IA asistenciales
Las funciones de asistencia potenciadas por IA en BigQuery, denominadas en conjunto como Gemini en BigQuery, te ayudan a descubrir, preparar, consultar y visualizar tus datos.
- Estadísticas de datos. Genera preguntas en lenguaje natural sobre tus datos, junto con las consultas de SQL para responderlas.
- Preparación de datos. Genera recomendaciones contextuales para limpiar, transformar y enriquecer tus datos.
- Asistencia para código SQL. Genera, completa y explica consultas en SQL.
- Asistencia para código de Python. Genera, completa y explica el código de Python, incluidos PySpark y BigQuery DataFrames.
- Lienzo de datos. Consulta tus datos con lenguaje natural, visualiza los resultados con gráficos y haz preguntas de seguimiento.
- Traductor de SQL. Crea reglas de traducción de SQL mejoradas con Gemini para ayudarte a migrar consultas escritas en un dialecto diferente a GoogleSQL.
Agentes
Los agentes son herramientas de software que pueden usar IA para completar tareas en tu nombre. Puedes usar agentes integrados o crear tus propios agentes para ayudarte a procesar, administrar, analizar y visualizar tus datos:
Usa el Agente de ciencia de datos para automatizar el análisis exploratorio de datos, el procesamiento de datos, las tareas de AA y las estadísticas de visualización en un notebook de Colab Enterprise.
Usa el Agente de ingeniería de datos para compilar, modificar y administrar canalizaciones de datos para cargar y procesar datos en BigQuery. Puedes usar instrucciones en lenguaje natural para generar canalizaciones de datos desde varias fuentes de datos o adaptar las canalizaciones de datos existentes para satisfacer tus necesidades de ingeniería de datos.
Usa el Agente de Conversational Analytics para chatear con tus datos con lenguaje conversacional. Este agente consta de una o más fuentes de datos y un conjunto de instrucciones específicas del caso de uso para procesar esos datos. El análisis de conversaciones admite el uso de algunas funciones de BigQuery ML.
Usa el Gemini CLI para interactuar con los datos de BigQuery en tu terminal con instrucciones en lenguaje natural.
Compila con el kit de herramientas de MCP de código abierto o las herramientas del ADK para un desarrollo de agentes rápido e iterativo.
¿Qué sigue?
- Para obtener más información sobre ML, consulta Introducción a ML en BigQuery.
- Para obtener más información sobre las funciones de IA generativa en SQL, consulta Descripción general de la IA generativa.
- Para obtener más información sobre cómo buscar tus datos, consulta Busca datos indexados y Introducción a la búsqueda de vectores.
- Para obtener más información sobre las funciones de IA asistenciales, consulta Gemini en BigQuery.
- Para obtener más información sobre el uso de agentes con BigQuery, consulta lo siguiente:
- Usa el servidor MCP de BigQuery.
- Conecta LLM a BigQuery con MCP usando IDEs como Antigravity.
- Analiza datos con Gemini CLI.