Introducción a la IA en BigQuery

.

BigQuery ofrece varias funciones de IA que te permiten hacer lo siguiente:

  • Realizar aprendizaje automático (ML) predictivo.
  • Ejecuta inferencias en modelos de lenguaje extensos (LLMs) como Gemini.
  • Crea aplicaciones con incrustaciones y búsqueda de vectores.
  • Usa agentes integrados para obtener ayuda con la programación.
  • Crea flujos de procesamiento de datos.
  • Acceder a las funciones de BigQuery con herramientas de agente.

Aprendizaje automático

Con BigQuery ML, puedes entrenar, evaluar y ejecutar inferencias en modelos para tareas como la previsión de series temporales, la detección de anomalías, la clasificación, la regresión, la agrupación en clústeres, la reducción de la dimensionalidad y las recomendaciones.

Puedes usar las funciones de BigQuery ML a través de laGoogle Cloud consola, la herramienta de línea de comandos bq, la API REST o en cuadernos de Colab Enterprise. Como BigQuery ML permite que los profesionales de SQL utilicen las herramientas y las habilidades de SQL que ya tienen para crear y evaluar modelos, democratiza el aprendizaje automático y acelera el desarrollo de modelos, ya que aplica el aprendizaje automático a los datos en lugar de requerir que se muevan los datos. Puedes usar BigQuery ML para ayudarte con los siguientes tipos de tareas de aprendizaje automático:

Para obtener más información, consulta la introducción al aprendizaje automático en BigQuery.

Funciones de IA

BigQuery ofrece varias funciones de SQL que puedes usar para tareas de IA, como la generación de texto, el análisis de texto o de datos sin estructurar y la traducción. Estas funciones acceden a los modelos de LLM de Gemini y de partners disponibles en Vertex AI, las APIs de Cloud AI o los modelos integrados de BigQuery para realizar estas tareas.

Hay varias categorías de funciones de IA:

Para obtener más información, consulta la descripción general de las soluciones específicas para tareas.

BigQuery ofrece una gran variedad de funciones y características de búsqueda para ayudarte a encontrar datos específicos de forma eficiente o descubrir similitudes entre datos, incluidos los multimodales.

  • Búsqueda de texto. Puedes usar la función SEARCH para realizar búsquedas tokenizadas en texto sin estructurar o en datos JSON semiestructurados. Para mejorar el rendimiento de las búsquedas, puede crear un índice de búsqueda, que permite a BigQuery optimizar las consultas que usan la función SEARCH, así como otras funciones y operadores. Para obtener más información, consulta Buscar datos indexados.

  • Generación de inserciones. Las incrustaciones son vectores numéricos de alta dimensión que representan entidades como texto o imágenes y que suelen generar modelos de aprendizaje automático. Puedes generar incrustaciones multimodales con modelos proporcionados o alojados en Vertex AI, o bien con modelos importados y ejecutados en BigQuery.

    También puedes hacer que BigQuery mantenga automáticamente una columna de inserciones habilitando la generación autónoma de inserciones (vista previa).

  • Búsqueda vectorial. Puedes usar la función VECTOR_SEARCH para buscar las inserciones y encontrar elementos semánticamente similares. Puedes usar la función AI.SEARCH (Vista previa) para buscar en tablas que tengan habilitada la generación autónoma de embeddings. Puedes mejorar el rendimiento de la búsqueda vectorial creando un índice vectorial, que utiliza técnicas de búsqueda de vecinos más cercanos aproximados para ofrecer resultados más rápidos y aproximados.

    Entre los casos prácticos habituales de la búsqueda de vectores se incluyen la búsqueda semántica, las recomendaciones y la generación aumentada de recuperación (RAG). Para obtener más información, consulta la introducción a la búsqueda vectorial.

Funciones de IA asistenciales

Las funciones de asistencia basadas en IA de BigQuery, denominadas en conjunto Gemini en BigQuery, te ayudan a descubrir, preparar, consultar y visualizar tus datos.

  • Estadísticas de datos. Genera preguntas en lenguaje natural sobre tus datos, junto con las consultas de SQL para responderlas.
  • Preparación de datos. Genera recomendaciones contextuales para limpiar, transformar y enriquecer tus datos.
  • Asistencia con el código SQL. Generar, completar y explicar consultas de SQL.
  • Asistencia de código de Python. Generar, completar y explicar código de Python, incluidos PySpark y BigQuery DataFrames.
  • Lienzo de datos. Consulta tus datos con lenguaje natural, visualiza los resultados con gráficos y haz preguntas complementarias.
  • Traductor de SQL. Crea reglas de traducción de SQL mejoradas con Gemini para ayudarte a migrar consultas escritas en otro dialecto a GoogleSQL.

Agentes

Los agentes son herramientas de software que pueden usar la IA para completar tareas en tu nombre. Puedes usar agentes integrados o crear los tuyos propios para que te ayuden a procesar, gestionar, analizar y visualizar tus datos:

  • Usa Data Science Agent para automatizar el análisis exploratorio de datos, el procesamiento de datos, las tareas de aprendizaje automático y las estadísticas de visualización en un cuaderno de Colab Enterprise.

  • Usa el agente de ingeniería de datos para crear, modificar y gestionar flujos de procesamiento de datos para cargar y procesar datos en BigQuery. Puedes usar peticiones en lenguaje natural para generar canalizaciones de datos a partir de varias fuentes de datos o adaptar las canalizaciones de datos que ya tengas a tus necesidades de ingeniería de datos.

  • Usa la CLI de Gemini para interactuar con los datos de BigQuery en tu terminal mediante peticiones en lenguaje natural.

  • Usa el MCP Toolbox para conectar tu propia herramienta de IA a BigQuery e interactuar con tus datos.

Siguientes pasos