Descripción general de la IA generativa

En este documento, se describen las funciones de inteligencia artificial (IA) generativas que admite BigQuery. Estas funciones aceptan entradas en lenguaje natural y usan modelos de Vertex AI previamente entrenados y modelos integrados de BigQuery.

Descripción general

BigQuery ofrece una variedad de funciones basadas en IA para ayudarte con tareas como las siguientes:

  • Generar contenido creativo
  • Analiza, detecta opiniones y responde preguntas sobre texto o datos no estructurados, como imágenes.
  • Resume las ideas o impresiones clave que transmite el contenido.
  • Extrae datos estructurados del texto.
  • Clasifica texto o datos no estructurados en categorías definidas por el usuario.
  • Genera incorporaciones para buscar texto, imágenes y videos similares.
  • Califica las entradas para clasificarlas según su calidad, similitud o algún otro criterio.

Existen dos categorías principales de funciones basadas en IA que te ayudarán a realizar estas tareas:

  • Funciones de IA de uso general: Estas funciones te brindan control y transparencia totales sobre la elección del modelo, la instrucción y los parámetros que se usarán.

    • Realizar inferencias, por ejemplo, para responder preguntas sobre tus datos

      • AI.GENERATE es la función de inferencia más flexible, ya que te permite analizar cualquier combinación de texto y datos no estructurados, y generar datos estructurados que coincidan con tu esquema personalizado.
      • Si necesitas un resultado de un tipo específico, selecciona una de las siguientes funciones de inferencia más especializadas:

        • AI.GENERATE_BOOL
        • AI.GENERATE_DOUBLE
        • AI.GENERATE_INT
    • Generar resultados estructurados, como extraer nombres y direcciones de texto no estructurado

      • AI.GENERATE, cuando especificas un output_schema
      • AI.GENERATE_TABLE
    • Genera texto con una versión de función con valor de tabla de AI.GENERATE

      • AI.GENERATE_TEXT
    • Genera embeddings para la búsqueda semántica y el agrupamiento en clústeres

      • AI.EMBED
      • AI.GENERATE_EMBEDDING
      • AI.SIMILARITY
  • Funciones de IA administradas: Estas funciones tienen una sintaxis optimizada y están optimizadas para el costo y la calidad. BigQuery elige un modelo por ti.

    • Cómo filtrar tus datos con condiciones de lenguaje natural

      • AI.IF
    • Califica la entrada, por ejemplo, según la calidad o el sentimiento.

      • AI.SCORE
    • Clasifica la entrada en categorías definidas por el usuario

      • AI.CLASSIFY

Funciones de IA de uso general

Las funciones de IA de uso general te brindan control y transparencia totales sobre la elección del modelo, la instrucción y los parámetros que se usarán. Su resultado incluye información detallada sobre la llamada al modelo, como el estado y la respuesta completa del modelo, que puede incluir información sobre la calificación de seguridad o las citas.

Genera datos estructurados

La generación de datos estructurados es muy similar a la generación de texto, excepto que puedes especificar un esquema SQL para dar formato a la respuesta del modelo. Por ejemplo, puedes generar una tabla que contenga el nombre, el número de teléfono, la dirección, la solicitud y la cotización de precios de un cliente a partir de la transcripción de una llamada telefónica.

Existen dos formas de generar datos estructurados:

Genera valores de un tipo específico por fila

Puedes usar funciones de IA generativa escalar con modelos de Gemini para analizar datos en tablas estándar de BigQuery. Los datos incluyen datos de texto y datos no estructurados de columnas que contienen valores ObjectRef. Para cada fila de la tabla, estas funciones generan un resultado que contiene un tipo específico. Por ejemplo, puedes analizar imágenes de muebles para el hogar y generar texto para una columna design_type, de modo que el SKU de los muebles tenga una descripción asociada, como mid-century modern o farmhouse.

Las siguientes funciones de IA están disponibles:

Cuando usas la función AI.GENERATE con modelos de Gemini compatibles, puedes usar Vertex AI Provisioned Throughput para proporcionar un alto rendimiento coherente para las solicitudes. Para obtener más información, consulta Cómo usar la capacidad de procesamiento aprovisionada de Vertex AI.

Genera texto con una TVF

Puedes realizar tareas de IA generativa con la función GENERATE_TEXT, que usa modelos remotos en BigQuery ML para hacer referencia a modelos implementados o alojados en Vertex AI. Puedes crear los siguientes tipos de modelos remotos:

Después de crear un modelo remoto, puedes usar la función AI.GENERATE_TEXT para interactuar con ese modelo:

  • En el caso de los modelos remotos basados en modelos de Gemini, puedes hacer lo siguiente:

    • Usa la función AI.GENERATE_TEXT para generar texto a partir de una instrucción que especifiques en una consulta o que extraigas de una columna en una tabla estándar. Cuando especificas la instrucción en una consulta, puedes hacer referencia a los siguientes tipos de columnas de la tabla en la instrucción:

    • Usa la función AI.GENERATE_TEXT para analizar contenido de texto, imagen, audio, video o PDF a partir de una tabla de objetos con una instrucción que proporcionas como argumento de una función.

  • Para todos los demás tipos de modelos remotos, puedes usar la función AI.GENERATE_TEXT con una instrucción que proporciones en una consulta o desde una columna en una tabla estándar.

Usa los siguientes temas para probar la generación de texto en BigQuery ML:

Puedes usar fundamentación y atributos de seguridad cuando uses modelos de Gemini con la función AI.GENERATE_TEXT, siempre que uses una tabla estándar como entrada. Grounding lets the Gemini model use additional information from the internet to generate more specific and factual responses. Safety attributes let the Gemini model filter the responses it returns based on the attributes you specify.

En el caso de algunos modelos, puedes optar por configurar el ajuste supervisado, que te permite entrenar el modelo con tus propios datos para que se adapte mejor a tu caso de uso. Todas las inferencias se producen en Vertex AI. Los resultados se almacenan en BigQuery.

En el caso de los modelos de Gemini compatibles, puedes usar el Vertex AI Provisioned Throughput para proporcionar un alto rendimiento coherente para las solicitudes. Para obtener más información, consulta Cómo usar la capacidad de procesamiento aprovisionada de Vertex AI.

Genera embeddings

Un embedding es un vector numérico de alta dimensión que representa una entidad determinada, como un fragmento de texto o un archivo de audio. La generación de embeddings te permite capturar la semántica de tus datos de una manera que facilita el razonamiento y la comparación de los datos.

Estos son algunos casos de uso comunes para la generación de incorporaciones:

  • Usar la generación mejorada por recuperación (RAG) para aumentar las respuestas del modelo a las preguntas de los usuarios haciendo referencia a datos adicionales de una fuente confiable La RAG proporciona una mejor exactitud fáctica y coherencia en las respuestas, y también brinda acceso a datos más recientes que los datos de entrenamiento del modelo.
  • Realizar búsquedas multimodales Por ejemplo, usar la entrada de texto para buscar imágenes.
  • Realizar búsquedas semánticas para encontrar elementos similares para recomendaciones, sustituciones y deduplicación de registros
  • Crear embeddings para usar con un modelo de k-means para el agrupamiento en clústeres

Para obtener más información sobre cómo generar embeddings y usarlos para realizar estas tareas, consulta la Introducción a los embeddings y la búsqueda de vectores.

Funciones de IA administradas

Las funciones de IA administradas se diseñaron específicamente para automatizar tareas rutinarias, como la clasificación, el ordenamiento o el filtrado. Estas funciones usan Gemini y no requieren personalización. BigQuery usa la ingeniería de instrucciones y selecciona el modelo y los parámetros adecuados para la tarea específica con el objetivo de optimizar la calidad y la coherencia de los resultados. Cada función devuelve un valor escalar, como BOOL, FLOAT64 o STRING, y no incluye información de estado adicional del modelo. Están disponibles las siguientes funciones de IA administradas:

  • AI.IF: Filtra texto o datos multimodales, como en una cláusula WHERE o JOIN, en función de una instrucción. Por ejemplo, podrías filtrar las descripciones de productos por aquellas que describen un artículo que sería un buen regalo.
  • AI.SCORE: Califica las entradas según una instrucción para clasificar las filas por calidad, similitud o algún otro criterio. Puedes usar esta función en una cláusula ORDER BY para extraer los K elementos principales según la puntuación. Por ejemplo, podrías encontrar las 10 opiniones de usuarios más positivas o negativas sobre un producto.
  • AI.CLASSIFY: Clasifica el texto en categorías definidas por el usuario. Puedes usar esta función en una cláusula GROUP BY para agrupar las entradas según las categorías que definas. Por ejemplo, podrías clasificar los tickets de asistencia según si se relacionan con la facturación, el envío, la calidad del producto o algún otro tema.

Para ver un instructivo con ejemplos de cómo usar estas funciones, consulta Realiza análisis semánticos con funciones de IA administradas.

Para ver un instructivo en formato de notebook que muestra cómo usar las funciones de IA administradas y de uso general, consulta Análisis semántico con funciones de IA.

Ubicaciones

Las ubicaciones admitidas para los modelos de generación y de incorporación de texto varían según el tipo y la versión del modelo que uses. Para obtener más información, consulta Ubicaciones.

Precios

Se te cobra por los recursos de procesamiento que usas para ejecutar consultas en los modelos. Los modelos remotos realizan llamadas a los modelos de Vertex AI, por lo que las consultas a los modelos remotos también generan cargos de Vertex AI.

Para obtener más información, consulta los precios de BigQuery ML.

Seguimiento de costos

Las funciones de IA generativa en BigQuery envían solicitudes a Vertex AI, lo que puede generar costos. Para hacer un seguimiento de los costos de Vertex AI que genera un trabajo que ejecutas en BigQuery, sigue estos pasos:

  1. Consulta tus informes de facturación en Facturación de Cloud.
  2. Usa filtros para definir mejor los resultados.

    En servicios, selecciona Vertex AI.

  3. Para ver los cargos de un trabajo específico, filtra por etiqueta.

    Establece la clave en bigquery_job_id_prefix y el valor en el ID del trabajo de tu trabajo. Si tu ID de trabajo tiene más de 63 caracteres, usa solo los primeros 63. Si el ID del trabajo contiene caracteres en mayúscula, cámbialos a minúsculas. También puedes asociar los empleos con una etiqueta personalizada para ayudarte a encontrarlos más adelante.

Algunos cargos pueden tardar hasta 24 horas en aparecer en la Facturación de Cloud.

¿Qué sigue?