Almacén de Vision es una API que permite a los desarrolladores integrar el almacenamiento y la búsqueda basada en IA de contenido multimedia no estructurado (video en streaming, imágenes y videos por lotes) en herramientas y aplicaciones existentes.
Almacén de Vision es un componente principal de Vision de Gemini Enterprise Agent Platform. Funciona como repositorio de almacenamiento y proporciona capacidades de búsqueda avanzada para múltiples tipos de datos y casos de uso. En particular, haz lo siguiente:
- Video en streaming: Puedes importar transmisiones de video en vivo y datos de análisis de video en vivo con la aplicación de la plataforma Vision de Gemini Enterprise Agent Platform o la API de Almacén de Vision, y buscar imágenes con la API de Almacén de Vision o la consola de Google Cloud .
- Imagen: Puedes importar imágenes y metadatos con la API de Almacén de Vision, analizar imágenes con la API de Almacén de Vision y buscar imágenes con la API de Almacén de Vision o la consola de Google Cloud .
- Videos por lotes: Puedes importar videos y metadatos por lotes con la API de Almacén de Vision, analizar videos por lotes con la API de Almacén de Vision y buscar videos por lotes con la API de Almacén de Vision o la consola de Google Cloud .
Descripción general de los recursos de la API

Recursos de la API de Storage
Corpus: Es un contenedor que contiene recursos multimedia de un tipo en particular. Puedes crear varios corpus para organizar diferentes tipos de recursos multimedia.
Recurso: Es un objeto multimedia almacenado dentro de un corpus. Los recursos pueden ser imágenes, videos por lotes o transmisiones de video. Por lo general, un corpus contiene muchos recursos del mismo tipo. Puedes especificar las anotaciones asociadas a los activos. Los recursos también se pueden agrupar en colecciones para su administración.
Colección: Es un recurso dentro de un corpus que sirve como contenedor de referencias a activos.
Anotación: Son los metadatos o los datos proporcionados por el usuario que se derivan de la Visión de Agent Platform de Gemini Enterprise y que se asocian a un recurso. Un activo puede tener varias anotaciones.
- Ejemplo 1: Especifica una anotación de texto llamada "video-title" para los recursos de video por lotes.
- Ejemplo 2: Almacena los datos analizados de los modelos de Visión de Agent Platform de Gemini Enterprise como anotaciones. Por ejemplo, las etiquetas de reconocimiento de objetos en diferentes períodos de video se pueden almacenar como anotaciones.
Esquema de datos: Define cómo se interpreta una anotación dentro de un corpus. Un esquema de datos define un tipo de anotación y su estrategia de búsqueda. Cada anotación debe estar asociada a un esquema de datos.
Recursos de la API de Search
Índice (disponible para las verticales de imágenes y videos por lotes): Es un recurso a nivel del corpus que es una representación administrada de los recursos y las anotaciones analizados. Un índice se puede considerar como un conjunto de datos de vectores de incorporación y restricciones semánticas que representan el significado del contenido multimedia. Los índices se pueden implementar en extremos de índice para la búsqueda.
Extremo de índice (disponible para verticales de imágenes y videos por lotes): Es un entorno administrado que entrega índices de Almacén de Vision. Los extremos de índice proporcionan un único punto de acceso para enviar solicitudes de búsqueda.
Configuración de búsqueda: Almacena varias propiedades que afectan los comportamientos y los resultados de la búsqueda.
- Propiedad de faceta (disponible para la vertical de videos en plataformas de transmisión): Crea una configuración para habilitar los resultados de la búsqueda de histogramas basados en facetas.
- Propiedad de criterios de búsqueda (disponible para las verticales de transmisión de video y video por lotes): Crea una asignación entre un criterio de búsqueda personalizado y una o más claves de esquema de datos.
Search Hypernym: Es un tipo específico de configuración de búsqueda que te permite personalizar la capacidad del servicio de búsqueda para reconocer hiperónimos de palabras. Por ejemplo, los usuarios pueden especificar "animal" como hiperónimo de "gato" y "perro". Si buscas "animal", también se mostrarán resultados con "gato" y "perro" en los datos del índice.
Idiomas compatibles
Los almacenes de imágenes y videos por lotes admiten los siguientes idiomas para la búsqueda semántica:
- Inglés
- Español
- Portugués
- Francés
- Japonés
- Chino
Streaming Warehouse no tiene restricciones de idioma.
¿Qué sigue?
- Comprende los flujos de usuarios clave de la API para cada vertical de medios: video de transmisión, imagen y video por lotes.
- Explora las cuotas y los límites de Almacén de Vision.
- Familiarízate con la sección Precios.
- Descubre cómo obtener asistencia.