Vertex AI Vision es una plataforma potenciada por IA que puedes usar para ingerir, analizar y almacenar datos de video. Vertex AI Vision te permite compilar e implementar aplicaciones de IA. Puedes compilar soluciones de Vertex AI Vision de extremo a extremo aprovechando la integración de Vertex AI Vision con otros componentes del producto.
Para comenzar a implementar soluciones con la plataforma de Vertex AI Vision, revisa los siguientes conceptos y componentes de Vertex AI Vision:
Streams: Representan una capa de transmisión de video de tu solución. La fuente de transmisión puede ser un video en vivo (por ejemplo, una cámara IP) o un archivo de video (por ejemplo, un archivo MP4).
Aplicaciones: Habilitan la conexión entre una transmisión y un procesador de IA para realizar una operación de aprendizaje automático en el video. Por ejemplo, puedes conectar una transmisión de cámara a un modelo de IA que cuente las personas que pasan frente a ella.
Destino de salida de la app: Envía los datos analizados a un destino de almacenamiento (Media Warehouse de Vertex AI Vision o BigQuery) o recibe datos en tiempo real. El almacenamiento en Media Warehouse de Vertex AI Vision te permite buscar los resultados del análisis y los metadatos de los procesadores de IA que se usan en los datos de las transmisiones ingeridas. El almacenamiento en BigQuery te permite usar las capacidades de análisis sin conexión del producto. Si recibes directamente el resultado de la app, puedes usar las estadísticas para fundamentar instantáneamente las decisiones comerciales. Para obtener más información, consulta Descripción general: Conecta la salida de la app a un destino de datos.
Configura BigQuery para recibir datos
Para poder recibir datos y generar predicciones a partir de los datos de tu app de estadísticas, debes crear un conjunto de datos y una tabla de BigQuery que coincidan con la información procesada.
Crea un conjunto de datos
Antes de crear una tabla de BigQuery, primero debes crear un conjunto de datos para recibir la información analizada de tu app.
Console
Abre la página de BigQuery en la Google Cloud consola.
En el panel Explorador, selecciona el proyecto en el que deseas crear el conjunto de datos.
Expande la opción
Acciones y haz clic en Crear conjunto de datos.En la página Crear conjunto de datos:
- En ID del conjunto de datos, ingresa
occupancy_dataset
. En Ubicación de los datos, selecciona una ubicación geográfica para el conjunto de datos (opcional). Después de crear un conjunto de datos, la ubicación no se puede cambiar.
Para Vencimiento predeterminado de la tabla, selecciona una de las siguientes opciones:
- Never (Nunca): (Predeterminado) las tablas creadas en el conjunto de datos nunca se borran de manera automática. Debes borrarlas tú mismo.
Cantidad de días después de la creación de la tabla: Este valor determina cuándo se borra una tabla recién creada en el conjunto de datos. Este valor se aplica si no estableces el vencimiento de la tabla cuando la creas.
Haz clic en Crear conjunto de datos.
- En ID del conjunto de datos, ingresa
Crea una tabla de BigQuery
Console
En la consola de Google Cloud , ve a la página BigQuery.
- En el panel Explorador, expande tu proyecto y, luego, selecciona
el conjunto de datos
occupancy_dataset
. - En la sección Información del conjunto de datos, haz clic en Crear tabla.
- En el panel Crear tabla, especifica los siguientes detalles:
- En la sección Fuente, selecciona Tabla vacía en la lista Crear tabla desde.
- En la sección Destino, especifica los siguientes
detalles:
- Verifica que, en el campo Conjunto de datos, se especifique
occupancy_dataset
. - En el campo Tabla, ingresa
occupancy_dataset_table
. - Verifica que el campo Tipo de tabla esté configurado como Tabla nativa.
- Verifica que, en el campo Conjunto de datos, se especifique
- En la sección Esquema, ingresa la definición del esquema. Puedes
ingresar la información del esquema de forma manual de la siguiente manera:
- Haz clic en crear un archivo de esquema JSON.
[ { "name": "ingestion_time", "type": "TIMESTAMP", "mode": "REQUIRED" }, { "name": "application", "type": "STRING", "mode": "REQUIRED" }, { "name": "instance", "type": "STRING", "mode": "REQUIRED" }, { "name": "node", "type": "STRING", "mode": "REQUIRED" }, { "name": "annotation", "type": "STRING" } ]
Editar como texto y pega el siguiente esquema de array de JSON. Cuando usas un array JSON, generas el esquema con el mismo proceso que se usa para
- Haz clic en crear un archivo de esquema JSON.
- Haz clic en Crear tabla.
Crea una aplicación de recuento de ocupación
Después de configurar tu conjunto de datos y tabla de BigQuery, puedes crear la app que procesa los datos enviados a estos recursos de BigQuery.
Crea una app vacía
Antes de completar el gráfico de la app, primero debes crear una app vacía.
Console
Crea una app en la consola de Google Cloud .
Abre la pestaña Aplicaciones del panel de Vertex AI Vision.
Haz clic en el botón
Crear.Ingresa
occupancy-bq-app
como el nombre de la app y elige tu región.Haz clic en Crear.
Agrega nodos componentes de la app
Después de crear la aplicación vacía, puedes agregar los tres nodos al gráfico de la app:
- Nodo de transferencia: Es el recurso de transmisión que transfiere los datos enviados desde una instancia de VM de Compute Engine que creas.
- Nodo de procesamiento: Es el modelo de análisis de ocupación que actúa sobre los datos ingeridos.
- Nodo de BigQuery: Es el nodo del conector que permite que tu app almacene metadatos en tu tabla de BigQuery.
Console
Agrega nodos de componentes a tu app en la consola.
Abre la pestaña Aplicaciones del panel de Vertex AI Vision.
En la línea
occupancy-bq-app
, selecciona Ver gráfico. Esta acción te llevará a la visualización del gráfico de la canalización de procesamiento.
Agrega un nodo de transferencia de datos
Para agregar un nodo de flujo de entrada, selecciona la opción Flujos en la sección Conectores del menú lateral.
En la sección Fuente del menú Transmisión que se abre, selecciona
Agregar transmisiones.En el menú Agregar transmisiones, elige
Registrar transmisiones nuevas y agregaoccupancy-bq-stream
como nombre de la transmisión.Para agregar el flujo al gráfico de la app, haz clic en Agregar flujos.
Agrega un nodo de procesamiento de datos
Para agregar el nodo del modelo de recuento de ocupación, selecciona la opción Análisis de ocupación en la sección Modelos especializados del menú lateral.
Deja las selecciones predeterminadas
Personas y Vehículos.
Agrega un nodo de BigQuery
Para agregar el nodo de destino de salida (almacenamiento), selecciona la opción BigQuery en la sección Conectores del menú lateral.
En el menú BigQuery, busca
occupancy_dataset_table
y selecciona tu tabla.En la sección Almacenar metadatos de:, selecciona
Transmisiones y Análisis de ocupación.
Implementar tu app para usarla
Después de compilar tu app integral con todos los componentes necesarios, el último paso para usarla es implementarla.
Console
Abre la pestaña Aplicaciones del panel de Vertex AI Vision.
Selecciona Ver gráfico junto a la app de
occupancy-bq-app
en la lista.En la página del compilador de gráficos de la aplicación, haz clic en el botón
Implementar.En el siguiente diálogo de confirmación, selecciona Implementar.
La operación de implementación puede tardar varios minutos en completarse. Cuando finalice la implementación, aparecerán marcas de verificación verdes junto a los nodos.
Cómo configurar una máquina remota para transmitir video
Ahora que tienes una app de recuento de ocupación implementada y lista para recibir, procesar y almacenar datos de transmisión en una tabla de BigQuery, debes transmitir datos de video a la app.
En este instructivo, crearás una instancia de VM de Compute Engine que aloja un video y enviarás los datos de transmisión de video desde la VM.
Crea una VM de Linux
El primer paso para enviar video desde una instancia de VM de Compute Engine es crear la instancia de VM.
Console
En la consola ve a la página Instancias de VM.
Selecciona el proyecto y haz clic en Continuar.
Haz clic en Crear instancia.
Especifica un Nombre para la VM. Para obtener más información, consulta Convención de asignación de nombres de recursos.
Opcional: Cambia la Zona para esta VM. Compute Engine aleatoriza la lista de zonas dentro de cada región para fomentar el uso en varias zonas.
Acepta las opciones predeterminadas restantes. Para obtener más información sobre estas opciones, consulta Crea y, luego, inicia una VM.
Para crear y, también, iniciar la VM, haz clic en Crear.
Configura el entorno de la VM
Después de que se inicie la VM, puedes usar la consola para establecer una conexión SSH en tu navegador. Después de establecer esta conexión, puedes descargar la herramienta de línea de comandos de vaictl
para transferir videos a tu app.
Console
Establece una conexión SSH a tu VM
En la consola ve a la página Instancias de VM.
En la sección Conectar de la línea de la instancia que creaste, haz clic en SSH. Se abrirá una conexión SSH en una nueva ventana del navegador.
Descarga la herramienta de línea de comandos de vaictl
En la ventana SSH en el navegador, descarga la herramienta de línea de comandos de Vertex AI Vision (
vaictl
) con el siguiente comando:wget https://github.com/google/visionai/releases/download/v0.0.5/visionai_0.0-5_amd64.deb
Para instalar la herramienta de línea de comandos, ejecuta el siguiente comando:
sudo apt install ./visionai_0.0-5_amd64.deb
Para probar la instalación, ejecuta el siguiente comando:
vaictl --help
Transfiere un archivo de video a tu app
Después de configurar tu entorno de VM, puedes copiar un archivo de video de muestra y, luego, usar vaictl
para transmitir los datos de video a tu app de recuento de ocupación.
Después de enviar este comando, debes permitir que se transmitan varias horas de datos antes de pasar al siguiente paso.
SSH en el navegador
Copia un video de muestra en tu VM
- En la ventana SSH en el navegador de tu VM, copia un video de muestra con el siguiente comando
gcloud storage cp
. Reemplaza la siguiente variable:- SOURCE: Es la ubicación de un archivo de video que se usará. Puedes usar tu propio archivo de video fuente (por ejemplo,
gs://BUCKET_NAME/FILENAME.mp4
) o uno de los videos de muestra:gs://cloud-samples-data/vertex-ai-vision/street_vehicles_people.mp4
(video con personas y vehículos, fuente del video)gs://cloud-samples-data/vertex-ai-vision/highway_vehicles.mp4
(video solo con vehículos, fuente del video)
gcloud storage cp SOURCE .
- SOURCE: Es la ubicación de un archivo de video que se usará. Puedes usar tu propio archivo de video fuente (por ejemplo,
Transmite video desde la VM y transfiere datos a tu app
- Para enviar este archivo de video local al flujo de entrada de la app, usa el siguiente comando. Debes realizar las siguientes sustituciones de variables:
- PROJECT_ID: El ID de tu proyecto de Google Cloud .
- LOCATION_ID: Es el ID de tu ubicación. Por ejemplo:
us-central1
Más información. - LOCAL_FILE.EXT: Es el nombre de un archivo de video local.
Por ejemplo,
my-video.mp4
- Marca
--loop
: Opcional. Repite los datos del archivo para simular la transmisión.
Este comando transmite un archivo de video a una transmisión. Si usas la marca
--loop
, el video se reproducirá en bucle en la transmisión hasta que detengas el comando:vaictl -p PROJECT_ID \ -l LOCATION_ID \ -c application-cluster-0 \ --service-endpoint visionai.googleapis.com \ send video-file to streams 'occupancy-bq-stream' --file-path LOCAL_FILE.EXT --loop
Es posible que transcurran alrededor de 100 segundos entre el inicio de la operación de transferencia vaictl
y la aparición del video en el panel.
Una vez que la transferencia de la transmisión esté disponible, puedes ver el feed de video en la pestaña Transmisiones del panel de Vertex AI Vision. Para ello, selecciona la transmisión occupancy-bq-stream
.
Crea un modelo de previsión con BigQuery ML
Ahora tienes una app que funciona y almacena metadatos en BigQuery. Después de que se transmitan varias horas de datos a tu app, puedes comenzar a compilar un modelo de previsión con BigQuery ML.
Opcional: Ejecuta una consulta de ocupación
Puedes ver los datos que produce la app y que se almacenan en la tabla ejecutando una consulta simple.
Console
En la consola de Google Cloud , abre la página de BigQuery.
Selecciona
Expandir junto aoccupancy_dataset
y, luego,occupancy_dataset_table
.En la vista de detalles de la tabla, haz clic en
Redactar consulta nueva.Ingresa la siguiente consulta en SQL estándar de Google en el área de texto del Editor de consultas:
SELECT * FROM ( SELECT TIMESTAMP_TRUNC(PARSE_TIMESTAMP('"%Y-%m-%dT%H:%M:%E*SZ"', JSON_QUERY(annotation, "$.currentTime")), MINUTE) currentTime, CAST(JSON_QUERY(annotation, '$.stats.fullFrameCount[0].count') AS INT64) AS count, JSON_QUERY(annotation, '$.stats.fullFrameCount[0].entity.labelString') AS type FROM `PROJECT_ID.occupancy_dataset.occupancy_dataset_table` ) WHERE count IS NOT NULL
Opcional: Para cambiar la ubicación de procesamiento de datos, haz clic en Más y, luego, en Configuración de consulta. En Ubicación de procesamiento, haz clic en Selección automática y elige la ubicación de tus datos. Por último, haz clic en Guardar para actualizar la configuración de la consulta.
Haz clic en Ejecutar.
Esto crea un trabajo de consulta que escribe el resultado en una tabla temporal.
Si ejecutas esta consulta, se generará una tabla con información sobre la hora y el recuento de personas presentes en el video.
currentTime | count | tipo |
---|---|---|
2022-08-10 16:17:00 UTC | 2 | "Persona" |
2022-08-10 16:17:00 UTC | 2 | "Persona" |
2022-08-10 16:17:00 UTC | 4 | "Persona" |
2022-08-10 16:17:00 UTC | 1 | "Persona" |
2022-08-10 16:17:00 UTC | 5 | "Persona" |
2022-08-10 16:17:00 UTC | 2 | "Persona" |
Crea una vista para el entrenamiento
Después de ver los datos almacenados en la tabla, puedes crear una vista y, luego, inspeccionar el contenido de la tabla resultante. Usas estos datos de vistas para entrenar tu modelo de previsión.
Puedes crear una vista; para ello, redacta una consulta de SQL que se use con el fin de definir los datos a los que puede acceder la vista. La consulta de SQL debe constar de una instrucción SELECT
. Para obtener más información sobre las vistas de BigQuery, consulta Introducción a las vistas.
Para crear una vista de tabla de entrenamiento, haz lo siguiente:
Console
En la consola de Google Cloud , abre la página de BigQuery.
Selecciona
Expandir junto aoccupancy_dataset
y, luego,occupancy_dataset_table
.En la vista de detalles de la tabla, haz clic en
Redactar consulta nueva.Ingresa la siguiente consulta en SQL estándar de Google en el área de texto del Editor de consultas:
CREATE VIEW `PROJECT_ID.occupancy_dataset.forecast_training_data` AS ( WITH raw_counts AS ( SELECT * FROM ( SELECT TIMESTAMP_TRUNC( PARSE_TIMESTAMP('"%Y-%m-%dT%H:%M:%E*SZ"', JSON_QUERY(annotation, "$.currentTime")), MINUTE) AS currentTime, CAST(JSON_QUERY(annotation, '$.stats.fullFrameCount[0].count') AS INT64) AS count, JSON_QUERY(annotation, '$.stats.fullFrameCount[0].entity.labelString') AS type FROM `PROJECT_ID.occupancy_dataset.occupancy_dataset_table` ) WHERE count IS NOT NULL ) SELECT currentTime, SUM(count) AS total_count, type FROM raw_counts GROUP BY currentTime, type)
Haz clic en Ejecutar.
Opcional: Consulta la vista
Ejecuta la siguiente consulta para ver los resultados de los nuevos datos de entrenamiento de la vista:
Console
En la vista de detalles de la tabla
occupancy_dataset_table
, haz clic en Redactar consulta nueva.Ingresa la siguiente consulta en SQL estándar de Google en el área de texto del Editor de consultas:
SELECT * FROM `PROJECT_ID.occupancy_dataset.forecast_training_data` ORDER BY currentTime, type LIMIT 100
Haz clic en Ejecutar.
Esto devuelve un resultado ordenado por hora que se ve de la siguiente manera:
currentTime | total_count | tipo |
---|---|---|
2022-08-10 16:17:00 UTC | 129 | "Persona" |
2022-08-10 16:18:00 UTC | 150 | "Persona" |
2022-08-10 16:19:00 UTC | 80 | "Persona" |
2022-08-10 16:20:00 UTC | 129 | "Persona" |
2022-08-10 16:21:00 UTC | 142 | "Persona" |
2022-08-10 16:22:00 UTC | 71 | "Persona" |
2022-08-10 16:22:00 UTC | 2 | "Vehículo" |
Entrena el modelo de previsión con BigQuery ML
Ahora que tienes datos en una vista para que sirvan como datos de entrenamiento, puedes entrenar el modelo de previsión con BigQuery ML.
Console
En la vista de detalles de la tabla
occupancy_dataset_table
, haz clic en Redactar consulta nueva.Ingresa la siguiente consulta en SQL estándar de Google en el área de texto del Editor de consultas:
CREATE OR REPLACE MODEL `PROJECT_ID.occupancy_dataset.occupancy_forecast_model` OPTIONS( MODEL_TYPE = "ARIMA_PLUS", TIME_SERIES_TIMESTAMP_COL = "currentTime", TIME_SERIES_DATA_COL = "total_count", TIME_SERIES_ID_COL = "type" ) AS SELECT * FROM `PROJECT_ID.occupancy_dataset.forecast_training_data`
Haz clic en Ejecutar.
La consulta tarda varios minutos en completarse. Una vez completada la primera iteración, tu modelo (occupancy_forecast_model
) aparece en el panel de navegación. Debido a que en la consulta se usa una sentencia CREATE MODEL
para crear un modelo, no se muestran los resultados de la consulta.
Puedes observar el modelo en entrenamiento en la pestaña Estadísticas del modelo. En cuanto se completa la primera iteración, la pestaña se actualiza. Las estadísticas se actualizan a medida que se completan las iteraciones.
Obtén una predicción de ocupación con BigQuery
Una vez que finalice el entrenamiento del modelo, podrás obtener una predicción del modelo sobre el recuento de ocupación.
La siguiente consulta de ML.FORECAST
usa la entrada de la función HORIZON
para generar una previsión de los próximos 60 minutos.
Console
En la vista de detalles de la tabla
occupancy_dataset_table
, haz clic en Redactar consulta nueva.Ingresa la siguiente consulta en SQL estándar de Google en el área de texto del Editor de consultas:
SELECT * FROM ML.FORECAST(MODEL `PROJECT_ID.occupancy_dataset.occupancy_forecast_model`, STRUCT(60 AS HORIZON))
Haz clic en Ejecutar.
El modelo produce previsiones en forecast_value
para las marcas de tiempo futuras en las que el tipo es "Person"
. Por ejemplo, en 2022-08-12
a las 11:06:00
, el modelo prevé que habrá alrededor de 15.26 "Personas" en total.
tipo | forecast_timestamp | forecast_value | standard_error | confidence_level | prediction_interval_lower_bound | prediction_interval_upper_bound |
---|---|---|---|---|---|---|
"Persona" | 2022-08-12 11:06:00 UTC | 15.2621986941298 | 2.56470066 | 0.95 | 10.2444693 | 20.2799280 |
"Persona" | 2022-08-12 11:07:00 UTC | 13.235260043001354 | 3.19379743 | 0.95 | 6.98672921 | 19.4837908 |
"Persona" | 2022-08-12 11:08:00 UTC | 16.257331475128712 | 3.87581375 | 0.95 | 8.67446430 | 23.8401986 |
"Persona" | 2022-08-12 11:09:00 UTC | 31.432229611853742 | 4.24905293 | 0.95 | 23.1191356 | 39.7453236 |
"Persona" | 2022-08-12 11:10:00 UTC | 26.199214148193725 | 4.26157413 | 0.95 | 17.8616229 | 34.5368053 |
"Persona" | 2022-08-12 11:11:00 UTC | 26.211573546307324 | 4.27962512 | 0.95 | 17.8386663 | 34.5844807 |