Dataplex Universal Catalog es una solución de gobernanza de datos unificada e inteligente que te ayuda a gestionar, comprender y usar tus recursos de datos en tu organización. Al usar la IA, Dataplex Universal Catalog simplifica el trabajo con datos distribuidos en varios sistemas, lo que te permite centrarte en obtener estadísticas valiosas.
Por ejemplo, imagina una empresa minorista internacional que genera grandes cantidades de datos de ventas, inventario y clientes, y los almacena en Cloud Storage, Spanner y Pub/Sub. Cuando los datos se distribuyen entre sistemas de esta forma, puede ser complejo y llevar mucho tiempo gestionar la gobernanza, asegurar la calidad y mantener el cumplimiento. Dataplex Universal Catalog simplifica estos procesos al proporcionar un catálogo de datos centralizado para descubrir, perfilar, validar, hacer un seguimiento del linaje y controlar el acceso a los recursos de datos de la organización.
En este documento se describen las funciones principales de Dataplex Universal Catalog y se destacan los casos prácticos clave.
Funciones de Dataplex Universal Catalog
Dataplex Universal Catalog gobierna los datos mediante las siguientes funciones:
- Catalogación de metadatos. Recupera metadatos de recursos (en BigQuery, Cloud SQL, Spanner, Vertex AI, Pub/Sub, Dataform y Dataproc Metastore) y de recursos de terceros que incorpores a Dataplex Universal Catalog para crear un catálogo de datos al instante. Google Cloud
- Descubrimiento de datos. Analiza datos estructurados y no estructurados en segmentos de Cloud Storage para extraer y catalogar sus metadatos.
- Estadísticas de datos. Usa la IA para generar preguntas en lenguaje natural sobre tus datos, identificar patrones, evaluar la calidad de los datos y realizar análisis estadísticos.
- Perfilado de datos. Identifica las características comunes de los datos de las columnas de tus tablas de BigQuery, como los valores de datos típicos, la distribución de los datos y el número de valores nulos, que pueden ayudarte a clasificar los datos y a asegurar su calidad.
- Calidad de los datos. Define y mide la calidad de los datos de tus tablas de BigQuery validando los datos con las políticas de la organización y registrando alertas si los datos no cumplen los criterios de calidad.
- Glosario empresarial. Gestiona la terminología y las definiciones relacionadas con la empresa en toda tu organización y asocia términos a las columnas de las tablas para fomentar una comprensión coherente del uso de los datos.
- Linaje de datos. Monitoriza cómo se mueven los datos por tus sistemas: de dónde proceden, a dónde se transfieren y qué transformaciones se les aplican.
Dataplex Universal Catalog admite un ciclo de vida de los datos completo, desde el descubrimiento distribuido hasta las estadísticas empresariales. Las funciones de gobernanza también están disponibles en BigQuery.
Casos prácticos
Puedes usar Dataplex Universal Catalog para hacer lo siguiente:
Descubrir e interpretar los datos Dataplex Universal Catalog te permite ver los recursos de datos de toda la organización. Te permite encontrar recursos relevantes para tus necesidades de consumo de datos. Proporciona contexto sobre los recursos de datos, lo que te ayuda a determinar si son adecuados para las necesidades de tus consumidores de datos.
Habilita el gobierno y la gestión de datos. Dataplex Universal Catalog proporciona metadatos que pueden informar y potenciar tus funciones de gobernanza y gestión de datos.
Cree un catálogo de datos centralizado. Dataplex Universal Catalog almacena metadatos y proporciona acceso a ellos. Estos metadatos se recopilan automáticamente de tus Google Cloud recursos. Puedes integrar tus propios metadatos de sistemas que no sean deGoogle Cloud . Puede enriquecer todos los metadatos con anotaciones de metadatos técnicos y empresariales adicionales.
Empezar
Si es la primera vez que trabajas con Dataplex Universal Catalog, te recomendamos que sigas una guía de inicio rápido:
Siguientes pasos
- Consulta información sobre la gestión de metadatos en Dataplex Universal Catalog.
- Consulta cómo buscar recursos de datos.
- Consulta cómo gestionar entradas e incorporar fuentes personalizadas.
- Consulta cómo importar metadatos a Dataplex Universal Catalog.
- Consulta información sobre la gestión de BigQuery.