Preguntas frecuentes sobre Knowledge Catalog

En este documento, se responden algunas de las preguntas frecuentes relacionadas con Knowledge Catalog (anteriormente Dataplex Universal Catalog).

Para obtener más información sobre Knowledge Catalog, consulta Descripción general de Knowledge Catalog.

¿Qué es Knowledge Catalog?

Google Knowledge Catalog es una solución de administración inteligente para datos y recursos de IA en Google Cloud. Proporciona un inventario centralizado en el que puedes descubrir, administrar y controlar tus datos en fuentes de datos como BigQuery, Cloud Storage, Pub/Sub y Spanner. Google Cloud Usa la IA para automatizar el descubrimiento de datos, el enriquecimiento de metadatos y la calidad de los datos. A través de su catálogo de datos administrados, Knowledge Catalog proporciona la fundamentación esencial que los agentes de IA necesitan para generar contenido de alta calidad.

¿Qué es Data Catalog?

Data Catalog era el nombre original del servicio de metadatos de Google Cloud's. Con el tiempo, evolucionó a Dataplex Universal Catalog y, ahora, se cambió su nombre y evolucionó a Knowledge Catalog.

Si bien el término "Data Catalog" aún se usa para describir este tipo de indexación de datos, en el contexto de Google Cloud, se refiere a nuestro producto heredado. Recomendamos que todos los proyectos nuevos usen Knowledge Catalog para aprovechar las funciones potenciadas por IA y la administración mejorada.

¿Knowledge Catalog es diferente de Data Catalog?

Sí, Knowledge Catalog es la plataforma de administración de datos potenciada por IA que, finalmente, reemplazará al Data Catalog existente. Si bien comparten conceptos similares, Knowledge Catalog proporciona varias mejoras:

  • Contexto potenciado por IA: A diferencia de Data Catalog, Knowledge Catalog usa Gemini para extraer automáticamente el contexto empresarial, generar descripciones en lenguaje natural y proporcionar “consultas de referencia” de SQL para fundamentar los agentes de IA.

  • Compatibilidad con metadatos enriquecidos: Knowledge Catalog admite tipos de metadatos más complejos, como arrays, mapas y registros anidados.

  • Acceso de agentes: Los agentes de IA pueden descubrir y usar de forma adaptativa las herramientas de Knowledge Catalog a través de un servidor MCP local o remoto.

  • Descubrimiento de datos: Knowledge Catalog puede ingerir automáticamente metadatos de un conjunto más grande de servicios y fuentes de datos externas. Google Cloud

  • Administración a gran escala: Ofrece capacidades mejoradas para la creación de perfiles de datos, la calidad automática de los datos y la administración centralizada.

¿Para qué se usa Knowledge Catalog?

Google Knowledge Catalog resuelve el problema del “inicio en frío de datos”, es decir, el tiempo perdido tratando de encontrar, comprender y confiar en los datos antes de que puedas usarlos. Sus usos principales incluyen los siguientes:

  • Descubrimiento de datos acelerado: En lugar de navegar por complejos silos organizacionales para ubicar datos, puedes usar la búsqueda en lenguaje natural (por ejemplo, “Muéstrame los datos más recientes de deserción de clientes”) para encontrar recursos en todos losGoogle Cloud recursos al instante, lo que aumenta la productividad de los consumidores de datos.

  • Fundamentación de agentes de IA: Actúa como la “fuente de información” para la IA generativa o el ADK. Al vincular los datos físicos a las definiciones empresariales, se garantiza que los agentes de IA (como los que se compilan en Vertex AI) usen datos de alta calidad, lo que reduce significativamente las alucinaciones de la IA y mejora la confianza en las estadísticas generadas por la IA.

  • Administración de datos automatizada: Analiza automáticamente tus datos para identificar información sensible (como la IIP), realiza un seguimiento de la procedencia de los datos (linaje) y supervisa su exactitud (calidad automática de los datos). Estas capacidades ayudan a mejorar la confianza, la seguridad y el cumplimiento de los datos con menos esfuerzo manual.

  • Descubrimiento de “datos oscuros”: Puede analizar archivos no estructurados (como archivos PDF o imágenes en Cloud Storage), extraer la información que contienen y hacer que se puedan buscar y consultar en BigQuery, lo que te ayuda a desbloquear estadísticas de datos a los que no se podía acceder anteriormente.

Para ver casos de uso prácticos, consulta Explora Knowledge Catalog.

¿Qué tipos de metadatos almacena Knowledge Catalog?

Knowledge Catalog almacena tres tipos de metadatos:

  • Metadatos técnicos: Esquemas, nombres de tablas y propiedades del sistema recopilados automáticamente.

  • Metadatos empresariales: Contexto definido por el usuario, como descripciones empresariales, términos del glosario y propiedad.

  • Metadatos de tiempo de ejecución: Información sobre el linaje de datos, las puntuaciones de calidad de los datos y las estadísticas de creación de perfiles de datos.

¿Cómo migro desde Data Catalog?

La transición a Knowledge Catalog está diseñada para ser fluida, sin necesidad de mover datos de forma manual. Según tu uso actual, el proceso implica dos fases principales:

  • Fase preparatoria: Si tienes metadatos personalizados (etiquetas, plantillas de etiquetas o entradas personalizadas), este contenido se incorpora automáticamente a Knowledge Catalog como de solo lectura. Durante esta fase, realizas tareas de configuración para que el contenido existente de Data Catalog esté disponible de forma simultánea en la nueva interfaz.

  • Fase de transferencia: Una vez preparado, transfieres el estado activo de tus metadatos para que sean de lectura y escritura en Knowledge Catalog. Este paso debe coordinarse con la actualización de cualquier carga de trabajo programática (APIs, bibliotecas cliente o módulos de Terraform) para que apunte a los nuevos extremos de Knowledge Catalog.

Si no tienes metadatos personalizados o eres nuevo en la plataforma, puedes completar la transición configurando Knowledge Catalog como tu experiencia de IU predeterminada en la Google Cloud consola.

Para obtener más información, consulta Transición de Data Catalog a Knowledge Catalog.