Usa productos de datos

Este documento está dirigido a los consumidores de productos de datos de Knowledge Catalog (antes Dataplex Universal Catalog) que desean descubrir y usar productos de datos para sus casos de uso.

Para obtener más información sobre la arquitectura y los conceptos clave de los productos de datos, consulta Acerca de los productos de datos.

Antes de comenzar

  1. Habilita las APIs de Dataplex y BigQuery.

    Roles necesarios para habilitar las APIs

    Para habilitar las APIs, necesitas el rol de IAM de administrador de Service Usage (roles/serviceusage.serviceUsageAdmin), que contiene el permiso serviceusage.services.enable. Obtén más información para otorgar roles.

    Habilitar las API

Roles obligatorios

Para obtener los permisos que necesitas para buscar, acceder y usar productos de datos, pídele a tu administrador que te otorgue los siguientes roles de IAM en el producto de datos o el proyecto:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

También puedes obtener los permisos necesarios a través de roles personalizados o cualquier otro rol predefinido.

Como consumidor de productos de datos, para ver los metadatos de un activo, debes tener el permiso viewer para acceder al activo correspondiente en el sistema de origen. Por ejemplo, para buscar metadatos de un conjunto de datos o una tabla en un producto de datos, necesitas el rol de visualizador de metadatos de BigQuery (roles/bigquery.metadataViewer). Para obtener más información, consulta Roles necesarios para acceder a los resultados de la búsqueda.

Console

  1. En la consola de Google Cloud , ve a la página Búsqueda de Knowledge Catalog.

    Ir a Búsqueda

  2. Realiza búsquedas con palabras clave o lenguaje natural. Para obtener más información, consulta Cómo buscar recursos.

  3. En los resultados de la búsqueda, haz clic en el producto de datos cuyos detalles deseas ver. Puedes revisar la descripción, los recursos, el contrato, los aspectos, los detalles de contacto y otra documentación asociada con el producto de datos.

REST

Para buscar un producto de datos, usa el método searchEntries.

Por ejemplo, envía la siguiente solicitud POST:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d \
  '{
  "query": "ADDITIONAL_KEYWORDS (type=(DATA_PRODUCT))",
  "pageSize": 10
  }' \
"https://dataplex.googleapis.com/v1/projects/PROJECT_ID/locations/global:searchEntries"

Reemplaza lo siguiente:

  • ADDITIONAL_KEYWORDS (opcional): Cualquier palabra clave o criterio de búsqueda adicional para limitar los resultados (por ejemplo, displayName:'My Data Product' o description:'sales')
  • PROJECT_ID: Es el ID de tu proyecto de Google Clouden el que se crea el producto de datos.

Solicita acceso a los productos de datos

Como consumidor de productos de datos, si no tienes permisos de IAM para acceder a un producto de datos, puedes solicitar acceso con los flujos de trabajo integrados de aprobación de acceso.

Envía una solicitud de acceso

Console

  1. En la consola de Google Cloud , ve a la página Productos de datos de Knowledge Catalog.

    Ir a Productos de datos

  2. Haz clic en el producto de datos al que deseas acceder.

  3. Haz clic en Solicitar acceso.

  4. En el panel Detalles de la solicitud, especifica los siguientes parámetros:

    • Grupos de acceso: Selecciona el grupo de acceso funcional al que deseas unirte.
    • Propio o Cuenta de servicio: Selecciona el tipo de principal:

      • Si solicitas acceso para ti, selecciona Self.

      • Si solicitas acceso para la identidad programática, selecciona Cuenta de servicio. Esta opción solo está disponible si el producto de datos admite cuentas de servicio.

    • Justificación: Ingresa una justificación comercial para tu solicitud.

  5. Haz clic en Enviar.

Se genera una nueva solicitud de cambio para que la revise el propietario del producto de datos. Recibirás una notificación por correo electrónico con el estado final en cuanto se apruebe o rechace la solicitud.

REST

Los consumidores de productos de datos que tienen el permiso dataplex.dataProducts.get pueden solicitar acceso creando un recurso ChangeRequest. Envía una solicitud POST al extremo del recurso del producto de datos con el método personalizado :requestAccess:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d '{
  "parent": "projects/PROJECT_ID/locations/LOCATION/dataProducts/DATA_PRODUCT_ID",
  "change_request": {
    "justification": "JUSTIFICATION_TEXT",
    "data_product_access_request": {
      "parent": "projects/PROJECT_ID/locations/LOCATION/dataProducts/DATA_PRODUCT_ID",
      "access_group_id": "DATA_PRODUCT_ACCESS_GROUP_ID"
    }
  }
}' \
"https://dataplex.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/dataProducts/DATA_PRODUCT_ID:requestAccess"

Reemplaza lo siguiente:

  • PROJECT_ID: Es el ID de tu proyecto de Google Cloud .

  • LOCATION: Es la región en la que existe el producto de datos (por ejemplo, us-central1).

  • DATA_PRODUCT_ID: Es el identificador único del producto de datos objetivo.

  • JUSTIFICATION_TEXT: Es el motivo comercial que explica por qué se requiere el acceso.

  • DATA_PRODUCT_ACCESS_GROUP_ID: ID del grupo de acceso específico al que solicitas unirte

Cómo ver el estado de las solicitudes de acceso

Como consumidor de productos de datos, puedes supervisar el progreso y el ciclo de vida de las solicitudes de acceso que envías. Knowledge Catalog hace un seguimiento de estas solicitudes y las muestra con estados distintos según si estás viendo una lista unificada de flujos de trabajo o el resumen de acceso de un producto específico.

Cómo ver una lista unificada de tus solicitudes de acceso

Para ver una lista completa de todas las solicitudes de acceso que enviaste en todos los productos de datos, sigue estos pasos:

Console

  1. En la consola de Google Cloud , ve a la página Flujos de trabajo de administración de Knowledge Catalog.

    Ir a Flujos de trabajo de administración

  2. Haz clic en la pestaña Mis solicitudes.

  3. Revisa la lista unificada que muestra tus solicitudes anteriores y pendientes, junto con sus estados actuales del flujo de trabajo:

    • Nuevo: Se creó la solicitud de acceso y está pendiente de revisión por parte del aprobador.

    • Aprobada: Se aprobó la solicitud, pero los sistemas de backend aún están aprovisionando el acceso.

    • Rechazada: Se rechazó la solicitud. Revisa los comentarios del aprobador para conocer los motivos del rechazo.

REST

Envía una solicitud GET con el método de colección personalizado :listMine:

curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://dataplex.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/changeRequests:listMine"

Cómo ver el resumen de acceso de un producto de datos específico

Además de la lista de flujos de trabajo globales, puedes verificar tu postura de acceso para un producto de datos individual. Esto te permite verificar si ya tienes acceso heredado a un grupo de recursos sin necesidad de enviar una nueva solicitud.

Para ver el resumen de acceso de un producto de datos, sigue estos pasos:

Console

  1. En la consola de Google Cloud , ve a la página Productos de datos de Knowledge Catalog.

    Ir a Productos de datos

  2. Haz clic en el producto de datos específico que deseas inspeccionar.

  3. Haz clic en la pestaña Resumen de acceso. Revisa tu estado en todos los grupos de acceso para ese producto de datos.

    En la pestaña Resumen de acceso, se usan los siguientes estados:

    Estado Descripción
    Sin acceso No tienes acceso al grupo de acceso y aún no lo solicitaste.
    En proceso de revisión Enviaste una solicitud de acceso, y esta está pendiente de revisión por parte de un aprobador.
    Approved Se aprobó tu solicitud de acceso, pero aún se está procesando la propagación de la membresía al Grupo de Google subyacente.
    Acceso otorgado El acceso está completamente activo. Eres miembro del grupo de acceso y puedes interactuar con los recursos del producto de datos.
    Rechazado Se rechazó tu solicitud de acceso a este grupo de acceso.

REST

Envía una solicitud GET con el ID único que se devolvió cuando se creó la solicitud originalmente:

curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://dataplex.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/changeRequests/CHANGE_REQUEST_ID"

Reemplaza lo siguiente:

  • PROJECT_ID: Es el ID de tu proyecto de Google Cloud .

  • LOCATION: Es la región en la que existe el producto de datos (por ejemplo, us-central1).

  • CHANGE_REQUEST_ID: Es el ID único de la solicitud de cambio que enviaste.

Cómo borrar una solicitud de acceso

  1. En la consola de Google Cloud , ve a la página Flujos de trabajo de administración de Knowledge Catalog.

    Ir a Flujos de trabajo de administración

  2. Haz clic en la pestaña Mis solicitudes.

  3. Ubica la fila que contiene tu solicitud de producto de datos objetivo. Si es necesario, aplica un filtro para aislar la entrada.

  4. Haz clic en Acciones y, luego, en Borrar.

Consume productos de datos

Para usar un producto de datos, asegúrate de que se te hayan otorgado los permisos necesarios. Consulta Solicita acceso a los productos de datos.

Después de que el propietario del producto de datos te otorgue permiso, podrás acceder al producto de datos y a sus recursos. Por ejemplo, si se te otorgan permisos para acceder a una tabla de BigQuery, puedes consultarla directamente en BigQuery para generar estadísticas.

Accede a los recursos con las credenciales del usuario

Si se aprobó tu solicitud de acceso para tus credenciales de usuario, sigue estos pasos para acceder a los recursos:

  1. Busca el producto de datos.
  2. En los resultados de la búsqueda, haz clic en el producto de datos que quieras usar.
  3. Haz clic en la pestaña Activos.
  4. Haz clic en el activo del que deseas ver los detalles. Se abrirá la página de detalles de la entrada.

    Puedes acceder a detalles como el esquema, las estadísticas y el linaje. Si el activo es una tabla o vista de BigQuery, puedes hacer clic en Abrir en BigQuery para navegar a BigQuery Studio y consultar los resultados.

Accede a los recursos con una cuenta de servicio

Si se aprobó tu solicitud de acceso a una cuenta de servicio, se te otorgará el rol de IAM de Creador de tokens de cuenta de servicio (roles/iam.serviceAccountTokenCreator) en la cuenta de servicio del productor de datos. Esto te permite crear una cadena de suplantación para acceder a los recursos subyacentes.

Para acceder a los recursos con una cuenta de servicio, sigue estos pasos:

  1. Para identificar las cuentas de servicio configuradas para el producto de datos, navega a la pestaña Activos de datos de la página de detalles del producto de datos.

  2. Para suplantar la identidad de la cuenta de servicio del productor de datos, crea una cadena de suplantación para tu cuenta de servicio con el siguiente comando de Google Cloud CLI:

    gcloud config set auth/impersonate_service_account CONSUMER_SERVICE_ACCOUNT,PRODUCER_SERVICE_ACCOUNT
    

    Reemplaza lo siguiente:

    • CONSUMER_SERVICE_ACCOUNT: La dirección de correo electrónico completa y calificada de la cuenta de servicio que pertenece al consumidor del producto de datos

    • PRODUCER_SERVICE_ACCOUNT: La dirección de correo electrónico completamente calificada de la cuenta de servicio asignada al grupo de acceso al producto de datos

    Para obtener más información, consulta Usa la identidad temporal como cuenta de servicio.

Accede a los productos de datos con el servidor de MCP remoto

Para las aplicaciones cliente y las herramientas para desarrolladores que interactúan con tus productos de datos fuera del ecosistema de Google Cloud , puedes usar un servidor remoto del Protocolo de contexto del modelo (MCP). Este patrón arquitectónico permite que los clientes desarrolladores externos consulten y descubran de forma segura los recursos de datos catalogados, a la vez que se mantienen límites de administración unificados.

Para obtener información sobre cómo implementar un servidor externo y conectarte a él, consulta Usa el servidor de MCP remoto de Knowledge Catalog.

¿Qué sigue?