Introducción a Cloud Data Fusion: Consola

En esta página, se presenta Cloud Data Fusion: Console, también conocida como plano de control. Es un conjunto de operaciones de la API y una interfaz de consola Google Cloud que te permiten administrar una instancia de Cloud Data Fusion. Por ejemplo, con la consola, puedes crear, borrar, reiniciar o actualizar una instancia.

Antes de comenzar

Descripción general de Cloud Data Fusion: Console

En las siguientes secciones, se describen aspectos importantes de la consola.

Instancias

Una instancia es una implementación única de Cloud Data Fusion. Para comenzar a usar Cloud Data Fusion, crea una instancia en la Google Cloud consola. Puedes crear varias instancias de Cloud Data Fusion en un solo Google Cloud proyecto. Puedes especificar una Google Cloud región para cada instancia. Cada instancia es una implementación independiente y única de Cloud Data Fusion, que contiene un conjunto de servicios que controlan la administración del ciclo de vida de las canalizaciones, la organización, la coordinación y la administración de metadatos. Estos servicios se ejecutan mediante recursos de larga duración en un proyecto de usuario.

Cuando crees la instancia, considera las siguientes opciones.

Edición

Crea la instancia en una de las siguientes ediciones de Cloud Data Fusion: Developer, Basic o Enterprise. Elige la edición según los siguientes criterios:

  • Costo
  • Límites de simultaneidad para la ejecución de canalizaciones
  • Disponibilidad del control de acceso basado en funciones (RBAC)

Las ediciones están destinadas a los siguientes casos de uso:

Edición de Cloud Data Fusion Caso de uso
Edición para desarrolladores Para desarrollo, pruebas o integraciones a pequeña escala
Edición básica Para producción con necesidades moderadas
Edición Enterprise Para canalizaciones de datos esenciales a gran escala con RBAC

Instancia pública o privada

Según tus requisitos, decide si necesitas una instancia pública o privada. Las diferencias clave entre las instancias privadas y públicas en Cloud Data Fusion son la conectividad de red y la seguridad:

Tipo de instancia de Cloud Data Fusion Comportamiento
Instancia pública
  • Conectividad de red: Usa direcciones IP públicas para conectarse a Internet.
  • Acceso a los datos: Accede directamente a las fuentes de datos en la Internet pública.
Para obtener más información, consulta Crea una instancia pública.
Instancia privada
  • Conectividad de red: Usa direcciones IP privadas dentro de una red de nube privada virtual (VPC).
  • Acceso a los datos: Requiere conexiones preconfiguradas para acceder a las fuentes de datos. Se admiten las siguientes conexiones:
    • Fuentes de datos locales conectadas a través de VPN o Cloud Interconnect
    • Otros Google Cloud servicios que se ejecutan de forma privada dentro de la misma VPC.

Autorización y cuenta de servicio

Por lo general, Cloud Data Fusion tiene dos cuentas de servicio:

Cuenta de servicio en tiempo de diseño
Esta cuenta de servicio administrada por Google, llamada Agente de servicio de la API de Cloud Data Fusion, se usa en el proyecto de usuario de Cloud Data Fusion para acceder a los recursos del proyecto del cliente.
Cuenta de servicio en tiempo de ejecución
Esta es la cuenta de servicio predeterminada de Compute Engine que Cloud Data Fusion crea para implementar trabajos que acceden a otros Google Cloud recursos. De forma predeterminada, se adjunta a una VM de clúster de Managed Service for Apache Spark para permitir que Cloud Data Fusion acceda a los recursos de Managed Service for Apache Spark durante la ejecución de una canalización.

Para obtener más información, consulta Cuentas de servicio en Cloud Data Fusion.

Registro y supervisión

Cloud Logging y Cloud Monitoring son fundamentales para obtener estadísticas sobre el estado y el rendimiento de tus canalizaciones de Cloud Data Fusion. Solo habilitas Logging y Monitoring cuando creas la instancia de Cloud Data Fusion.

Si habilitas Logging y Monitoring, puedes ver los registros de canalización de Cloud Data Fusion en la Google Cloud consola en la página Visor de registros.

Monitoring proporciona paneles integrados para Cloud Data Fusion. También puedes crear paneles personalizados para supervisar métricas específicas.

Integración del linaje con Knowledge Catalog

Cloud Data Fusion proporciona una integración con Knowledge Catalog para el linaje. Para obtener más información, consulta Visualiza el linaje en Knowledge Catalog.

Encriptación

Las claves de encriptación administradas por el cliente (CMEK) permiten la encriptación de datos en reposo con una clave que puedes controlar a través de Cloud Key Management Service. Las CMEK proporcionan al usuario control de los datos escritos en los recursos internos de los proyectos de usuario y los datos escritos por las canalizaciones de Cloud Data Fusion. Google Cloud Para obtener más información, consulta Encriptación de datos administrada por el cliente.

Administra permisos con el control de acceso basado en funciones (RBAC)

Cloud Data Fusion te permite controlar con Identity and Access Management (IAM).

Para obtener permisos detallados para las acciones que se realizan en Cloud Data Fusion: operaciones de Studio, usa RBAC. Para obtener más información, consulta la descripción general de RBAC.

Actualizaciones de versiones

Cloud Data Fusion tiene versiones. Puedes actualizar una instancia a una versión posterior en la consola de Cloud Data Fusion. Para obtener más información, consulta Control de versiones en Cloud Data Fusion.

¿Qué sigue?