En esta página, se presenta Cloud Data Fusion: Console, también conocida como plano de control. Es un conjunto de operaciones de la API y una interfaz de consola Google Cloud que te permiten administrar una instancia de Cloud Data Fusion. Por ejemplo, con la consola, puedes crear, borrar, reiniciar o actualizar una instancia.
Antes de comenzar
- Habilita la API de Cloud Data Fusion.
- Comprende los costos de las ediciones de Cloud Data Fusion.
- Comprende el control de acceso y las cuentas de servicio en Cloud Data Fusion.
Descripción general de Cloud Data Fusion: Console
En las siguientes secciones, se describen aspectos importantes de la consola.
Instancias
Una instancia es una implementación única de Cloud Data Fusion. Para comenzar a usar Cloud Data Fusion, crea una instancia en la Google Cloud consola. Puedes crear varias instancias de Cloud Data Fusion en un solo Google Cloud proyecto. Puedes especificar una Google Cloud región para cada instancia. Cada instancia es una implementación independiente y única de Cloud Data Fusion, que contiene un conjunto de servicios que controlan la administración del ciclo de vida de las canalizaciones, la organización, la coordinación y la administración de metadatos. Estos servicios se ejecutan mediante recursos de larga duración en un proyecto de usuario.
Cuando crees la instancia, considera las siguientes opciones.
Edición
Crea la instancia en una de las siguientes ediciones de Cloud Data Fusion: Developer, Basic o Enterprise. Elige la edición según los siguientes criterios:
- Costo
- Límites de simultaneidad para la ejecución de canalizaciones
- Disponibilidad del control de acceso basado en funciones (RBAC)
Las ediciones están destinadas a los siguientes casos de uso:
| Edición de Cloud Data Fusion | Caso de uso |
|---|---|
| Edición para desarrolladores | Para desarrollo, pruebas o integraciones a pequeña escala |
| Edición básica | Para producción con necesidades moderadas |
| Edición Enterprise | Para canalizaciones de datos esenciales a gran escala con RBAC |
Instancia pública o privada
Según tus requisitos, decide si necesitas una instancia pública o privada. Las diferencias clave entre las instancias privadas y públicas en Cloud Data Fusion son la conectividad de red y la seguridad:
| Tipo de instancia de Cloud Data Fusion | Comportamiento |
|---|---|
| Instancia pública |
|
| Instancia privada |
|
Autorización y cuenta de servicio
Por lo general, Cloud Data Fusion tiene dos cuentas de servicio:
- Cuenta de servicio en tiempo de diseño
- Esta cuenta de servicio administrada por Google, llamada Agente de servicio de la API de Cloud Data Fusion, se usa en el proyecto de usuario de Cloud Data Fusion para acceder a los recursos del proyecto del cliente.
- Cuenta de servicio en tiempo de ejecución
- Esta es la cuenta de servicio predeterminada de Compute Engine que Cloud Data Fusion crea para implementar trabajos que acceden a otros Google Cloud recursos. De forma predeterminada, se adjunta a una VM de clúster de Managed Service for Apache Spark para permitir que Cloud Data Fusion acceda a los recursos de Managed Service for Apache Spark durante la ejecución de una canalización.
Para obtener más información, consulta Cuentas de servicio en Cloud Data Fusion.
Registro y supervisión
Cloud Logging y Cloud Monitoring son fundamentales para obtener estadísticas sobre el estado y el rendimiento de tus canalizaciones de Cloud Data Fusion. Solo habilitas Logging y Monitoring cuando creas la instancia de Cloud Data Fusion.
Si habilitas Logging y Monitoring, puedes ver los registros de canalización de Cloud Data Fusion en la Google Cloud consola en la página Visor de registros.
Monitoring proporciona paneles integrados para Cloud Data Fusion. También puedes crear paneles personalizados para supervisar métricas específicas.
Integración del linaje con Knowledge Catalog
Cloud Data Fusion proporciona una integración con Knowledge Catalog para el linaje. Para obtener más información, consulta Visualiza el linaje en Knowledge Catalog.
Encriptación
Las claves de encriptación administradas por el cliente (CMEK) permiten la encriptación de datos en reposo con una clave que puedes controlar a través de Cloud Key Management Service. Las CMEK proporcionan al usuario control de los datos escritos en los recursos internos de los proyectos de usuario y los datos escritos por las canalizaciones de Cloud Data Fusion. Google Cloud Para obtener más información, consulta Encriptación de datos administrada por el cliente.
Administra permisos con el control de acceso basado en funciones (RBAC)
Cloud Data Fusion te permite controlar con Identity and Access Management (IAM).
Para obtener permisos detallados para las acciones que se realizan en Cloud Data Fusion: operaciones de Studio, usa RBAC. Para obtener más información, consulta la descripción general de RBAC.
Actualizaciones de versiones
Cloud Data Fusion tiene versiones. Puedes actualizar una instancia a una versión posterior en la consola de Cloud Data Fusion. Para obtener más información, consulta Control de versiones en Cloud Data Fusion.
¿Qué sigue?
- Obtén más información sobre Cloud Data Fusion: Studio.