Airflow administrado (3ª gen.) | Airflow administrado (2ª gen.) | Airflow administrado (1ª gen. heredada)
Airflow administrado ofrece algunos cumplimientos y características de seguridad que son beneficiosos para empresas empresariales con requisitos de seguridad más estrictos.
En estas tres secciones, se presenta información sobre las características de seguridad de Airflow administrado:
- Funciones básicas de seguridad. Describe las funciones que están disponibles en los entornos de Airflow administrado de forma predeterminada.
- Funciones de seguridad avanzadas. Describe las funciones que puedes usar para modificar Airflow administrado según tus requisitos de seguridad.
- Cumplimiento de los estándares. Proporciona una lista de los estándares que cumple Airflow administrado.
Funciones básicas de seguridad
En esta sección, se enumeran las características de seguridad relacionadas con la configuración predeterminada de cada entorno de Airflow administrado.
Encriptación en reposo
Airflow administrado utiliza la encriptación en reposo en Google Cloud.
Airflow administrado almacena datos en diferentes servicios. Por ejemplo, la base de datos de metadatos de Airflow usa la base de datos de Cloud SQL, y los DAG se almacenan en buckets de Cloud Storage.
De forma predeterminada, los datos se encriptan con Google-owned and Google-managed encryption keys.
Si lo prefieres, puedes configurar los entornos de Airflow administrado para que se encripten con claves de encriptación administradas por el cliente.
Acceso uniforme a nivel de bucket
El acceso uniforme a nivel de bucket te permite controlar de manera uniforme el acceso a tus recursos de Cloud Storage Este mecanismo también se aplica al bucket de tu entorno, que almacena tus DAG y complementos.
Permisos de usuario
Airflow administrado tiene varias funciones para administrar los permisos de usuario:
Permisos y roles de IAM. Solo los usuarios cuyas cuentas se agreguen a IAM del proyecto pueden acceder a los entornos de Airflow administrado en un Google Cloud proyecto.
Permisos y roles específicos de Airflow administrado. Asigna estos roles y permisos a las cuentas de usuario de tu proyecto. Cada rol define los tipos de operaciones que una cuenta de usuario puede realizar en los entornos de Airflow administrado de tu proyecto.
Control de acceso a la IU de Airflow. Los usuarios de tu proyecto pueden tener diferentes niveles de acceso en la IU de Airflow. Este mecanismo se denomina Control de acceso a la IU de Airflow (Control de acceso basado en roles de Airflow o RBAC de Airflow).
Uso compartido restringido al dominio (DRS). Airflow administrado admite la política de la organización de uso compartido restringido al dominio . Si usas esta política, solo los usuarios de los dominios seleccionados podrán acceder a tus entornos.
Entornos de IP privada
Puedes crear entornos de Airflow administrado en la configuración de red de IP privada.
En el modo de IP privada, los nodos del clúster de tu entorno no tienen direcciones IP externas y no se comunican a través de Internet pública.
El clúster de tu entorno usa VMs protegidas
Las VMs protegidas son máquinas virtuales (VMs) en Google Cloud endurecidas con un conjunto de controles de seguridad destinados a protegerlas de los rootkits y bootkits.
Los entornos de Airflow administrado usan VMs protegidas para ejecutar los nodos de su clúster de entorno.
Funciones de seguridad avanzadas
En esta sección, se enumeran las funciones de seguridad avanzadas relacionadas con los entornos de Airflow administrado.
Claves de encriptación administradas por el cliente (CMEK)
Airflow administrado admite claves de encriptación administradas por el cliente (CMEK). Las CMEK te brindan más control sobre las claves que se usan para encriptar datos en reposo dentro de un Google Cloud proyecto.
Puedes usar CMEK con Airflow administrado para encriptar y desencriptar datos generados por un entorno de Airflow administrado.
Compatibilidad con los Controles del servicio de VPC (VPC SC)
Los Controles del servicio de VPC son un mecanismo para mitigar los riesgos de robo de datos.
Se puede seleccionar Airflow administrado como un servicio protegido dentro del perímetro de los Controles del servicio de VPC. Todos los recursos subyacentes que usa Airflow administrado se configuran para admitir la arquitectura de los Controles del servicio de VPC y seguir sus reglas. Solo se pueden crear entornos de IP privada en un perímetro de VPC SC.
Implementar entornos de Airflow administrado con los Controles del servicio de VPC te proporciona lo siguiente:
Reducción del riesgo de robo de datos
Protección contra la exposición de datos debido a controles de acceso mal configurados
Reducción del riesgo de que usuarios maliciosos copien datos a recursos no autorizados Google Cloud , o ante atacantes externos que acceden a recursos desde Internet Google Cloud
Niveles de control de acceso a la red del servidor web (ACL)
Los servidores web de Airflow en Airflow administrado siempre se aprovisionan con una dirección IP accesible de forma externa. Puedes controlar desde qué direcciones IP se puede acceder a la IU de Airflow. Airflow administrado admite rangos de IPv4 y IPv6.
Puedes configurar las restricciones de acceso al servidor web
en la Google Cloud consola, gcloud, la API y Terraform.
Secret Manager como almacenamiento para datos de configuración sensibles
En Airflow administrado, puedes configurar Airflow para que use Secret Manager como un backend en el que se almacenan las variables de conexión de Airflow.
Los desarrolladores de DAG también pueden leer variables y conexiones almacenadas en Secret Manager desde el código DAG.
Cumplimiento de los estándares
Consulta las páginas vinculadas a continuación para verificar el cumplimiento de Airflow administrado con varios estándares:
- Cumplimiento de la HIPAA
- Transparencia de acceso
- PCI DSS
- ISO/IEC: 27001, 27017, 27018
- SOC: SOC 1, SOC 2, SOC 3
- NIST: NIST800-53, NIST800-171
- DRZ FedRamp Moderate
- Restricciones de ubicación o residencia de datos (guía de configuración para Airflow administrado)
- Assured Workloads
También consulta lo siguiente:
Algunas de las funciones de seguridad mencionadas en este artículo se analizan en la presentación de Airflow Summit 2020: Ejecuta DAG de Airflow de forma segura.