Configurar los Controles del servicio de VPC

Managed Airflow (Gen 3) | Managed Airflow (Gen 2) | Managed Airflow (Legacy Gen 1)

Los Controles del servicio de VPC permiten que las organizaciones definan un perímetro alrededor de los recursos deGoogle Cloud para mitigar los riesgos de robo de datos.

Los entornos de Managed Airflow se pueden implementar dentro de un perímetro de servicio. Cuando configuras tu entorno con los Controles del servicio de VPC, puedes mantener la privacidad de los datos sensibles mientras aprovechas las capacidades de organización de flujos de trabajo completamente administradas de Managed Airflow.

La compatibilidad con los Controles del servicio de VPC para Managed Airflow significa lo siguiente:

  • Ahora se puede seleccionar Managed Airflow como un servicio protegido dentro del perímetro de los Controles del servicio de VPC.
  • Todos los recursos subyacentes que usa Managed Airflow se configuran para admitir la arquitectura de los Controles del servicio de VPC y seguir sus reglas.

Implementar entornos de Managed Airflow con los Controles del servicio de VPC te proporciona lo siguiente:

  • Reducción del riesgo de robo de datos
  • Protección contra la exposición de datos debido a controles de acceso mal configurados
  • Reducción del riesgo de que usuarios maliciosos copien datos a recursos no autorizados deGoogle Cloud , o ante atacantes externos que acceden a recursos deGoogle Cloud desde Internet.

Acerca de los Controles del servicio de VPC en Managed Airflow

Crea entornos en un perímetro

Sigue estos pasos para implementar Managed Airflow dentro de un perímetro:

  1. Habilita la API de Access Context Manager y la API de Cloud Composer para tu proyecto. Consulta Habilita API para obtener referencia.

  2. Asegúrate de que tu perímetro de servicio tenga los siguientes servicios accesibles de VPC. De lo contrario, es posible que no se cree tu entorno:

    • API de Cloud Composer (composer.googleapis.com)
    • API de Compute Engine (compute.googleapis.com)
    • API de Kubernetes Engine (container.googleapis.com)
    • API de Container Registry (containerregistry.googleapis.com)
    • API de Artifact Registry (artifactregistry.googleapis.com)
    • API de Cloud Storage (storage.googleapis.com)
    • API de Cloud SQL Admin (sqladmin.googleapis.com)
    • API de Cloud Logging (logging.googleapis.com)
    • API de Cloud Monitoring (monitoring.googleapis.com)
    • API de Cloud Pub/Sub (pubsub.googleapis.com)
    • API del servicio de token de seguridad (sts.googleapis.com)
    • API de Cloud Resource Manager (cloudresourcemanager.googleapis.com)
    • API de Directorio de servicios (servicedirectory.googleapis.com)
    • API de Cloud Key Management Service (cloudkms.googleapis.com), si usas claves de Cloud KMS o CMEK
    • API de Secret Manager (secretmanager.googleapis.com), si usas Secret Manager como backend de secretos
  3. Crea un entorno de Managed Airflow nuevo:

    • La IP privada debe estar habilitada. Ten en cuenta que esta configuración debe establecerse durante la creación del entorno.

    • Recuerda configurar el acceso al servidor web de Airflow. Para mejorar la protección, solo permite el acceso al servidor web desde rangos de IP específicos. Para obtener más información, consulta Configura el acceso a la red del servidor web.

  4. De forma predeterminada, solo se permite el acceso a la IU y la API de Airflow desde el perímetro de seguridad. Si quieres que esté disponible fuera del perímetro de seguridad, configura niveles de acceso o reglas de entrada y salida.

Agrega un entorno existente al perímetro

Puedes agregar el proyecto que contiene tu entorno a un perímetro si se cumplen las siguientes condiciones:

Instala paquetes de PyPI en los Controles del servicio de VPC

En la configuración predeterminada de los Controles del servicio de VPC, Managed Airflow solo admite la instalación de paquetes de PyPI desde repositorios privados a los que se puede acceder desde el espacio de direcciones IP internas de la red de VPC.

De forma predeterminada, todos los entornos de Managed Airflow dentro de un perímetro de Controles del servicio de VPC no tienen acceso a los repositorios públicos de PyPI.

Instala desde un repositorio privado

La configuración recomendada es configurar un repositorio privado de PyPI:

  1. Propágalo con los paquetes aprobados que usa tu organización y, luego, configura Managed Airflow para instalar dependencias de Python desde un repositorio privado.

  2. Otorga permisos adicionales para instalar paquetes desde repositorios privados a la cuenta de servicio de tu entorno, como se describe en Control de acceso.

Instala desde un repositorio público

Repositorio remoto

Este es el enfoque recomendado para instalar paquetes desde un repositorio público.

Para instalar paquetes de PyPI desde repositorios fuera del espacio de IP privada, sigue estos pasos:

  1. Crea un repositorio remoto de Artifact Registry.
  2. Otorga a este repositorio acceso a las fuentes upstream.
  3. Configura Airflow para instalar paquetes desde un repositorio de Artifact Registry.
  4. Otorga permisos adicionales para instalar paquetes desde repositorios de Artifact Registry en la cuenta de servicio de tu entorno, como se describe en Control de acceso.

Conexiones externas

Para instalar paquetes de PyPI desde repositorios fuera del espacio de IP privada, sigue estos pasos:

  1. Configura Cloud NAT para permitir que Managed Airflow se ejecute en el espacio de IP privada y se conecte con repositorios externos de PyPI.

  2. Configura tus reglas de firewall para permitir conexiones salientes desde el clúster de Composer al repositorio.

Configura la conectividad a los servicios y las APIs de Google

En una configuración de Controles del servicio de VPC, para controlar el tráfico de red, configura el acceso a las APIs y los servicios de Google a través de restricted.googleapis.com. Este dominio bloquea el acceso a las APIs y los servicios de Google que no son compatibles con los Controles del servicio de VPC.

Los entornos de Managed Airflow usan los siguientes dominios:

  • *.googleapis.com se usa para acceder a otros servicios de Google.

  • *.composer.cloud.google.com se usa para que el servidor web de Airflow de tu entorno sea accesible. Esta regla se debe aplicar antes de crear un entorno.

    • Como alternativa, puedes crear una regla para una región específica. Para ello, usa REGION.composer.cloud.google.com. Reemplaza REGION por la región en la que se encuentra el entorno, por ejemplo, us-central1.
  • (Opcional) Se usa *.composer.googleusercontent.com cuando se accede al servidor web de Airflow de tu entorno. Esta regla solo es necesaria si accedes al servidor web de Airflow desde una instancia que se ejecuta en la red de VPC y no es necesaria en otros casos. Un caso de uso común para esta regla es cuando deseas llamar a la API de REST de Airflow desde la red de VPC.

    • Como alternativa, puedes crear una regla para un entorno específico. Para ello, usa ENVIRONMENT_WEB_SERVER_NAME.composer.googleusercontent.com. Reemplaza ENVIRONMENT_WEB_SERVER_NAME por la parte única de la URL de la IU de Airflow de tu entorno, por ejemplo, bffe6ce6c4304c55acca0e57be23128c-dot-us-central1.
  • *.pkg.dev se usa para obtener imágenes del entorno, por ejemplo, cuando se crea o actualiza un entorno.

  • *.gcr.io GKE requiere conectividad con el dominio de Container Registry, independientemente de la versión de Managed Airflow.

Configura la conectividad con el extremo restricted.googleapis.com.

Dominio Nombre de DNS Registro CNAME Registro A
*.googleapis.com googleapis.com. Nombre de DNS: *.googleapis.com.
Tipo de registro de recurso: CNAME
Nombre canónico: googleapis.com.
Tipo de registro de recurso: A
Direcciones IPv4: 199.36.153.4, 199.36.153.5, 199.36.153.6, 199.36.153.7
*.composer.cloud.google.com composer.cloud.google.com. Nombre de DNS: *.composer.cloud.google.com.
Tipo de registro de recurso: CNAME
Nombre canónico: composer.cloud.google.com.
Tipo de registro de recurso: A
Direcciones IPv4: 199.36.153.4, 199.36.153.5, 199.36.153.6, 199.36.153.7
*.composer.googleusercontent.com
(opcional; consulta la descripción)
composer.googleusercontent.com. Nombre de DNS: *.composer.googleusercontent.com.
Tipo de registro de recurso: CNAME
Nombre canónico: composer.googleusercontent.com.
Tipo de registro de recurso: A
Direcciones IPv4: 199.36.153.4, 199.36.153.5, 199.36.153.6, 199.36.153.7
*.pkg.dev pkg.dev. Nombre de DNS: *.pkg.dev.
Tipo de registro de recurso: CNAME
Nombre canónico: pkg.dev.
Tipo de registro de recurso: A
Direcciones IPv4: 199.36.153.4, 199.36.153.5, 199.36.153.6, 199.36.153.7
*.gcr.io gcr.io. Nombre de DNS: *.gcr.io.
Tipo de registro de recurso: CNAME
Nombre canónico: gcr.io.
Tipo de registro de recurso: A
Direcciones IPv4: 199.36.153.4, 199.36.153.5, 199.36.153.6, 199.36.153.7

Para crear una regla de DNS, haz lo siguiente:

  1. Crea una zona de DNS nueva y usa Nombre de DNS como el nombre de DNS de esta zona.

    Ejemplo: pkg.dev.

  2. Agrega un conjunto de registros para el registro CNAME.

    Ejemplo:

    • Nombre de DNS: *.pkg.dev.
    • Tipo de registro de recursos: CNAME
    • Nombre canónico: pkg.dev.
  3. Agrega un conjunto de registros con el registro A:

    Ejemplo:

    • Tipo de registro de recursos: A
    • Direcciones IPv4: 199.36.153.4, 199.36.153.5, 199.36.153.6, 199.36.153.7

Para obtener más información, consulta Configura una conectividad privada a los servicios y las APIs de Google.

Configura reglas de firewall

Si tu proyecto tiene reglas de firewall no predeterminadas, como reglas que anulan las reglas de firewall implícitas o modifican las reglas propagadas previamente en la red predeterminada, verifica que estén configuradas las siguientes reglas de firewall.

Por ejemplo, es posible que Managed Airflow no pueda crear un entorno si tienes una regla de firewall que rechaza todo el tráfico de salida. Para evitar problemas, define reglas allow selectivas que sigan la lista y tengan mayor prioridad que la regla deny global.

Configura tu red de VPC para permitir el tráfico desde tu entorno:

Descripción Dirección Acción Origen o destino Protocolos Puertos
DNS

Configura como se describe en Compatibilidad con los Controles del servicio de VPC para Cloud DNS
- - - - -
Servicios y APIs de Google Salida Permitir Direcciones IPv4 de restricted.googleapis.com que usas para los servicios y las APIs de Google. TCP 443
Nodos del clúster del entorno Salida Permitir Rango de direcciones IP principal de la subred del entorno TCP, UDP todos
Pods del clúster del entorno Salida Permitir Rango de direcciones IP secundario para los Pods en la subred del entorno TCP, UDP todos
Plano de control del clúster del entorno Salida Permitir Rango de IP del plano de control de GKE TCP, UDP todos
(Si tu entorno usa Private Service Connect) Subred de conexión Salida Permitir Rango de subred de conexión de Managed Airflow TCP 3306, 3307, 19090
(Si tu entorno usa intercambios de tráfico entre VPC) Red de arrendatario Salida Permitir Rango de IP de la red de usuarios de Managed Airflow TCP 3306, 3307, 19090

Para obtener los rangos de IP del clúster de entorno, haz lo siguiente:

  • Los rangos de direcciones de Pod, Service y plano de control están disponibles en la página Clústeres del clúster de tu entorno:

    1. En la consola de Google Cloud , ve a la página Entornos.

      Ir a Entornos

    2. En la lista de entornos, haz clic en el nombre de tu entorno. Se abrirá la página Detalles del entorno.

    3. Ve a la pestaña Configuración del entorno.

    4. Sigue el vínculo Ver detalles del clúster.

  • Puedes ver el rango de IP de la red del arrendatario de Managed Airflow del entorno en la pestaña Configuración del entorno.

  • Puedes ver el ID de la subred del entorno y el ID de la subred de conexión de Managed Airflow en la pestaña Configuración del entorno. Para obtener los rangos de IP de una subred, ve a la página Redes de VPC y haz clic en el nombre de la red para ver los detalles:

    Ir a Redes de VPC

Registros de los Controles del servicio de VPC

Cuando solucionas problemas relacionados con la creación de entornos, puedes analizar los registros de auditoría que generan los Controles del servicio de VPC.

Además de otros mensajes de registro, puedes consultar los registros para obtener información sobre las cuentas de servicio cloud-airflow-prod@system.gserviceaccount.com y service-PROJECT_ID@cloudcomposer-accounts.iam.gserviceaccount.com que configuran los componentes de tus entornos.

El servicio de Managed Airflow usa la cuenta de servicio cloud-airflow-prod@system.gserviceaccount.com para administrar los componentes del proyecto de usuario de tus entornos.

La cuenta de servicio service-PROJECT_ID@cloudcomposer-accounts.iam.gserviceaccount.com, también conocida como cuenta de servicio del agente de servicio de Composer, administra los componentes del entorno en los proyectos host y de servicio.

¿Qué sigue?