Accede a la interfaz web de Airflow

Airflow administrado (3ª gen.) | Airflow administrado (2ª gen.) | Airflow administrado (1ª gen. heredada)

Apache Airflow incluye una interfaz de usuario web llamada IU de Airflow, que puedes usar para administrar DAG de Airflow, ver registros de ejecución de DAG, supervisar Airflow y realizar acciones administrativas.

Acerca del servidor web de Airflow

Cada entorno de Airflow administrado tiene un servidor web que ejecuta la IU de Airflow. El servidor web es parte de la arquitectura del entorno de Airflow administrado.

Antes de comenzar

  • Debes tener una función que pueda ver los entornos de Airflow administrado. Para obtener más información, consulta Guía de control de acceso.

  • Durante la creación del entorno, Airflow administrado configura la URL del servidor web que ejecuta la IU de Airflow. La URL no se puede personalizar.

  • Airflow administrado (3ª gen.) admite la función de control de acceso a la IU de Airflow (control de acceso basado en funciones de Airflow) para la IU de Airflow.

  • Si la opción Controles de la API > Apps de terceros no configuradas > No permitir que los usuarios accedan a ninguna app de terceros está habilitada en Google Workspace y la app de Apache Airflow en Airflow administrado no está permitida de forma explícita, los usuarios no podrán acceder a la IU de Airflow, a menos que permitan la aplicación de forma explícita. Para permitir el acceso, sigue los pasos que se indican en Permite el acceso a la IU de Airflow en Google Workspace.

  • Si se usan vinculaciones de acceso adaptado al contexto de Chrome Enterprise Premium con niveles de acceso que dependen de los atributos del dispositivo y la app de Apache Airflow en Airflow administrado no está exenta, no es posible acceder a la IU de Airflow debido a un bucle de acceso. Para permitir el acceso, sigue los pasos que se indican en Permite el acceso a la IU de Airflow en vinculaciones de acceso adaptado al contexto.

  • Si las reglas de entrada están configuradas en un perímetro de Controles del servicio de VPC que protege el proyecto y la regla de entrada que permite el acceso al servicio de Airflow administrado usa el tipo de identidad ANY_SERVICE_ACCOUNT o ANY_USER_ACCOUNT, los usuarios no pueden acceder a la IU de Airflow, lo que genera un bucle de acceso. Para obtener más información sobre cómo abordar esta situación, consulta Permite el acceso a la IU de Airflow en las reglas de entrada de los Controles del servicio de VPC.

  • Airflow administrado no admite el uso de identidades de terceros en reglas de entrada y salida para permitir operaciones de la IU de Apache Airflow. Sin embargo, puedes usar el tipo de identidad ANY_IDENTITY en las reglas de entrada y salida para permitir el acceso a todas las identidades, incluidas las identidades de terceros. Para obtener más información sobre el ANY_IDENTITY tipo de identidad, consulta Reglas de entrada y salida.

Accede a la IU de Airflow

En Airflow administrado (3ª gen.), el servidor web de Airflow se ejecuta en el proyecto de usuario de tu entorno. El servidor web se implementa en el dominio composer.googleusercontent.com y proporciona acceso a la IU de Airflow.

Airflow administrado (3ª gen.) proporciona acceso a la interfaz en función de las identidades de usuario y las vinculaciones de políticas de IAM definidas para los usuarios.

Accede a la IU de Airflow desde la Google Cloud console

Para acceder a la IU de Airflow desde la Google Cloud console, sigue estos pasos:

  1. En la Google Cloud console, ve a la página Entornos.

    Ir a Entornos

  2. En la columna Servidor web de Airflow, sigue el vínculo de Airflow para tu entorno.

  3. Accede con una Cuenta de Google que tenga los permisos correspondientes.

Obtén la URL de la IU de Airflow con Google Cloud CLI

Puedes acceder a la IU de Airflow desde cualquier navegador web. Para obtener la URL de la IU de Airflow, ejecuta el siguiente comando en Google Cloud CLI:

gcloud composer environments describe ENVIRONMENT_NAME \
  --location LOCATION

Reemplaza lo siguiente:

  • ENVIRONMENT_NAME: Es el nombre de tu entorno.
  • LOCATION: Es la región en la que se encuentra el entorno.

El comando de Google Cloud CLI muestra las propiedades de un entorno de Airflow administrado, incluidas las URLs de la IU de Airflow. Las URLs aparecen como airflowUri y airflowByoidUri:

config:
  airflowUri: https://example-dot-us-central1.composer.googleusercontent.com
  airflowByoidUri: https://example-dot-us-central1.composer.byoid.googleusercontent.com

Reinicia el servidor web

Cuando depuras o solucionas problemas de entornos de Airflow administrado, puedes resolver algunos problemas si reinicias el servidor web de Airflow. Puedes reiniciar el servidor web con la API de restartWebServer o el comando restart-web-server en Google Cloud CLI:

gcloud composer environments restart-web-server ENVIRONMENT_NAME \
  --location=LOCATION

Reemplaza lo siguiente:

  • ENVIRONMENT_NAME: Es el nombre de tu entorno.
  • LOCATION: Es la región en la que se encuentra el entorno.

Configura el acceso a la red del servidor web

Los parámetros de acceso del servidor web de Airflow no dependen de la configuración de red de tu entorno. En cambio, puedes configurar el acceso al servidor web por separado. Por ejemplo, un entorno de IP privada aún puede tener la IU de Airflow accesible desde Internet.

No es posible configurar los rangos de IP permitidos para que sean direcciones IP privadas.

Console

  1. En la Google Cloud console, ve a la página Entornos.

    Ir a Entornos

  2. En la lista de entornos, haz clic en el nombre de tu entorno. Se abrirá la página Detalles del entorno.

  3. Ve a la pestaña Configuración del entorno.

  4. En la sección Configuración de red, busca el elemento Control de acceso del servidor web y haz clic en Editar.

  5. En el diálogo Control de acceso a la red del servidor web , haz lo siguiente:

    • Para proporcionar acceso al servidor web de Airflow desde todas las direcciones IP, selecciona Permitir acceso desde todas las direcciones IP.

    • Para restringir el acceso solo a rangos de IP específicos, selecciona Permitir el acceso solo desde direcciones IP específicas. En el campo Rango de IP, especifica un rango de IP en la notación CIDR. En el campo Descripción, especifica una descripción opcional para este rango. Si deseas especificar más de un rango, haz clic en Agregar rango de IP.

    • Para prohibir el acceso a todas las direcciones IP, selecciona Permitir el acceso solo desde direcciones IP específicas y haz clic en Borrar elemento junto a la entrada de rango vacía.

gcloud

Cuando actualizas un entorno, los siguientes argumentos controlan los parámetros de acceso del servidor web:

  • --web-server-allow-all proporciona acceso a Airflow desde todas las direcciones IP. Esta es la opción predeterminada.

  • --update-web-server-allow-ip restringe el acceso solo a rangos de IP de origen específicos. Para especificar varios rangos de IP, usa este argumento varias veces.

  • --web-server-deny-all prohíbe el acceso a todas las direcciones IP.

gcloud composer environments update ENVIRONMENT_NAME \
    --location LOCATION \
    --update-web-server-allow-ip ip_range=WS_IP_RANGE,description=WS_RANGE_DESCRIPTION

Reemplaza lo siguiente:

  • ENVIRONMENT_NAME: Es el nombre de tu entorno.
  • LOCATION: Es la región en la que se encuentra el entorno.
  • WS_IP_RANGE: Es el rango de IP, en la notación CIDR, que puede acceder a la IU de Airflow.
  • WS_RANGE_DESCRIPTION: Es la descripción del rango de IP.

Ejemplo:

gcloud composer environments update example-environment \
    --location us-central1 \
    --update-web-server-allow-ip ip_range=192.0.2.0/24,description="example range" \
    --update-web-server-allow-ip ip_range=192.0.4.0/24,description="example range 2"

API

  1. Crea una solicitud a la API de [environments.patch][api-patch].

  2. En esta solicitud, realiza lo siguiente:

    1. En el parámetro updateMask, especifica la máscara config.webServerNetworkAccessControl.

    2. En el cuerpo de la solicitud, especifica cómo se deben guardar los registros de tareas de Airflow:

      • Para proporcionar acceso a Airflow desde todas las direcciones IP, especifica un elemento config vacío (el elemento webServerNetworkAccessControl no debe estar presente).

      • Para restringir el acceso solo a rangos de IP específicos, especifica uno o más rangos en allowedIpRanges.

      • Para prohibir el acceso a todas las direcciones IP, especifica un elemento webServerNetworkAccessControl vacío. El elemento webServerNetworkAccessControl debe estar presente, pero no debe contener un elemento allowedIpRanges.

{
  "config": {
    "webServerNetworkAccessControl": {
      "allowedIpRanges": [
        {
          "value": "WS_IP_RANGE",
          "description": "WS_RANGE_DESCRIPTION"
        }
      ]
    }
  }
}

Reemplaza lo siguiente:

  • WS_IP_RANGE: Es el rango de IP, en la notación CIDR, que puede acceder a la IU de Airflow.
  • WS_RANGE_DESCRIPTION: Es la descripción del rango de IP.

Ejemplo:

// PATCH https://composer.googleapis.com/v1/projects/example-project/
// locations/us-central1/environments/example-environment?updateMask=
// config.webServerNetworkAccessControl

{
  "config": {
    "webServerNetworkAccessControl": {
      "allowedIpRanges": [
        {
          "value": "192.0.2.0/24",
          "description": "example range"
        },
        {
          "value": "192.0.4.0/24",
          "description": "example range 2"
        }
      ]
    }
  }
}

Terraform

En el bloque allowed_ip_range, en el web_server_network_access_control, especifica los rangos de IP que pueden acceder al servidor web.

resource "google_composer_environment" "example" {
  provider = google-beta
  name = "ENVIRONMENT_NAME"
  region = "LOCATION"

  config {

    web_server_network_access_control {

      allowed_ip_range {
        value = "WS_IP_RANGE"
        description = "WS_RANGE_DESCRIPTION"
      }

    }

  }
}

Reemplaza lo siguiente:

  • WS_IP_RANGE: Es el rango de IP, en la notación CIDR, que puede acceder a la IU de Airflow.
  • WS_RANGE_DESCRIPTION: Es la descripción del rango de IP.

Ejemplo:

resource "google_composer_environment" "example" {
  provider = google-beta
  name = "example-environment"
  region = "us-central1"

  config {

    web_server_network_access_control {
      allowed_ip_range {
        value = "192.0.2.0/24"
        description = "example range"
      },
      allowed_ip_range {
        value = "192.0.4.0/24"
        description = "example range 2"
      }

    }
}

¿Qué sigue?