Résoudre les problèmes liés aux mises à jour et aux mises à niveau d'environnement

Managed Airflow (3e génération) | Managed Airflow (2e génération) | Managed Airflow (1re génération héritée)

Cette page fournit des informations de dépannage pour les problèmes que vous pouvez rencontrer lors de la mise à jour ou de la mise à niveau des environnements Managed Service pour Apache Airflow.

Pour en savoir plus sur la création d'environnements, consultez la page Dépannage pour la création d'environnements.

Lorsque les environnements Managed Airflow sont mis à jour, la majorité des problèmes se produisent pour les raisons suivantes :

  • Problèmes d'autorisation de compte de service.
  • Problèmes de dépendance PyPI
  • Taille de la base de données Airflow

Autorisations insuffisantes pour mettre à jour ou mettre à niveau un environnement

Si Managed Airflow ne peut pas mettre à jour ou mettre à niveau un environnement en raison d'autorisations insuffisantes, le message d'erreur suivant s'affiche :

ERROR: (gcloud.composer.environments.update) PERMISSION_DENIED: The caller does not have permission

Solution : Attribuez des rôles à votre compte et au compte de service de votre environnement, comme décrit dans la section Contrôle des accès.

Le compte de service de l'environnement ne dispose pas des autorisations nécessaires

Lors de la création d'un environnement Managed Airflow, vous spécifiez un compte de service qui effectue la plupart des opérations de l'environnement. Si ce compte de service ne dispose pas des autorisations nécessaires pour l'opération demandée, Managed Airflow génère une erreur :

    UPDATE operation on this environment failed 3 minutes ago with the
    following error message:
    Composer Backend timed out. Currently running tasks are [stage:
    CP_COMPOSER_AGENT_RUNNING
    description: "No agent response published."
    response_timestamp {
      seconds: 1618203503
      nanos: 291000000
    }
    ].

Solution : Attribuez des rôles à votre compte Google et au compte de service de votre environnement, comme décrit dans la section Contrôle des accès.

La taille de la base de données Airflow est trop importante pour effectuer l'opération

Une opération de mise à niveau peut échouer car la taille de la base de données Airflow est trop importante.

Si la taille de la base de données Airflow est supérieure à 16 Go, Managed Airflow génère l'erreur suivante :

Airflow database uses more than 16 GB. Please clean the database before upgrading.

Solution : Effectuez le nettoyage de la base de données Airflow, comme décrit dans Nettoyer la base de données Airflow.

Échec de la mise à niveau vers une nouvelle version de Managed Airflow en raison de conflits de packages PyPI

Lorsque vous mettez à niveau un environnement sur lequel des packages PyPI personnalisés sont installés, vous pouvez rencontrer des erreurs liées aux conflits de packages PyPI. Cela peut se produire, car la nouvelle image Managed Service pour Apache Airflow contient des versions ultérieures des packages préinstallés. Cela peut entraîner des conflits de dépendance avec les packages PyPI que vous avez installés dans votre environnement.

Solution:

  • Pour obtenir des informations détaillées sur les conflits de packages, exécutez une vérification de mise à niveau.
  • Assouplissez les contraintes de version pour les packages PyPI personnalisés installés. Par exemple, au lieu de spécifier une version comme ==1.0.1, spécifiez-la comme >=1.0.1.
  • Pour en savoir plus sur la modification des exigences de version pour résoudre les conflits de dépendances, consultez la documentation de pip.

Impossible de mettre à niveau un environnement vers une version encore compatible

Les environnements Managed Airflow ne peuvent être mis à niveau que vers plusieurs versions les plus récentes et précédentes.

Les limites de version pour la création d'environnements et la mise à niveau d'environnements existants sont différentes. La version de Managed Airflow que vous choisissez lors de la création d'un environnement peut ne pas être disponible lors de la mise à niveau d'environnements existants.

Vous pouvez effectuer l'opération de mise à niveau à l'aide de Google Cloud CLI, de l'API ou de Terraform. Dans la Google Cloud console, seules les dernières versions sont disponibles comme choix de mise à niveau.

L'environnement n'est pas sain (échec de la vérification de l'activité)

Il n'est possible de mettre à niveau un environnement que si son état est signalé comme sain.

L'une des causes les plus courantes d'un état non sain est lorsque les composants de l'environnement approchent les limites de ressources configurées et fonctionnent constamment à charge maximale. Étant donné que certains composants d'environnement ne peuvent pas signaler leur état, le DAG de vérification de l'activité signale que l'état de l'environnement n'est pas sain.

Pour résoudre ce problème, nous vous recommandons d'augmenter les limites de ressources. Bien que nous vous recommandions d'empêcher votre environnement d'approcher les limites à tout moment, vous pouvez également le faire uniquement pendant la période de mise à niveau de votre environnement.

Le manque de connectivité au DNS peut entraîner des problèmes lors des mises à niveau ou des mises à jour

Ces problèmes de connectivité peuvent entraîner des entrées de journal comme celle-ci :

WARNING - Compute Engine Metadata server unavailable attempt 1 of 5. Reason: [Errno -3] Temporary failure in name resolution Error

Cela signifie généralement qu'il n'existe pas de route vers le DNS. Assurez-vous donc que le nom DNS metadata.google.internal peut être résolu en adresse IP à partir des réseaux de cluster, de pods et de services. Vérifiez si vous avez activé l'accès privé à Google dans le VPC (dans le projet hôte ou de service) où votre environnement est créé.

Étape suivante