Managed Airflow(第 3 代) | Managed Airflow(第 2 代) | Managed Airflow(旧版第 1 代)
本页面介绍了如何将环境升级到新的 Airflow 版本。
升级操作简介
在 Managed Airflow(第 3 代)中,您 无法管理环境的 Managed Airflow 版本 :
- Managed Airflow 会自动升级环境的基础架构组件。这些组件与 Managed Airflow 功能相关,不会改变 Airflow 的工作方式或 Airflow DAG 的执行方式。
- Managed Airflow 不会自动升级 Airflow 版本和 build、Airflow 组件或与 Airflow 工作负载密切相关的组件。当基础架构组件自动升级时,这些组件不会发生变化。
- 您可以手动升级到新的 Airflow 版本或 build。
例如,您可以连续几个月使用相同版本的 Airflow,而不执行任何升级,您的环境仍然会收到环境基础架构组件的最新 Managed Airflow 更新、修复和改进。当您稍后决定迁移到新版本的 Airflow 时,您可以在环境中升级 Airflow 版本。
Airflow 版本升级简介
您的环境会通过以下方式更改 Airflow 的版本或 build :
您可以控制环境的 Airflow 版本(和 build)。当您选择将环境切换到其他版本的 Airflow 时,可以执行 Airflow 版本升级操作。例如,如果当前版本的 Airflow 不再受支持,可能会发生这种情况。
Managed Airflow 使用指定的 Airflow 版本和 build 重新部署环境的 Airflow 组件 。
如果您的环境在升级之前有自定义 PyPI 软件包或 Airflow 配置选项替换项,Managed Airflow 会应用 Airflow 配置更改。
Managed Airflow 会更新 Airflow
airflow_db连接,使其指向新的 Cloud SQL 数据库。
更改 Airflow 版本不会改变您连接环境资源的方式,例如环境存储桶的网址或 Airflow Web 服务器。
自动基础架构升级操作简介
Managed Airflow 会定期运行 自动基础架构升级操作:
自动基础架构升级操作会在为环境指定的 维护期内定期运行。
无法在 Managed Airflow(第 3 代)中停用自动基础架构升级。您可以为环境指定自定义维护期,以控制可以运行自动升级的时间段。
此操作在 Google Cloud 控制台和 环境的日志中可见,就像任何其他长时间运行的操作一样。在操作运行时,您无法在环境级层启动其他操作(但您仍然可以运行 Airflow DAG)。
在某些情况下,自动基础架构升级可以重启 Airflow 组件。在此类重启期间,Airflow 工作器会在 24 小时的宽限期内正常终止。如果您有需要超过 24 小时才能完成的任务,请考虑使用可延期的运算符。 升级可能会导致环境的基础架构组件(例如环境监控)在短时间内不可用。
升级操作的限制
升级操作存在以下限制:
Managed Airflow 版本会在几天内逐步向 Managed Airflow 支持的所有区域推出。正在进行的版本中的最新版本可能尚未在您所在的区域推出。
您无法降级到早期版本的 Airflow。
如果 Airflow 数据库包含的数据超过 20 GB,则无法升级环境。升级期间,如果 Airflow 数据库大小超过 20 GB,则会显示警告。在这种情况下,请执行数据库维护以减小 数据库大小。
如果您使用 XCom 机制传输文件,请确保您 按照 Airflow 的准则使用该机制。 使用 XCom 传输大型文件或大量文件会影响 Airflow 数据库的性能,并可能导致在加载快照或升级环境时失败。请考虑使用 Cloud Storage 等替代方案来传输大量数据。
准备工作
我们建议您为 环境创建一个新快照,以便在需要时重新创建环境。
您的账号必须具有可以触发环境升级操作的角色。此外,环境的服务帐号必须具有拥有足够权限来执行升级操作的角色。如需了解更多 信息,请参阅访问权限控制。
检查环境是否为最新版本
当环境的 Airflow build 接近其支持终止日期时,Managed Airflow 会显示警告。您可以使用这些警告来确保环境始终受到 支持。
Managed Airflow 会跟踪环境所基于的 Airflow 版本和 build 。当环境接近支持终止日期时,您会在环境列表和 环境详情 页面上看到警告。
如需检查环境是否为最新版本,请执行以下操作:
控制台
在 Google Cloud 控制台中,前往环境 页面。
在环境列表中,点击您的环境名称。环境详情 页面会打开。
转到环境配置 标签页。
在 映像版本 字段中会显示以下消息之一:
最新可用版本。环境映像受到完全支持。
有新版本。环境映像受到完全支持,您可以将其升级到更高版本。
对此映像版本的支持将于...结束 环境映像接近完全支持终止日期。
从...起,此版本将不再受支持环境已超出完全支持期限。
gcloud
此功能无法通过 Google Cloud CLI 使用。您可以改为查看 建议的升级,其中会显示可用的新版本 。
API
此功能无法通过 API 使用。您可以改为查看 建议的升级,其中会显示可用的新版本 。
查看建议的升级
Managed Airflow 提供了一个 Airflow build 列表,您可以将环境升级到这些 build。
如需查看建议升级的 Managed Airflow 版本,请执行以下操作:
控制台
在 Google Cloud 控制台中,前往环境 页面。
在环境列表中,点击您的环境名称。环境详情 页面会打开。
转到环境配置 标签页,然后点击升级映像版本 。
如需查看建议的版本列表,请点击 Managed Airflow 映像版本 下拉菜单。
gcloud
gcloud composer environments list-upgrades \
ENVIRONMENT_NAME \
--location LOCATION
替换:
ENVIRONMENT_NAME替换为环境的名称。LOCATION替换为环境所在的区域。
示例:
gcloud composer environments list-upgrades example-environment \
--location us-central1
API
您可以查看某个位置的可用版本。为此,请构建 an
imageVersions.list API 请求。
例如:
// GET https://composer.googleapis.com/v1/projects/example-project/
// locations/us-central1/imageVersions
检查是否存在 PyPI 软件包冲突
您可以检查环境中安装的 PyPI 软件包是否与新 Airflow 版本或 build 中预安装的软件包发生冲突。
成功的检查意味着当前版本和指定版本之间没有 PyPI 软件包依赖项冲突。但是,升级操作仍然可能由于其他原因而不成功。
控制台
如需为您的环境运行升级检查,请执行以下操作:
在 Google Cloud 控制台中,前往环境 页面。
在环境列表中,点击您的环境名称。环境详情 页面会打开。
转到环境配置 标签页,找到映像版本 条目后,点击升级 。
在环境版本升级 对话框的新版本 下拉列表中,选择您要升级到的 Airflow 版本或 build。
在 PyPI 软件包兼容性 部分,点击检查是否存在冲突 。
等待检查完成。如果存在 PyPI 软件包依赖项冲突,则显示的错误消息包含有关冲突软件版包和软件包版本的详细信息。
gcloud
如需为您的环境运行升级检查,请使用您要升级到的
Airflow 版本或 build
运行
environments check-upgrade
命令。
gcloud composer environments check-upgrade \
ENVIRONMENT_NAME \
--location LOCATION \
--airflow-version VERSION
替换:
ENVIRONMENT_NAME替换为环境的名称。LOCATION替换为环境所在的区域。VERSION替换为您要升级到的新 Airflow 版本和 build,格式为airflow-x.y.z-build.t。您可以使用所有版本别名。
示例:
gcloud composer environments check-upgrade example-environment \
--location us-central1 \
--airflow-version airflow-2.11.1-build.5
输出示例:
Waiting for [projects/example-project/locations/us-central1/environments/
example-environment] to be checked for PyPI package conflicts when upgrading
to composer-3-airflow-2.11.1-build.5. Operation [projects/example-project/locations/
us-central1/operations/04d0e8b2-...]...done.
...
Response:
'@type': type.googleapis.com/
google.cloud.orchestration.airflow.service.v1.CheckUpgradeResponse
buildLogUri: ...
containsPypiModulesConflict: CONFLICT
pypiConflictBuildLogExtract: |-
The Cloud Build image build failed: Build failed; check build logs for
details. Full log can be found at ...
Error details: tensorboard 2.2.2 has requirement
setuptools>=41.0.0, but you have setuptools 40.3.0.
或者,您也可以异步运行升级检查。使用 --async 参数进行异步调用,然后使用 gcloud composer operations describe 命令检查结果。
API
构建 environments.checkUpgrade API
请求。
在 imageVersion 字段中指定映像版本:
{
"imageVersion": "VERSION"
}
将 VERSION 替换为您要升级到的新版本,格式为
composer-3-airflow-x.y.z-build.t。
检查是否存在与 Managed Airflow(第 3 代)的冲突
Managed Airflow(第 3 代)是 Managed Airflow 的最新主要版本。您可以使用升级检查来检查 Managed Airflow(第 2 代)环境是否可以升级到 Managed Airflow(第 3 代)。以下说明适用于 Managed Airflow(第 2 代)环境 。
虽然无法将环境从 Managed Airflow(第 2 代)就地迁移到 Managed Airflow(第 3 代),但您可以使用升级检查来检查是否存在兼容性问题。我们建议您在迁移到 Managed Airflow (第 3 代)之前执行此操作。
如需检查与 Managed Airflow(第 3 代)的兼容性,请对 Managed Airflow(第 2 代)环境进行常规升级检查,并将 Managed Airflow(第 3 代)版本指定为目标。
每个报告的冲突都可以具有以下类型:
BLOCKING冲突报告了 Managed Airflow(第 3 代)不支持的不兼容环境配置元素。我们建议您在开始迁移到 Managed Airflow(第 3 代)之前解决这些冲突。NON_BLOCKING冲突报告了 Managed Airflow(第 3 代)中不同的环境配置元素,这些元素可能会导致意外行为。例如,默认维护期等默认值的更改会报告为非阻塞冲突。我们建议您在开始迁移过程之前检查这些冲突是否会导致问题。PyPI 软件包冲突也会作为此检查的一部分进行报告。它们与配置冲突分开报告,与常规 PyPI 软件包兼容性检查的方式相同。
控制台
如需检查与 Managed Airflow(第 3 代)的兼容性,请使用 gcloud CLI 或 Cloud Composer API。 Google Cloud 控制台仅支持检查 PyPI 软件包兼容性。
gcloud
如需检查与 Managed Airflow(第 3 代)的兼容性,请运行
environments check-upgrade
命令,并将 Managed Airflow(第 3 代)版本指定为目标。
gcloud composer environments check-upgrade \
ENVIRONMENT_NAME \
--location LOCATION \
--image-version COMPOSER_3_VERSION
替换:
ENVIRONMENT_NAME替换为环境的名称。LOCATION替换为环境所在的区域。COMPOSER_3_VERSION替换为您要升级到的 Airflow 版本和 build,格式为airflow-x.y.z-build.t。您可以使用所有 版本别名。
示例:
gcloud composer environments check-upgrade example-environment \
--location us-central1 \
--image-version composer-3-airflow-2
冲突消息示例:
...
- message: Error validating property [core]unit_test_mode. Overriding [core]
unit_test_mode is not permitted.
type: BLOCKING
- message: Environment variables [GOOGLE_CLOUD_PROJECT] may not be overridden.
type: BLOCKING
- message: You have to specify Worker CPUs to be 0.5, 1.0 or multiples of 2.0.
type: BLOCKING
- message: The environment uses a default maintenance window, which is
different in Composer 2 and Composer 3. Unless set to a custom value, the
maintenance window will be changed to a new default after the upgrade.
type: NON_BLOCKING
...
或者,您也可以异步运行此检查。使用
--async 参数进行异步调用,然后使用
gcloud composer operations describe
命令检查结果。
API
构建 environments.checkUpgrade API
请求。
在 imageVersion 字段中指定映像版本:
{
"imageVersion": "COMPOSER_3_VERSION"
}
将 COMPOSER_3_VERSION 替换为您要升级到的 Airflow 版本和 build
,格式为 airflow-x.y.z-build.t。您可以使用所有版本别名。
升级环境
如需将环境 升级到新的 Airflow 版本或 build,请执行以下操作:
控制台
在 Google Cloud 控制台中,前往环境 页面。
在环境列表中,点击您的环境名称。环境详情 页面会打开。
转到环境配置 标签页。
找到映像版本 条目,然后点击升级 。
从映像版本 下拉菜单中,选择您要升级到的 Airflow 版本或 build。
点击升级 。
gcloud
gcloud composer environments update \
ENVIRONMENT_NAME \
--location LOCATION \
--airflow-version VERSION
替换:
ENVIRONMENT_NAME替换为环境的名称。LOCATION替换为环境所在的区域。VERSION替换为您要升级到的新 Airflow 版本和 build,格式为airflow-x.y.z-build.t。您还可以使用所有 版本别名。
例如:
gcloud composer environments update
example-environment \
--location us-central1 \
--airflow-version airflow-2.11.1-build.5
API
构建
environments.patchAPI 请求。在此请求中:
在
updateMask参数中,指定config.softwareConfig.imageVersion掩码。在请求正文的
imageVersion字段中,指定您要升级到的新版本。
例如:
// PATCH https://composer.googleapis.com/v1/projects/example-project/
// locations/us-central1/environments/example-environment?updateMask=
// config.softwareConfig.imageVersion
{
"config": {
"softwareConfig": {
"imageVersion": "composer-3-airflow-2.11.1-build.5"
}
}
}
Terraform
image_version 块中的 config.software_config 字段控制环境的 Airflow 版本和 build。在此字段中,指定新的 Airflow 版本和 build。
resource "google_composer_environment" "example" {
provider = google-beta
name = "ENVIRONMENT_NAME"
region = "LOCATION"
config {
software_config {
image_version = "VERSION"
}
}
}
替换:
ENVIRONMENT_NAME替换为环境的名称。LOCATION替换为环境所在的区域。 您要升级到的新 Airflow 版本和 build,格式为airflow-x.y.z-build.t。您还可以使用所有 版本别名。
示例:
resource "google_composer_environment" "example" {
provider = google-beta
name = "example-environment"
region = "us-central1"
config {
software_config {
image_version = "airflow-2.11.1-build.5"
}
}
}