Managed Airflow (Gen 3) | Managed Airflow (Gen 2) | Managed Airflow (Legacy Gen 1)
Halaman ini menjelaskan cara menyimpan dan memuat status lingkungan Anda menggunakan snapshot lingkungan.
Anda dapat mengonfigurasi lingkungan untuk menyimpan snapshot secara otomatis. Untuk informasi selengkapnya, lihat Mengonfigurasi snapshot terjadwal.
Tentang snapshot lingkungan
Snapshot lingkungan menyimpan status lingkungan Anda. Anda dapat menyimpan dan memuat snapshot lingkungan sesuai permintaan.
Anda dapat menggunakan snapshot untuk:
- Migrasikan lingkungan Anda ke versi utama Managed Airflow atau Airflow yang lebih baru.
Cara snapshot disimpan
Snapshot lingkungan adalah sekumpulan file yang menjelaskan status lingkungan Anda dan menyimpan cadangan data lingkungan.
Anda dapat membuat beberapa snapshot lingkungan Anda. Snapshot lingkungan bersifat non-inkremental. Anda dapat menggunakan snapshot apa pun secara terpisah dari snapshot lainnya.
Managed Airflow tidak menghapus snapshot saat Anda menghapus lingkungan.
Secara default, Managed Airflow menyimpan snapshot di folder snapshots/
dalam bucket lingkungan Anda. Anda juga dapat menentukan lokasi kustom
saat membuat snapshot.
Meskipun UI Cloud Storage menampilkan data sebagai folder untuk memudahkan, bucket berfungsi dalam struktur file datar. Hal ini tidak mengubah cara Anda bekerja dengan menyimpan dan memuat snapshot di konsol Google Cloud , tetapi perlu diingat saat Anda melakukan operasi langsung pada file di bucket. Untuk mengetahui informasi selengkapnya, lihat Namespace objek.
Pertimbangan keamanan untuk snapshot
Untuk mengurangi risiko keamanan ini, Anda dapat menyimpan informasi sensitif yang digunakan oleh DAG Airflow, seperti kunci atau sandi, di Secret Manager. Untuk mengetahui informasi selengkapnya, lihat Mengonfigurasi Secret Manager untuk lingkungan Anda.
Pastikan untuk memeriksa izin keamanan bucket lingkungan Anda. Jika Anda menyimpan snapshot lingkungan di bucket kustom, pastikan izin akses untuk bucket tersebut dikonfigurasi dengan benar di project Anda. Saat menetapkan izin, pastikan akun layanan memiliki izin yang cukup untuk menyimpan dan memuat snapshot dari bucket.
Data yang disimpan dalam snapshot
Managed Airflow menyimpan data berikut dalam snapshot:
- Penggantian konfigurasi Airflow.
- Variabel lingkungan.
- Daftar paket PyPI kustom, sebagai persyaratan.
- Pencadangan database Airflow, termasuk status tugas yang dijalankan, dan histori eksekusi DAG.
- Cadangan folder
/dags,/data, dan/pluginsdari bucket lingkungan. - Kunci fernet lingkungan.
- Informasi lain tentang konfigurasi lingkungan, seperti parameter performa dan skala lingkungan. Managed Airflow tidak menggunakan informasi ini saat memuat snapshot.
Data yang dimuat dari snapshot
Managed Airflow memuat data berikut dari snapshot:
- Penggantian konfigurasi Airflow.
- Variabel lingkungan.
Paket PyPI kustom (kecuali jika Anda memilih untuk melewati penginstalannya).
Isi database Airflow, termasuk status tugas yang dijalankan, dan histori eksekusi DAG.
Konten folder
/dags,/data, dan/pluginsdari snapshot dimuat ke dalam bucket lingkungan.Kunci fernet dari snapshot digunakan untuk mengenkripsi ulang data dari snapshot dengan kunci fernet lingkungan itu sendiri. Kunci fernet lingkungan tetap tidak berubah.
Meskipun Managed Airflow menyimpan beberapa informasi tentang konfigurasi lingkungan dalam snapshot, informasi tersebut tidak digunakan saat memuat snapshot. Parameter lingkungan berikut tidak berubah saat Anda memuat snapshot:
- Konfigurasi lingkungan, seperti skala dan parameter performa lingkungan.
- Konfigurasi jaringan lingkungan.
- Konten bucket lingkungan di luar folder
/dags,/data, dan/plugins. - Label lingkungan.
Setelan apa pun yang Anda terapkan di infrastruktur Managed Airflow tanpa menggunakan Cloud Composer API dapat hilang saat Anda memuat snapshot.
Tentang operasi yang selesai sebagian
Saat Anda memuat snapshot, operasi dapat berhasil, gagal, atau selesai sebagian:
- Operasi yang berhasil memuat semua data dari snapshot.
- Operasi yang gagal tidak akan menimbulkan perubahan apa pun.
- Operasi yang selesai sebagian memuat subset data dari snapshot. Operasi tersebut dilaporkan sebagai gagal, tetapi pesan error menunjukkan data mana yang berhasil dimuat. Misalnya, jika paket PyPI diinstal, tetapi penggantian opsi konfigurasi Airflow tidak berhasil, pesan error akan menunjukkan hal ini.
Untuk operasi yang selesai sebagian, Anda dapat mencoba memuat snapshot yang sama lagi. Managed Airflow akan melewati langkah-langkah yang berhasil pada upaya sebelumnya. Misalnya, jika operasi gagal karena waktu tunggu habis, tetapi database berhasil dimuat, maka upaya berikutnya tidak akan memuat database lagi.
Sebelum memulai
- Di Managed Airflow (Gen 1 Lama), Anda hanya dapat menyimpan snapshot, tetapi tidak dapat memuatnya. Anda dapat memuat snapshot dari lingkungan Managed Airflow (Gen 1 Lama) ke lingkungan Managed Airflow (Gen 2).
Snapshot didukung di Managed Airflow (Gen 2) versi 2.0.9 dan yang lebih baru. Managed Airflow (Gen 1 Lama) mendukung penyimpanan snapshot lingkungan di versi 1.18.5 dan yang lebih baru.
Snapshot tidak membuat lingkungan. Jika Anda ingin memuat snapshot dari satu lingkungan ke lingkungan lain, Anda harus membuat lingkungan baru terlebih dahulu, lalu memuat snapshot ke lingkungan tersebut.
Anda tidak dapat memuat snapshot ke lingkungan yang dalam status error. Lingkungan seperti ini tidak dapat diperbaiki dengan memuat snapshot. Anda tetap dapat memuat snapshot yang ada ke lingkungan baru.
Ukuran maksimum database Airflow yang mendukung snapshot adalah 20 GB. Jika database lingkungan Anda berukuran lebih dari 20 GB, kurangi ukuran database Airflow sebelum menyimpan snapshot.
Jumlah total objek dalam folder
/dags,/plugins,dan/datadi bucket lingkungan harus kurang dari 100.000 untuk membuat snapshot.Jika Anda menggunakan mekanisme XCom untuk mentransfer file, pastikan Anda menggunakannya sesuai dengan panduan Airflow. Mentransfer file besar atau sejumlah besar file menggunakan XCom akan memengaruhi performa database Airflow dan dapat menyebabkan kegagalan saat memuat snapshot atau mengupgrade lingkungan Anda. Pertimbangkan untuk menggunakan alternatif seperti Cloud Storage untuk mentransfer data dalam volume besar.
Panjang maksimum nama objek di bucket lingkungan tidak boleh lebih dari 1.024 simbol. Jika tidak, snapshot tidak dapat dibuat.
Jika Anda menyimpan snapshot di lokasi di luar bucket lingkungan, akun layanan lingkungan Anda harus memiliki izin baca dan tulis untuk lokasi yang ditentukan. Misalnya, peran Storage Object Admin memiliki izin tersebut. Anda dapat menerapkannya ke project atau bucket tertentu.
Membuat dan menyimpan snapshot akan menghasilkan biaya tambahan, yang terkait dengan Cloud Storage. Untuk mengetahui informasi selengkapnya, lihat Harga.
Menyimpan snapshot lingkungan
Managed Airflow menyimpan snapshot lingkungan dalam
subfolder, relatif terhadap folder yang Anda tentukan.
Nama folder berisi ID project, lokasi lingkungan, nama lingkungan, dan stempel waktu saat snapshot disimpan. Contoh: /snapshots/example-project_us-central1_example-environment_2022-01-05T18-59-00.
Konsol
Untuk membuat snapshot lingkungan Anda:
Di konsol Google Cloud , buka halaman Environments.
Dalam daftar lingkungan, klik nama lingkungan Anda. Halaman Environment details akan terbuka.
Klik Simpan snapshot.
Pada dialog Simpan snapshot, pilih tempat penyimpanan snapshot:
Untuk menyimpan snapshot di folder
/snapshotsdalam bucket lingkungan, pilih Gunakan folder snapshot di bucket lingkungan (default).Untuk menyimpan snapshot di folder kustom, pilih Gunakan folder kustom di bucket lain, lalu tentukan lokasi.
Klik Simpan.
gcloud
Perintah gcloud composer environments snapshots save menyimpan snapshot lingkungan Anda.
- Argumen
snapshot-locationmenentukan folder tempat snapshot disimpan. Secara default, snapshot disimpan di folder/snapshotsdi bucket lingkungan Anda. Contohnya,gs://us-central1-example-916807e1-bucket/snapshots. Anda juga dapat menentukan folder lain.
Untuk menyimpan snapshot lingkungan Anda, jalankan:
gcloud composer environments snapshots save \
ENVIRONMENT_NAME \
--location LOCATION \
--snapshot-location "SNAPSHOTS_FOLDER"
Ganti:
ENVIRONMENT_NAMEdengan nama lingkungan.LOCATIONdengan region tempat lingkungan berada.- (Opsional)
SNAPSHOTS_FOLDERdengan URI folder bucket tempat menyimpan snapshot. Jika Anda menghapus argumen ini, Managed Airflow akan menyimpan snapshot di folder/snapshotsdalam bucket lingkungan Anda.
Contoh berikut menggunakan lokasi default:
gcloud composer environments snapshots save \
example-environment \
--location us-central1
Contoh berikut menyimpan ke folder kustom:
gcloud composer environments snapshots save \
example-environment \
--location us-central1 \
--snapshot-location "gs://example-bucket/environment_snapshots"
API
Buat permintaan API
environments.saveSnapshot.Di isi permintaan, di kolom
snapshotLocation, tentukan folder tempat Anda ingin menyimpan snapshot.
{
"snapshotLocation": "SNAPSHOTS_FOLDER"
}
Ganti:
SNAPSHOTS_FOLDERdengan URI folder bucket tempat menyimpan snapshot.
Contoh:
// POST https://composer.googleapis.com/v1/projects/example-project/
// locations/us-central1/environments/example-environment:saveSnapshot
{
"snapshotLocation": "gs://us-central1-example-916807e1-bucket/snapshots"
}
Terraform
Snapshot lingkungan tidak dapat disimpan dan dimuat dari Terraform.
Menyimpan dan memuat snapshot adalah tindakan yang dilakukan pada lingkungan, dan snapshot yang dihasilkan bukan bagian dari definisi lingkungan. Karena Terraform hanya mengelola konfigurasi lingkungan Managed Airflow, Anda tidak dapat menyimpan atau memuat snapshot lingkungan dari sana.
Memuat snapshot lingkungan
Di Managed Airflow (Gen 1 Lama), Anda hanya dapat menyimpan snapshot, tetapi tidak dapat memuatnya. Anda dapat memuat snapshot dari lingkungan Managed Airflow (Gen 1 Lama) ke lingkungan Managed Airflow (Gen 2). Misalnya, saat Anda memigrasikan lingkungan ke Managed Airflow (Gen 2).