Tentang startup workload yang lebih cepat dengan node mulai cepat

Autopilot

Halaman ini menunjukkan cara men-deploy dan menskalakan workload dengan lebih cepat di cluster Google Kubernetes Engine (GKE) menggunakan node mulai cepat. Node yang dimulai dengan cepat digunakan di GKE dengan mode Autopilot berdasarkan upaya terbaik saat workload menggunakan konfigurasi yang kompatibel.

Node GKE yang dimulai dengan cepat memiliki waktu mulai yang jauh lebih rendah untuk kelompok mesin yang kompatibel. Waktu startup yang dipercepat memberi Anda manfaat berikut:

Start cold yang lebih cepat
Penskalaan otomatis yang lebih cepat
Latensi ekor panjang penjadwalan Pod yang ditingkatkan
Peningkatan efisiensi biaya infrastruktur

Dengan node yang dimulai dengan cepat, GKE melakukan pra-inisialisasi resource hardware untuk mempercepat waktu mulai. Resource yang telah diinisialisasi sebelumnya tersedia berdasarkan upaya terbaik. Permintaan lonjakan mungkin hanya ditayangkan sebagian. Tanpa node mulai cepat, resource diinisialisasi sesuai permintaan, dan node ditayangkan pada waktu mulai normal.

Persyaratan

Node yang dimulai dengan cepat tidak memerlukan konfigurasi tambahan. GKE secara otomatis menggunakan node mulai cepat jika workload Anda menggunakan konfigurasi yang kompatibel. Anda harus memenuhi semua persyaratan berikut untuk menggunakan node mulai cepat:

Gunakan cluster Autopilot, atau jalankan workload dalam mode Autopilot di cluster Standard.
Jangan gunakan fitur yang tidak kompatibel dengan node yang dimulai cepat. Untuk mengetahui informasi selengkapnya, lihat Batasan.
Gunakan salah satu resource komputasi berikut yang dijelaskan dalam tabel masing-masing di bagian Persyaratan konfigurasi untuk resource komputasi yang memenuhi syarat:

Batasan

Fitur berikut tidak kompatibel dengan node GKE yang dimulai dengan cepat. Jika Anda menggunakan salah satu fitur ini, GKE akan menyediakan node dengan waktu mulai yang umum:

G2 dengan versi driver GPU DEFAULT pada versi GKE yang lebih lama dari 1.33.0-gke.1304000. Untuk 1.33.0-gke.1304000 atau yang lebih baru, LATEST dan DEFAULT berfungsi dengan node yang dimulai dengan cepat.
Disk boot sekunder pada versi yang lebih lama dari 1.33.2-gke.1015000.
Kunci enkripsi yang dikelola pelanggan (CMEK)
Spot VM
Kebijakan penempatan
Dukungan multi-jaringan

Workload GPU Autopilot

Meminta GPU yang kompatibel dalam mode Autopilot menghasilkan waktu mulai node hingga empat kali lebih cepat dan waktu penjadwalan Pod hingga dua kali lebih cepat daripada permintaan serupa dalam mode GKE Standard, karena workload GPU Autopilot dapat menggunakan node yang dimulai dengan cepat.

Berikut adalah beberapa contoh kasus penggunaan. Namun, Pod apa pun yang memenuhi kondisi dari bagian Persyaratan kompatibel dengan node mulai cepat.

ComputeClass

Minta jenis dan jumlah akselerator yang kompatibel di ComputeClass, seperti dalam contoh berikut:

apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
  name: ACCELERATOR_COMPUTE_CLASS_NAME
spec:
  priorities:
  - gpu:
      type: ACCELERATOR_TYPE
      count: ACCELERATOR_COUNT
  nodePoolAutoCreation:
    enabled: true

Saat Anda memilih ComputeClass ini di Pod, seperti dalam contoh berikut, GKE akan menggunakan node mulai cepat:

apiVersion: v1
kind: Pod
metadata:
  name: POD_NAME
spec:
  nodeSelector:
    # Select a ComputeClass that requests compatible GPUs
    cloud.google.com/compute-class: ACCELERATOR_COMPUTE_CLASS_NAME
  containers:
  - name: my-container
    image: gcr.io/google_containers/pause
    resources:
      limits:
        nvidia.com/gpu: ACCELERATOR_COUNT

Ganti nilai berikut:

ACCELERATOR_COMPUTE_CLASS_NAME: nama ComputeClass yang meminta akselerator.
ACCELERATOR_TYPE: jenis akselerator.
ACCELERATOR_COUNT: jumlah akselerator yang diperlukan oleh Pod. Nilai ini harus kurang dari atau sama dengan nilai di kolom spec.priorities.gpu.count di ComputeClass.
POD_NAME: nama Pod Anda.

Untuk mengetahui informasi selengkapnya tentang ComputeClass, lihat Tentang class komputasi kustom.

Spesifikasi pod

Pilih jenis dan jumlah akselerator yang kompatibel dalam spesifikasi Pod Anda, seperti dalam contoh berikut:

apiVersion: v1
kind: Pod
metadata:
  name: POD_NAME
spec:
  nodeSelector:
    cloud.google.com/gke-accelerator: ACCELERATOR_NAME
  containers:
  - name: my-container
    image: gcr.io/google_containers/pause
    resources:
      limits:
        nvidia.com/gpu: ACCELERATOR_COUNT

Ganti nilai berikut:

POD_NAME: nama Pod Anda.
ACCELERATOR_NAME: nama akselerator yang diperlukan oleh Pod.
ACCELERATOR_COUNT: jumlah akselerator yang diperlukan oleh Pod.

Persyaratan konfigurasi untuk resource komputasi yang memenuhi syarat

Tabel di bagian berikut menjelaskan persyaratan khusus agar GKE menyediakan resource komputasi yang relevan sebagai node mulai cepat.

Platform komputasi yang dioptimalkan untuk container Autopilot

Lihat persyaratan berikut agar GKE dapat menyediakan node mulai cepat dengan platform komputasi yang dioptimalkan untuk container Autopilot.

Resource komputasi	Dukungan saluran rilis dan versi	Jenis mesin, jenis boot disk, dan ukuran yang didukung
Platform komputasi yang dioptimalkan untuk container Autopilot	Saluran cepat 1.33.0-gke.1696000 atau yang lebih baru	Disk `pd-balanced` hingga 100 GiB Tidak ada SSD Lokal.

Seri mesin G2

Lihat persyaratan berikut agar GKE dapat menyediakan mesin G2 sebagai node mulai cepat.

Resource komputasi	Dukungan saluran rilis dan versi	Jenis mesin, jenis boot disk, dan ukuran yang didukung
Seri mesin G2	Saluran Cepat dan Reguler 1.31 atau yang lebih baru	Disk `pd-balanced` hingga 500 GiB Tidak ada SSD Lokal.

Seri mesin A2

Lihat persyaratan berikut agar GKE dapat menyediakan mesin A2 sebagai node mulai cepat. Seri mesin A2 tersedia untuk cluster yang menjalankan GKE versi 1.32.0-gke.1008000 atau yang lebih baru dan terdaftar di saluran Cepat atau Reguler.

Resource komputasi	Region	Jenis mesin, jenis boot disk, dan ukuran yang didukung
`a2-highgpu-1g`	`asia-northeast1` `asia-southeast1` `europe-west4` `me-west1` `us-central1` `us-west1` `us-west4`	`pd-balanced` atau `pd-ssd` hingga 1.000 GiB. Tidak ada SSD Lokal.
`a2-highgpu-2g`	`asia-southeast1` `us-central1` `us-west1`	`pd-balanced` atau `pd-ssd` hingga 1.000 GiB. Tidak ada SSD Lokal.
`a2-megagpu-16g`	`asia-southeast1` `europe-west4` `us-central1`	`pd-balanced` atau `pd-ssd` hingga 1.000 GiB. Tidak ada SSD Lokal.
`a2-ultragpu-1g`	`asia-southeast1` `europe-west4` `us-central1`	`pd-balanced` atau `pd-ssd` hingga 1.000 GiB. 1 SSD Lokal dengan 375 GiB disertakan.
`a2-ultragpu-2g`	`asia-southeast1` `europe-west4` `us-central1`	`pd-balanced` atau `pd-ssd` hingga 1.000 GiB. 2 SSD Lokal, masing-masing berukuran 375 GiB, disertakan.
`a2-ultragpu-4g`	`asia-southeast1` `europe-west4` `us-central1`	`pd-balanced` atau `pd-ssd` sebesar 1.500 GiB. 4 SSD Lokal, masing-masing berukuran 375 GiB, disertakan.
`a2-ultragpu-8g`	`asia-southeast1` `europe-west4` `us-central1`	`pd-balanced` atau `pd-ssd` sebesar 3.000 GiB. 8 SSD Lokal, masing-masing berukuran 375 GiB, disertakan.

Harga

Node yang dimulai dengan cepat tersedia di GKE Autopilot tanpa biaya tambahan. Untuk mengetahui informasi selengkapnya tentang harga GKE Autopilot, lihat bagian mode Autopilot di Harga Google Kubernetes Engine.

Tentang startup workload yang lebih cepat dengan node mulai cepat Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.