Halaman ini menjelaskan cara menjalankan tugas deep learning seperti pengenalan gambar, pemrosesan bahasa alami, serta tugas intensif komputasi lainnya menggunakan node pool dengan akselerator hardware unit pemrosesan grafis (GPU) NVIDIA untuk daya komputasi dengan instance penampung layanan Knative Anda.
Menambahkan node pool dengan GPU ke cluster GKE
Minta administrator membuat node pool dengan GPU:
Menyiapkan layanan untuk menggunakan GPU
Anda dapat menentukan batas resource untuk menggunakan GPU bagi layanan Anda menggunakan konsol Google Cloud atau Google Cloud CLI saat men-deploy layanan baru, memperbarui layanan yang ada, atau men-deploy revisi:
Konsol
- Buka Inferensi Knative
Klik Buat layanan untuk menampilkan formulir Buat layanan.
Di bagian Service settings:
- Pilih cluster GKE dengan node pool yang mendukung GPU.
- Tentukan nama yang ingin Anda berikan ke layanan Anda.
- Klik Berikutnya untuk melanjutkan ke bagian berikutnya.
Di bagian Configure the service's first revision:
- Tambahkan URL image container.
- Klik Setelan lanjutan, lalu di menu GPU yang dialokasikan, pilih
jumlah GPU
yang ingin Anda alokasikan ke layanan Anda.
Klik Berikutnya untuk melanjutkan ke bagian berikutnya.
Di bagian Konfigurasi cara layanan ini dipicu, pilih konektivitas yang ingin Anda gunakan untuk memanggil layanan.
Klik Create untuk men-deploy image ke layanan Knative dan tunggu hingga deployment selesai.
Command line
Anda dapat mendownload konfigurasi layanan yang ada ke dalam
file YAML dengan perintah gcloud run services describe
menggunakan tanda
--format=export
.
Kemudian, Anda dapat mengubah file YAML tersebut dan men-deploy
perubahan tersebut dengan perintah gcloud run services replace
.
Anda harus memastikan bahwa Anda hanya mengubah atribut yang ditentukan.
Download konfigurasi layanan Anda ke file bernama
service.yaml
di ruang kerja lokal:gcloud run services describe SERVICE --format export > service.yaml
Ganti SERVICE dengan nama layanan Knative serving Anda.
Di file lokal Anda, perbarui atribut
nvidia.com/gpu
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE_NAME spec: template: spec: containers: – image: IMAGE_URL resources: limits: nvidia.com/gpu: "GPU_UNITS"
Ganti GPU_UNITS dengan nilai GPU yang diinginkan dalam unit GPU Kubernetes. Misalnya, tentukan
1
untuk 1 GPU.Deploy file YAML dan ganti layanan Anda dengan konfigurasi baru dengan menjalankan perintah berikut:
gcloud run services replace service.yaml
Untuk mengetahui informasi selengkapnya tentang performa dan biaya GPU, lihat GPU.