Dokumen ini menjelaskan cara mengonfigurasi deployment Google Kubernetes Engine sehingga Anda dapat menggunakan Google Cloud Managed Service for Prometheus untuk mengumpulkan metrik dari TorchServe. Dokumen ini menunjukkan cara melakukan hal berikut:
- Menyiapkan TorchServe untuk melaporkan metrik.
- Mengakses dasbor bawaan di Cloud Monitoring untuk melihat metrik.
Petunjuk ini hanya berlaku jika Anda menggunakan koleksi terkelola dengan Managed Service for Prometheus. Jika Anda menggunakan koleksi yang di-deploy sendiri, lihat dokumentasi TorchServe untuk mengetahui informasi penginstalan.
Petunjuk ini diberikan sebagai contoh dan diharapkan berfungsi di sebagian besar lingkungan Kubernetes. Jika Anda mengalami masalah saat menginstal aplikasi atau pengekspor karena kebijakan keamanan atau organisasi yang ketat, sebaiknya lihat dokumentasi open source untuk mendapatkan dukungan.
Untuk mengetahui informasi tentang TorchServe, lihat TorchServe. Untuk mengetahui informasi tentang cara menyiapkan TorchServe di Google Kubernetes Engine, lihat panduan GKE untuk TorchServe.
Prasyarat
Untuk mengumpulkan metrik dari TorchServe menggunakan Managed Service for Prometheus dan koleksi terkelola, deployment Anda harus memenuhi persyaratan berikut:
- Cluster Anda harus menjalankan Google Kubernetes Engine versi 1.28.15-gke.2475000 atau yang lebih baru.
- Anda harus menjalankan Managed Service for Prometheus dengan koleksi terkelola yang diaktifkan. Untuk mengetahui informasi selengkapnya, lihat Mulai menggunakan koleksi terkelola.
metrics_mode ditentukan dalam file config.properties atau sebagai variabel lingkungan.
Jika Anda menyiapkan TorchServe sendiri, sebaiknya tambahkan hal berikut ke file config.properties.
Jika Anda mengikuti dokumen Google Kubernetes Engine Menyajikan LLM yang dapat diskalakan di GKE dengan TorchServe, penambahan ini adalah bagian dari penyiapan default.
Selain itu, saat men-deploy image ini ke GKE, ubah YAML deployment dan layanan Anda untuk mengekspos port metrik yang ditambahkan:
Untuk memverifikasi bahwa TorchServe memancarkan metrik di endpoint yang diharapkan, lakukan hal berikut:
- Siapkan penerusan port menggunakan perintah berikut:
kubectl -n NAMESPACE_NAME port-forward SERVICE_NAME 8082
- Akses endpoint
localhost:8082/metricsmenggunakan browser atau utilitascurldi sesi terminal lain.
Menentukan resource PodMonitoring
Untuk penemuan target, Managed Service for Prometheus Operator memerlukan resource PodMonitoring yang sesuai dengan TorchServe di namespace yang sama.
Anda dapat menggunakan konfigurasi PodMonitoring berikut:
Pastikan nilai kolomport dan matchLabels cocok dengan pod TorchServe yang ingin Anda pantau.
Untuk menerapkan perubahan konfigurasi dari file lokal, jalankan perintah berikut:
kubectl apply -n NAMESPACE_NAME -f FILE_NAME
Anda juga dapat menggunakan Terraform untuk mengelola konfigurasi.
Memverifikasi konfigurasi
Anda dapat menggunakan Metrics Explorer untuk memverifikasi bahwa Anda telah mengonfigurasi TorchServe dengan benar. Cloud Monitoring mungkin memerlukan waktu satu atau dua menit untuk menyerap metrik Anda.
Untuk memverifikasi bahwa metrik telah diserap, lakukan hal berikut:
-
Di Google Cloud konsol, buka halaman leaderboard Metrics explorer:
Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Monitoring.
- Di toolbar panel pembuat kueri, pilih tombol yang namanya adalah code PromQL.
- Masukkan dan jalankan kueri berikut:
up{job="torchserve", cluster="CLUSTER_NAME", namespace="NAMESPACE_NAME"}
Melihat dasbor
Integrasi Cloud Monitoring mencakup dasbor TorchServe Prometheus Overview. Dasbor akan otomatis diinstal saat Anda mengonfigurasi integrasi. Anda juga dapat melihat pratinjau statis dasbor tanpa menginstal integrasi.
Untuk melihat dasbor yang terinstal, lakukan hal berikut:
-
Di Google Cloud konsol, buka halaman Dashboards:
Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Monitoring.
- Pilih tab Dashboard List.
- Pilih kategori Integrations.
- Klik nama dasbor, misalnya, TorchServe Prometheus Overview.
Untuk melihat pratinjau statis dasbor, lakukan hal berikut:
-
Di Google Cloud konsol, buka halaman
Integrations:
Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Monitoring.
- Klik filter platform deployment Kubernetes Engine.
- Temukan integrasi TorchServe, lalu klik View Details.
- Pilih tab Dashboards.
Pemecahan masalah
Untuk mengetahui informasi tentang cara memecahkan masalah penyerapan metrik, lihat Masalah dengan koleksi dari pengekspor di Memecahkan masalah sisi penyerapan.