Lihat metrik

Topik ini menjelaskan cara melihat metrik hybrid Apigee di dasbor Cloud Operations.

Tentang Cloud Operations

Untuk mengetahui informasi selengkapnya tentang metrik, dasbor, dan Cloud Operations, lihat:

Mengaktifkan metrik hybrid

Sebelum metrik hybrid dapat dikirim ke Cloud Operations, Anda harus mengaktifkan pengumpulan metrik terlebih dahulu. Lihat Mengonfigurasi pengumpulan metrik untuk prosedur ini.

Tentang nama dan label metrik campuran

Jika diaktifkan, hybrid akan otomatis mengisi metrik Cloud Operations. Awalan nama domain metrik yang dibuat oleh hybrid adalah:

apigee.googleapis.com/

Misalnya, metrik /proxyv2/request_count berisi jumlah total permintaan yang diterima oleh proxy API. Oleh karena itu, nama metrik di Cloud Operations adalah:

apigee.googleapis.com/proxyv2/request_count

Cloud Operations memungkinkan Anda memfilter dan mengelompokkan data metrik berdasarkan label. Beberapa label telah ditentukan sebelumnya, dan yang lainnya ditambahkan secara eksplisit oleh hybrid. Bagian Metrik yang tersedia di bawah mencantumkan semua metrik hibrida yang tersedia dan label yang ditambahkan secara khusus untuk metrik yang dapat Anda gunakan untuk pemfilteran dan pengelompokan.

Melihat metrik

Contoh berikut menunjukkan cara melihat metrik di Cloud Operations:

Buka Monitoring Metrics Explorer di browser. Atau, jika Anda sudah berada di konsol Cloud Operations, pilih Metrics explorer.
Di Find resource type and metric, temukan dan pilih metrik yang ingin Anda periksa. Pilih metrik tertentu yang tercantum di Metrik yang tersedia, atau telusuri metrik.
Pilih metrik yang diinginkan.
Terapkan filter. Pilihan filter untuk setiap metrik tercantum di Metrik yang tersedia.
Cloud Operations menampilkan diagram untuk metrik yang dipilih.
Klik Simpan.

Membuat dasbor

Dasbor adalah salah satu cara untuk melihat dan menganalisis data metrik yang penting bagi Anda. Cloud Operations menyediakan dasbor standar untuk resource dan layanan yang Anda gunakan, dan Anda juga dapat membuat dasbor kustom.

Anda menggunakan diagram untuk menampilkan metrik Apigee di dasbor kustom. Dengan dasbor kustom, Anda memiliki kontrol penuh atas diagram yang ditampilkan dan konfigurasinya. Untuk mengetahui informasi selengkapnya tentang cara membuat diagram, lihat Membuat diagram.

Contoh berikut menunjukkan cara membuat dasbor di Cloud Operations, lalu menambahkan diagram untuk melihat data metrik:

Buka Monitoring Metrics Explorer di browser, lalu pilih Dasbor.
Pilih + Buat Dasbor.
Beri nama dasbor. Misalnya: Traffic Permintaan Proxy Hybrid
Klik Konfirmasi.
Untuk setiap diagram yang ingin Anda tambahkan ke dasbor, ikuti langkah-langkah berikut:
1. Di dasbor, pilih Tambahkan diagram.
2. Pilih metrik yang diinginkan seperti yang dijelaskan di atas dalam Melihat metrik.
3. Selesaikan dialog untuk menentukan diagram Anda.
4. Klik Simpan. Cloud Operations menampilkan data untuk metrik yang dipilih.

Metrik yang tersedia

Tabel berikut mencantumkan metrik untuk menganalisis traffic proxy.

Metrik traffic proxy, target, dan server

Layanan Prometheus mengumpulkan dan memproses metrik (seperti yang dijelaskan dalam Pengumpulan metrik) untuk traffic proxy, target, dan server.

Tabel berikut menjelaskan metrik dan label yang digunakan Prometheus. Label ini digunakan dalam entri log metrik.

Nama metrik	Label	Gunakan
`/proxyv2/request_count`	`method`	Jumlah total permintaan proxy API yang diterima.
`/proxyv2/response_count`	`method` `response_code`	Jumlah total respons proxy API yang diterima.
`/proxyv2/latencies_percentile`	`method`	Persentil semua respons kebijakan API terhadap permintaan.
`/targetv2/request_count`	`method` `target_type` `target_endpoint`	Jumlah total permintaan yang dikirim ke target proxy.
`/targetv2/response_count`	`method` `response_code` `target_type` `target_endpoint`	Jumlah total respons yang diterima dari target proxy.
`/server/fault_count`	`source`	Jumlah total kesalahan untuk aplikasi server. Misalnya, aplikasi dapat berupa `apigee-runtime`, `apigee-synchronizer`, atau `apigee-udca`. Gunakan label `pod_name` untuk memfilter hasil menurut aplikasi.
`/server/nio`	`state`	Jumlah soket terbuka.
`/server/num_threads`		Jumlah thread non-daemon aktif di server.
`/server/request_count`	`method` `type`	Total jumlah permintaan yang diterima oleh aplikasi server. Misalnya, aplikasi dapat berupa `apigee-runtime`, `apigee-synchronizer`, atau `apigee-udca`. Gunakan label `pod_name` untuk memfilter hasil menurut aplikasi.
`/server/response_count`	`method` `response_code type`	Total jumlah respons yang dikirim oleh aplikasi server. Misalnya, aplikasi dapat berupa `apigee-runtime`, `apigee-synchronizer`, atau `apigee-udca`. Gunakan label `pod_name` untuk memfilter hasil menurut aplikasi.
`/server/latencies`	`method` `response_code type`	Latensi adalah latensi dalam milidetik yang diperkenalkan oleh aplikasi server. Misalnya, aplikasi dapat berupa `apigee-runtime`, `apigee-synchronizer`, atau `apigee-udca`. Gunakan label `pod_name` untuk memfilter hasil menurut aplikasi.
`/upstream/request_count`	`method` `type`	Jumlah permintaan yang dikirim oleh aplikasi server ke aplikasi upstream-nya. Misalnya, untuk `apigee-synchronizer`, bidang kontrol berada di upstream. Jadi, `upstream/request_count` untuk `apigee-synchronizer` adalah metrik yang menunjukkan permintaan yang dibuat `apigee-synchronizer` ke panel kontrol.
`/upstream/response_count`	`method` `response_code` `type`	Jumlah respons yang diterima oleh aplikasi server dari aplikasi upstream-nya. Misalnya, untuk `apigee-synchronizer`, bidang kontrol berada di upstream. Jadi, `upstream/response_count` untuk `apigee-synchronizer` adalah metrik yang menunjukkan permintaan yang diterima `apigee-synchronizer` dari panel kontrol.
`/upstream/latencies`	`method` `response_code type`	Latensi yang terjadi di aplikasi server upstream dalam milidetik. Misalnya, untuk `apigee-synchronizer`, bidang kontrol berada di upstream. Jadi, `upstream/latencies` untuk `apigee-synchronizer` adalah metrik yang menunjukkan latensi dari bidang kontrol.

Metrik UDCA

Layanan Prometheus mengumpulkan dan memproses metrik (seperti yang dijelaskan dalam Pengumpulan metrik) untuk layanan UDCA seperti yang dilakukannya untuk layanan hybrid lainnya.

Tabel berikut menjelaskan metrik dan label yang digunakan Prometheus dalam data metrik UDCA. Label ini digunakan dalam entri log metrik.

Nama metrik	Label	Gunakan
`/udca/server/local_file_oldest_ts`	`dataset` `state`	Stempel waktu, dalam milidetik sejak awal Epoch Unix, untuk file terlama dalam set data. Nilai ini dihitung setiap 60 detik dan tidak mencerminkan status secara real time. Jika UDCA sudah diupdate dan tidak ada file yang menunggu untuk diupload saat metrik ini dihitung, nilai ini akan menjadi 0. Jika nilai ini terus meningkat, berarti file lama masih ada di disk.
`/udca/server/local_file_latest_ts`	`dataset` `state`	Stempel waktu, dalam milidetik sejak awal Epoch Unix, untuk file terbaru di disk menurut status. Nilai ini dihitung setiap 60 detik dan tidak mencerminkan status secara real time. Jika UDCA sudah diupdate dan tidak ada file yang menunggu untuk diupload saat metrik ini dihitung, nilai ini akan menjadi 0.
`/udca/server/local_file_count`	`dataset` `state`	Jumlah file di disk dalam pod pengumpulan data. Idealnya, nilainya akan mendekati 0. Nilai tinggi yang konsisten menunjukkan bahwa file tidak diupload atau UDCA tidak dapat menguploadnya dengan cukup cepat. Nilai ini dihitung setiap 60 detik dan tidak mencerminkan status UDCA secara real time.
`/udca/server/total_latencies`	`dataset`	Interval waktu, dalam detik, antara file data dibuat dan file data berhasil diupload. Bucket akan berukuran 100 md, 250 md, 500 md, 1 dtk, 2 dtk, 4 dtk, 8 dtk, 16 dtk, 32 dtk, dan 64 dtk. Histogram untuk total latensi dari waktu pembuatan file hingga waktu upload berhasil.
`/udca/server/upload_latencies`	`dataset`	Total waktu, dalam detik, yang dihabiskan UDCA untuk mengupload file data. Bucketnya adalah 100 md, 250 md, 500 md, 1 dtk, 2 dtk, 4 dtk, 8 dtk, 16 dtk, 32 dtk, dan 64 dtk. Metrik akan menampilkan histogram untuk total latensi upload, termasuk semua panggilan upstream.
`/udca/upstream/http_error_count`	`service` `dataset` `response_code`	Jumlah total error HTTP yang dialami UDCA. Metrik ini berguna untuk membantu menentukan bagian dependensi eksternal UDCA mana yang gagal dan alasannya. Error ini dapat muncul untuk berbagai layanan (`getDataLocation`, `Cloud storage`, `Token generator`) dan untuk berbagai set data (seperti `api` dan `trace`) dengan berbagai kode respons.
`/udca/upstream/http_latencies`	`service` `dataset`	Latensi layanan upstream, dalam hitungan detik. Bucketnya adalah 100 md, 250 md, 500 md, 1 dtk, 2 dtk, 4 dtk, 8 dtk, 16 dtk, 32 dtk, dan 64 dtk. Histogram untuk latensi dari layanan upstream.
`/udca/upstream/uploaded_file_sizes`	`dataset`	Ukuran file yang diupload ke layanan Apigee, dalam byte. Bucketnya adalah 1 KB, 10 KB, 100 KB, 1 MB, 10 MB, 100 MB, dan 1 GB. Histogram untuk ukuran file menurut set data, organisasi, dan lingkungan.
`/udca/upstream/uploaded_file_count`	`dataset`	Jumlah file yang diupload UDCA ke layanan Apigee. Perhatikan bahwa: Nilai set data `event` harus terus bertambah. Nilai set data `api` harus terus bertambah jika org/env memiliki traffic yang konstan. Nilai set data `trace` harus bertambah saat Anda menggunakan alat rekaman aktivitas Apigee untuk men-debug atau memeriksa permintaan.
`/udca/disk/used_bytes`	`dataset` `state`	Ruang yang ditempati oleh file data di disk pod pengumpulan data, dalam byte. Peningkatan nilai ini dari waktu ke waktu: `ready_to_upload` menyiratkan bahwa agen tertinggal. `failed` menunjukkan bahwa file menumpuk di disk dan tidak diupload. Nilai ini dihitung setiap 60 detik.
`/udca/server/pruned_file_count`	`dataset` `state`	Jumlah file yang telah dihapus karena Time To Life (TTL) file tersebut melampaui nilai minimum yang ditetapkan. Set data dapat mencakup API, rekaman aktivitas, dan lainnya, serta status dapat berupa `UPLOADED`, `FAILED`, atau `DISCARDED`.
`/udca/server/retry_cache_size`	`dataset`	Jumlah file, menurut set data, yang diupload ulang oleh UDCA. Setelah 3 kali percobaan ulang untuk setiap file, UDCA akan memindahkan file ke subdirektori `/failed` dan menghapusnya dari cache ini. Peningkatan nilai ini dari waktu ke waktu menunjukkan bahwa cache tidak dihapus, yang terjadi saat file dipindahkan ke subdirektori `/failed` setelah 3 kali percobaan ulang.

Metrik Cassandra

Layanan Prometheus mengumpulkan dan memproses metrik (seperti yang dijelaskan dalam Pengumpulan metrik) untuk Cassandra seperti yang dilakukannya untuk layanan hybrid lainnya.

Tabel berikut menjelaskan metrik dan label yang digunakan Prometheus dalam data metrik Cassandra. Label ini digunakan dalam entri log metrik.

Nama metrik (tidak termasuk domain)	Label	Gunakan
`/cassandra/process_max_fds`		Jumlah maksimum deskriptor file terbuka.
`/cassandra/process_open_fds`		Membuka deskriptor file.
`/cassandra/jvm_memory_pool_bytes_max`	`pool`	Penggunaan memori maksimum JVM untuk kumpulan.
`/cassandra/jvm_memory_pool_bytes_init`	`pol`	Penggunaan memori awal JVM untuk pool.
`/cassandra/jvm_memory_bytes_max`	`area`	Penggunaan memori maksimum heap JVM.
`/cassandra/process_cpu_seconds_total`		Waktu CPU pengguna dan sistem yang dihabiskan dalam detik.
`/cassandra/jvm_memory_bytes_used`	`area`	Penggunaan memori heap JVM.
`/cassandra/compaction_pendingtasks`	`unit`	Pemadatan yang belum selesai untuk sstable Cassandra. Lihat Pemadatan untuk mengetahui informasi selengkapnya.
`/cassandra/jvm_memory_bytes_init`	`area`	Penggunaan memori awal heap JVM.
`/cassandra/jvm_memory_pool_bytes_used`	`pool`	Penggunaan memori kumpulan JVM.
`/cassandra/jvm_memory_pool_bytes_committed`	`pool`	Penggunaan memori yang dialokasikan untuk kumpulan JVM.
`/cassandra/clientrequest_latency`	`scope` `unit`	Latensi permintaan baca dalam rentang persentil ke-75 dalam mikrodetik.
`/cassandra/jvm_memory_bytes_committed`	`area`	Penggunaan memori yang dialokasikan heap JVM.

Bekerja dengan metrik Cassandra

Apigee merekomendasikan metrik berikut sebagai metrik penting untuk dipantau pada database Cassandra Anda:

Kecepatan permintaan Cassandra: Gunakan metrik ini untuk memantau kecepatan permintaan baca dan tulis Cassandra.

Metrik:	`apigee.googleapis.com/cassandra/clientrequest_latency`
Label resource:	`project_id`, `location`, `cluster_name`, `namespace_name`, `pod_name`, `container_name`
Label metrik:	`scope`, `unit` Gunakan label ini untuk memfilter resource tertentu atau untuk pengelompokan.

Untuk memantau kecepatan permintaan baca Cassandra, terapkan filter berikut.

Filter: metric.scope == 'Read'
metric.unit == 'OneMinuteRate'

Untuk memantau rasio permintaan tulis Cassandra, terapkan filter berikut.

Filter: metric.scope == 'Write'
metric.unit == 'OneMinuteRate'

Latensi permintaan Cassandra: Gunakan metrik ini untuk memantau latensi permintaan baca dan tulis Cassandra. Metrik ini sama dengan rasio permintaan, apigee.googleapis.com/cassandra/clientrequest_latency dengan filter yang berbeda diterapkan.
Untuk memantau latensi permintaan baca Cassandra, terapkan filter berikut.

Filter: metric.scope == 'Read'
metric.unit == '99thPercentile' atau '95thPercentile' atau '75thPercentile'

Untuk memantau latensi permintaan tulis Cassandra, terapkan filter berikut.

Filter: metric.scope == 'Write'
metric.unit == '99thPercentile' atau '95thPercentile' atau '75thPercentile'

Penggunaan permintaan CPU pod Cassandra

Metrik:	`kubernetes.io/container/cpu/request_utilization (GKE)` `kubernetes.io/anthos/container/cpu/request_utilization (Anthos)`
Label resource:	`project_id`, `location`, `cluster_name`, `namespace_name`, `pod_name`, `container_name` Gunakan label ini untuk memfilter resource tertentu atau untuk pengelompokan.

Penggunaan volume data Cassandra

Metrik:	`kubernetes.io/pod/volume/utilization (GKE)` `kubernetes.io/anthos/pod/volume/utilization (Anthos)`
Label resource:	`project_id`, `location`, `cluster_name`, `namespace_name`, `pod_name`
Label metrik:	`volume_name` Gunakan label ini untuk memfilter resource tertentu atau untuk pengelompokan.

Rekomendasi untuk menskalakan cluster Cassandra

Panduan berikut dapat berfungsi sebagai cluster yang direkomendasikan untuk keputusan menskalakan cluster Cassandra Anda. Secara umum, jika permintaan baca atau tulis secara konsisten menunjukkan latensi persentil ke-99 atau latensi terus meningkat, dan Anda melihat lonjakan yang sesuai dalam lonjakan penggunaan CPU permintaan dan rasio permintaan baca atau tulis, cluster Cassandra Anda dapat dianggap mengalami tekanan. Sebaiknya pertimbangkan untuk meningkatkan skala cluster. Untuk mengetahui informasi selengkapnya, lihat Menskalakan Cassandra

Metrik	Ambang batas	Durasi pemicu
`kubernetes.io/pod/volume/utilization`	85%	5 mnt
`kubernetes.io/container/cpu/request_utilization`	85%	3 mnt
`Read request Latency 99thPercentile`	5 dtk	3 mnt
`Write request Latency 99thPercentile`	5 dtk	3 mnt