Metrik pemantauan yang didukung

Halaman ini mencantumkan metrik yang tersedia untuk Memorystore for Redis Cluster dan menjelaskan apa yang diukur oleh setiap metrik.

Metrik pencadangan

Bagian ini mencantumkan dan menjelaskan metrik pencadangan dan impor.

Metrik tingkat cluster

Bagian ini mencantumkan dan menjelaskan metrik pencadangan dan impor tingkat cluster.

Nama metrik Deskripsi
redis.googleapis.com/cluster/backup/last_backup_start_time Metrik ini menampilkan waktu mulai operasi pencadangan terakhir.
redis.googleapis.com/cluster/backup/last_backup_status Metrik ini menunjukkan apakah upaya pencadangan terbaru berhasil atau gagal. Statusnya adalah 1 untuk Success dan 0 untuk Failed.
redis.googleapis.com/cluster/backup/last_backup_duration Metrik ini menunjukkan durasi operasi pencadangan terakhir (dalam milidetik).
redis.googleapis.com/cluster/backup/last_backup_size Metrik ini menunjukkan ukuran pencadangan terakhir (dalam byte). Metrik ini adalah indikator utama untuk memantau efisiensi pencadangan dan perencanaan kapasitas penyimpanan.
redis.googleapis.com/cluster/import/last_import_start_time Metrik ini menampilkan waktu mulai operasi impor terakhir.
redis.googleapis.com/cluster/import/last_import_duration Metrik ini menunjukkan durasi operasi impor terakhir (dalam milidetik).

Metrik Certificate Authority (CA)

Bagian ini mencantumkan metrik yang terkait dengan Certificate Authority (CA) yang dikelola pelanggan.

Metrik tingkat cluster

Metrik ini memberikan ringkasan umum tentang sertifikat yang terkait dengan mesin dalam cluster.

Nama metrik Deskripsi
redis.googleapis.com/cluster/security/rotate_tls_cert_count

Metrik ini menampilkan status rotasi sertifikat yang terkait dengan mesin dalam cluster.

Metrik dapat memiliki status berikut:

  • SUCCESS: Memorystore for Redis Cluster merotasi sertifikat.
  • FAILED: Memorystore for Redis Cluster tidak merotasi sertifikat karena sertifikat tidak tersedia, Memorystore for Redis Cluster tidak memiliki izin untuk merotasi sertifikat, atau terjadi error internal.
  • SKIPPED: Memorystore for Redis Cluster tidak melakukan rotasi sertifikat karena tidak perlu dirotasi.

Metrik Cloud Monitoring

Bagian ini mencantumkan dan menjelaskan metrik Cloud Monitoring yang tersedia untuk Memorystore for Redis Cluster.

Metrik tingkat cluster

Metrik ini memberikan ringkasan umum tentang kondisi dan performa cluster secara keseluruhan. Anda dapat menggunakan metrik untuk memahami kapasitas dan pemanfaatan cluster secara keseluruhan, serta mengidentifikasi potensi hambatan atau area yang perlu ditingkatkan.

Nama metrik Deskripsi
redis.googleapis.com/cluster/clients/average_connected_clients Metrik ini mengukur jumlah rata-rata koneksi klien aktif ke cluster selama waktu yang ditentukan. Anda dapat menggunakan metrik ini untuk memantau penskalaan koneksi, mengidentifikasi hambatan aplikasi, dan memastikan cluster stabil.
redis.googleapis.com/cluster/clients/maximum_connected_clients Metrik ini menunjukkan jumlah maksimum koneksi klien aktif di semua node cluster. Anda dapat menggunakan metrik ini untuk memantau beban koneksi tertinggi pada cluster kapan saja. Hal ini penting untuk memastikan performa tinggi cluster karena jumlah koneksi yang tinggi dapat meningkatkan waktu respons.
redis.googleapis.com/cluster/clients/total_connected_clients Metrik ini melacak jumlah koneksi klien aktif saat ini ke cluster. Anda dapat menggunakan metrik ini untuk memantau beban database dan mencegah batas koneksi.
redis.googleapis.com/cluster/stats/total_connections_received_count Metrik ini menunjukkan jumlah kumulatif koneksi klien yang dibuat dalam cluster dalam satu menit terakhir. Anda dapat menggunakan metrik ini untuk menganalisis beban traffic, memastikan batas koneksi tidak terlampaui, dan menentukan apakah Anda perlu menskalakan cluster.
redis.googleapis.com/cluster/stats/total_rejected_connections_count Metrik ini melacak jumlah total koneksi ke cluster yang ditolak karena batas maxclients tercapai.
redis.googleapis.com/cluster/commandstats/total_usec_count Metrik ini mengukur total waktu CPU yang digunakan setiap perintah. Metrik menunjukkan total mikrodetik yang digunakan, yang memberikan insight tentang performa dan latensi cluster.
redis.googleapis.com/cluster/commandstats/total_calls_count Metrik ini mengukur jumlah total panggilan yang terkait dengan perintah tertentu pada node cluster dalam satu menit. Untuk mengidentifikasi bottleneck atau traffic tinggi pada perintah tertentu, Anda dapat menggunakan metrik untuk memantau throughput perintah (perintah per menit) di seluruh node utama dan replika.
redis.googleapis.com/cluster/cpu/average_utilization Metrik ini menunjukkan penggunaan CPU rata-rata untuk cluster (dari 0,0 hingga 1,0). Anda dapat menggunakan metrik ini untuk mengidentifikasi resource yang disediakan berlebihan atau kurang digunakan, mengelola batas penskalaan otomatis, dan mendeteksi hambatan performa, dengan penggunaan ideal sebesar 40%-70%.
redis.googleapis.com/cluster/cpu/maximum_utilization

Metrik ini menunjukkan penggunaan CPU puncak di semua node dalam cluster (dari 0,0 hingga 1,0).

Metrik ini hanya merangkum status sys_main_thread dan user_main_thread. Tidak mencakup status CPU lainnya (seperti sys_children atau user_children) yang tersedia dalam metrik /cluster/node/cpu/utilization .

Pastikan penggunaan CPU tidak melebihi 0,8 detik untuk node primer dan 0,5 detik untuk setiap replika yang ditetapkan sebagai replika baca. Untuk mengetahui informasi selengkapnya, lihat praktik terbaik penggunaan CPU.

redis.googleapis.com/cluster/stats/average_expired_keys Metrik ini mengukur jumlah rata-rata peristiwa habis masa berlaku kunci untuk semua node utama dalam cluster. Anda dapat menggunakan metrik ini untuk memantau jumlah kunci yang akan berakhir masa berlakunya.
redis.googleapis.com/cluster/stats/maximum_expired_keys Metrik ini mengukur jumlah maksimum peristiwa habis masa berlaku kunci yang terjadi di semua node primer dalam cluster.
redis.googleapis.com/cluster/stats/total_expired_keys_count Metrik ini melacak total jumlah peristiwa habis masa berlaku kunci yang terjadi di semua node primer cluster. Anda dapat menggunakan metrik ini untuk memantau jumlah kunci yang habis masa berlakunya.
redis.googleapis.com/cluster/stats/average_evicted_keys Metrik ini melacak jumlah rata-rata kunci yang dikeluarkan karena batasan kapasitas memori di seluruh shard primer dalam cluster.
redis.googleapis.com/cluster/stats/maximum_evicted_keys Metrik ini menunjukkan jumlah kunci tertinggi yang dikeluarkan dari node atau shard cluster primer karena kapasitas memori.
redis.googleapis.com/cluster/stats/total_evicted_keys_count Metrik ini menunjukkan jumlah total kunci yang dikeluarkan oleh node dari cluster primer karena kapasitas memori.
redis.googleapis.com/cluster/keyspace/total_keys Metrik ini menunjukkan jumlah kunci yang disimpan dalam cluster.
redis.googleapis.com/cluster/stats/average_keyspace_hits Metrik ini menunjukkan jumlah rata-rata pencarian kunci yang berhasil di semua node dalam cluster.
redis.googleapis.com/cluster/stats/maximum_keyspace_hits Metrik ini menunjukkan jumlah maksimum pencarian kunci yang berhasil di node cluster. Anda dapat menggunakan metrik ini untuk memantau performa cluster dan mengidentifikasi potensi hotspot di seluruh cluster.
redis.googleapis.com/cluster/stats/total_keyspace_hits_count Metrik ini melacak jumlah kumulatif pencarian kunci yang berhasil di semua node dalam cluster.
redis.googleapis.com/cluster/stats/average_keyspace_misses Metrik ini menunjukkan jumlah rata-rata kegagalan pencarian kunci di seluruh cluster. Anda dapat menggunakan metrik ini untuk melacak frekuensi permintaan kunci, tetapi kunci tidak ditemukan di cache.
redis.googleapis.com/cluster/stats/maximum_keyspace_misses Metrik ini menunjukkan jumlah maksimum pencarian kunci yang gagal di seluruh node cluster.
redis.googleapis.com/cluster/stats/total_keyspace_misses_count Metrik ini menunjukkan jumlah total pencarian kunci yang gagal di semua node cluster.
redis.googleapis.com/cluster/memory/average_utilization Metrik ini menunjukkan penggunaan memori rata-rata di seluruh cluster (dari 0,0 hingga 1,0). Anda dapat menggunakan metrik ini untuk memantau kapasitas cluster dan menetapkan nilai minimum pemberitahuan. Misalnya, Anda dapat menetapkan nilai minimum pemberitahuan untuk memberi tahu pengguna saat rata-rata memori melebihi persentase tertentu (misalnya, 80%).
redis.googleapis.com/cluster/memory/maximum_utilization Metrik ini menunjukkan penggunaan memori maksimum di semua node cluster (dari 0,0 hingga 1,0). Anda dapat menggunakan metrik ini untuk mengidentifikasi kapan harus menskalakan cluster. Sebaiknya pantau penggunaan untuk memastikan bahwa penggunaan tetap di bawah 100%. Di bawah beban tulis yang tinggi, performa mungkin menurun jika metrik ini mencapai 65% hingga 85%.
redis.googleapis.com/cluster/memory/total_used_memory Metrik ini menunjukkan total penggunaan memori cluster (dalam byte). Anda dapat menggunakan metrik untuk memantau kapasitas cluster.
redis.googleapis.com/cluster/memory/size Metrik ini mengukur total, RAM yang digunakan, dan yang tersedia di semua node dalam cluster. Anda dapat menggunakan metrik ini untuk memantau kapasitas cluster dan mencegah kegagalan node.
redis.googleapis.com/cluster/replication/average_ack_lag Metrik ini menunjukkan jeda konfirmasi rata-rata (dalam detik) replika di seluruh cluster.

Jeda konfirmasi adalah hambatan pada node utama dalam cluster. Hambatan ini disebabkan oleh replikanya yang tidak dapat mengikuti informasi yang dikirimkan node utama kepada mereka. Jika hal ini terjadi, node utama harus menunggu konfirmasi bahwa replika telah menerima informasi. Hal ini dapat memperlambat penerapan transaksi dan menyebabkan penurunan performa pada node utama.
redis.googleapis.com/cluster/replication/maximum_ack_lag Metrik ini menunjukkan jeda pengakuan maksimum (dalam detik) replika di seluruh cluster.
redis.googleapis.com/cluster/replication/average_offset_diff Metrik ini menunjukkan perbedaan offset pengakuan replikasi rata-rata (dalam byte) di seluruh cluster.

Perbedaan offset pengakuan replikasi berarti jumlah byte yang tidak direplikasi antara replika dan cluster utamanya.
redis.googleapis.com/cluster/replication/maximum_offset_diff Metrik ini menampilkan perbedaan offset replikasi maksimum (dalam byte) di seluruh cluster.

Perbedaan offset replikasi berarti jumlah byte yang tidak direplikasi antara replika dan cluster primernya.
redis.googleapis.com/cluster/stats/total_net_input_bytes_count Metrik ini menunjukkan jumlah byte jaringan masuk yang diterima endpoint cluster.
redis.googleapis.com/cluster/stats/total_net_output_bytes_count Metrik ini menampilkan jumlah byte jaringan keluar yang dikirim oleh endpoint cluster.

Metrik tingkat node

Metrik ini menawarkan insight mendetail tentang kondisi dan performa setiap node dalam cluster. Anda dapat menggunakan metrik untuk memecahkan masalah pada node guna mengoptimalkan performanya.

Nama metrik Deskripsi
redis.googleapis.com/cluster/node/clients/connected_clients Metrik ini menunjukkan jumlah koneksi klien aktif ke node cluster, tidak termasuk koneksi replika. Anda dapat menggunakan metrik ini untuk memantau batas koneksi dan mengidentifikasi hotspot tempat shard menerima traffic yang tidak proporsional.
redis.googleapis.com/cluster/node/clients/blocked_clients Metrik ini menunjukkan jumlah koneksi klien yang diblokir oleh node cluster. Jumlah koneksi klien yang diblokir yang tinggi atau meningkat dengan cepat mungkin menunjukkan bahwa banyak klien sedang menunggu operasi. Hal ini dapat menyebabkan peningkatan latensi.
redis.googleapis.com/cluster/node/server/uptime Metrik ini mengukur waktu aktif node cluster. Anda dapat menggunakan metrik untuk melacak durasi server berjalan terus-menerus tanpa melakukan reboot atau kegagalan.
redis.googleapis.com/cluster/node/stats/connections_received_count Metrik ini melacak total jumlah koneksi klien yang dibuat di node cluster dalam jangka waktu tertentu. Anda dapat menggunakan metrik untuk memantau traffic koneksi ke setiap node dalam cluster. Hasilnya, Anda dapat menganalisis distribusi beban dan mengidentifikasi lonjakan aktivitas koneksi.
redis.googleapis.com/cluster/node/stats/rejected_connections_count Metrik ini menunjukkan jumlah koneksi yang ditolak karena node cluster mencapai batas maxclients. Anda dapat menggunakan metrik untuk mengidentifikasi apakah node berada di bawah tekanan koneksi tinggi dan menolak koneksi baru karena tidak dapat menangani lebih banyak koneksi.
redis.googleapis.com/cluster/node/commandstats/usec_count Metrik ini menunjukkan total waktu yang digunakan setiap perintah di node kluster. Anda dapat menggunakan metrik ini untuk menganalisis performa perintah, mengidentifikasi perintah yang lambat, dan memecahkan masalah latensi di tingkat node.
redis.googleapis.com/cluster/node/commandstats/calls_count Metrik ini melacak jumlah total panggilan untuk perintah pada node cluster per menit. Anda dapat menggunakan metrik untuk memantau distribusi traffic, mengidentifikasi perintah yang sering digunakan, dan memecahkan masalah bottleneck pada setiap node.
redis.googleapis.com/cluster/node/cpu/utilization Metrik ini menunjukkan pemakaian CPU untuk node cluster (dari 0,0 hingga 1,0).
redis.googleapis.com/cluster/node/stats/expired_keys_count Metrik ini menunjukkan total jumlah peristiwa habis masa berlaku di node cluster. Anda dapat menggunakan metrik ini untuk memantau kecepatan penghapusan kunci dari cluster karena waktu aktif (TTL) mencapai nol.
redis.googleapis.com/cluster/node/stats/evicted_keys_count Metrik ini menghitung jumlah total kunci yang dikeluarkan oleh node cluster karena cluster mencapai batas memori maksimumnya. Metrik ini dapat mengidentifikasi apakah cluster berada dalam tekanan memori. Jumlah kunci yang dikeluarkan yang tinggi atau meningkat menunjukkan bahwa cluster kehabisan ruang. Akibatnya, cluster menghapus kunci untuk menyediakan ruang bagi data baru.
redis.googleapis.com/cluster/node/keyspace/total_keys Metrik ini mengukur jumlah total kunci yang disimpan oleh node cluster. Metrik ini memberikan visibilitas ke dalam distribusi dan sharding data di seluruh node.
redis.googleapis.com/cluster/node/stats/keyspace_hits_count Metrik ini melacak jumlah pencarian kunci yang berhasil di node cluster. Anda dapat menggunakan metrik ini untuk memantau efisiensi yang dimiliki node untuk mengambil data dalam memori.
redis.googleapis.com/cluster/node/stats/keyspace_misses_count Metrik ini melacak jumlah pencarian kunci yang gagal di node cluster.
redis.googleapis.com/cluster/node/memory/utilization Metrik ini melacak penggunaan memori di node cluster (dari 0,0 hingga 1,0). Anda dapat menggunakan metrik ini untuk mencegah kegagalan node dan memastikan stabilitas cluster.
redis.googleapis.com/cluster/node/memory/usage Metrik ini mengukur total penggunaan memori node cluster.
redis.googleapis.com/cluster/node/stats/net_input_bytes_count Metrik ini mengukur jumlah total byte jaringan masuk yang diterima oleh node cluster. Anda dapat menggunakan metrik ini untuk memantau throughput jaringan, mengidentifikasi potensi hambatan, dan menganalisis lonjakan traffic di node.
redis.googleapis.com/cluster/node/stats/net_output_bytes_count Metrik ini mengukur jumlah total byte jaringan keluar yang dikirim oleh node cluster. Anda dapat menggunakan metrik ini untuk memantau volume keluar jaringan untuk node guna tujuan penyesuaian performa dan perencanaan kapasitas.
redis.googleapis.com/cluster/node/replication/offset Metrik ini mengukur byte offset replikasi node cluster. Sebelum mempromosikan replika cluster menjadi cluster utama, Anda dapat menggunakan metrik untuk memeriksa apakah replika memproses semua data. Tindakan ini mencegah kehilangan data.
redis.googleapis.com/cluster/node/server/healthy Metrik ini menentukan apakah node cluster tersedia dan berfungsi dengan benar.
redis.googleapis.com/cluster/node/stats/evicted_clients_count Metrik ini melacak jumlah total klien yang koneksinya dihentikan oleh Memorystore for Redis Cluster karena total memori yang digunakan oleh semua buffer klien melebihi batas memori yang telah ditentukan sebelumnya. Anda dapat menggunakan metrik ini sebagai mekanisme perlindungan untuk mencegah penggunaan memori yang tidak terkendali oleh klien menghabiskan memori server dan memicu error.
redis.googleapis.com/cluster/node/clients/tracking_clients Metrik ini melacak jumlah klien Redis aktif yang terdaftar untuk menerima pesan pelacakan dan pembatalan validasi sisi server. Anda dapat menggunakan metrik ini untuk memantau dan men-debug penerapan caching sisi klien guna memastikan bahwa pelacakan server beroperasi seperti yang diharapkan.
redis.googleapis.com/cluster/node/clients/maxclients Metrik ini menunjukkan jumlah maksimum koneksi klien serentak yang diizinkan Memorystore for Redis Cluster pada node cluster.
redis.googleapis.com/cluster/node/clients/recent_max_input_buffer Metrik ini melaporkan buffer memori terbesar (dalam byte) yang digunakan untuk memproses satu perintah klien masuk di antara semua koneksi aktif. Anda dapat menggunakan metrik ini untuk melacak stabilitas koneksi dan mencegah pembengkakan memori. Jika ukuran buffer input klien tertentu secara konsisten mencapai batas maksimum, maka hal ini dapat menyebabkan jeda jaringan atau koneksi terputus di seluruh cluster.
redis.googleapis.com/cluster/node/clients/recent_max_output_buffer Metrik ini mengukur daftar output terpanjang (dalam byte) di antara koneksi klien yang terhubung paling baru ke server. Metrik ini merupakan indikator penting kondisi server karena mengidentifikasi klien yang meminta sejumlah besar data lebih cepat daripada yang dapat dikirimkan server kepada mereka.
redis.googleapis.com/cluster/node/commandstats/rejected_calls_count Metrik ini menunjukkan jumlah perintah (panggilan) Redis yang ditolak oleh server sebelum dijalankan. Panggilan ini dipicu oleh prasyarat, seperti adanya error sintaksis dalam perintah atau menjalankan perintah yang dibatasi memori saat instance kehabisan memori (OOM).
redis.googleapis.com/cluster/node/commandstats/failed_calls_count Metrik ini melacak jumlah operasi yang gagal pada node cluster. Anda dapat menggunakan metrik ini untuk menilai apakah aplikasi klien Anda meneruskan parameter yang tidak tepat atau tidak sinkron dengan skema set data Anda. Selain itu, Anda dapat mendiagnosis apakah peningkatan kegagalan berkorelasi dengan penurunan perintah.
redis.googleapis.com/cluster/node/keyspace/keys_with_expiration Metrik ini melacak jumlah kunci aktif dalam cluster yang telah menetapkan time-to-live (TTL) atau stempel waktu habis masa berlaku. Anda dapat menggunakan metrik untuk memantau batas penyimpanan dalam cache, penggunaan memori, dan pengelolaan sesi.
redis.googleapis.com/cluster/node/memory/dataset_usage Metrik ini mengukur jumlah memori yang digunakan oleh set data atau objek data utama di node cluster.
redis.googleapis.com/cluster/node/memory/mem_not_counted_for_evict

Metrik ini menunjukkan jumlah memori yang dikecualikan server saat mengevaluasi memori yang diperlukan untuk pengusiran kunci.

Saat menghitung apakah perlu menghapus kunci, Memorystore for Redis Cluster akan membandingkan total memori yang dialokasikan (used_memory) dengan batas maxmemory yang dikonfigurasi. Namun, nilai untuk mem_not_counted_for_evict dikurangi dari persamaan ini.

redis.googleapis.com/cluster/node/memory/number_of_cached_scripts Metrik ini melacak jumlah total skrip EVAL yang di-cache server di node cluster. Anda dapat menggunakan metrik untuk memantau overhead yang terkait dengan skrip Lua di cluster.
redis.googleapis.com/cluster/node/memory/number_of_functions Metrik ini melacak jumlah total fungsi yang ditentukan pada node cluster.
redis.googleapis.com/cluster/node/memory/lua_usage Metrik ini melacak jumlah byte yang digunakan Lua untuk skrip EVAL di node cluster.
redis.googleapis.com/cluster/node/memory/replica_clients_usage

Metrik ini melacak jumlah memori (dalam byte) yang digunakan oleh klien replika di node cluster. Metrik ini mengukur memori yang digunakan oleh klien replika.

Karena buffer replika berbagi memori dengan backlog replikasi, metrik dapat melaporkan nilai 0 saat replika tidak memicu peningkatan penggunaan memori di luar yang dialokasikan untuk backlog.

redis.googleapis.com/cluster/node/memory/normal_clients_usage Metrik ini melacak jumlah memori (dalam byte) yang digunakan klien non-replika pada node cluster. Metrik ini mengukur konsumsi memori dari koneksi klien non-replika.
redis.googleapis.com/cluster/node/memory/peak_usage Metrik ini melacak memori puncak yang digunakan Memorystore for Redis Cluster pada node cluster. Metrik ini mengukur jumlah memori maksimum (dalam byte) yang digunakan Memorystore for Redis Cluster sejak terakhir kali dimulai.
redis.googleapis.com/cluster/node/memory/rss_usage

Metrik ini melacak penggunaan ukuran set residen (RSS) dari Memorystore for Redis Cluster pada node cluster. Metrik ini menampilkan jumlah byte yang dialokasikan oleh Memorystore for Redis Cluster.

Memantau penggunaan RSS sangat penting karena mencerminkan penggunaan RAM fisik yang sebenarnya sehingga dapat mendeteksi fragmentasi memori yang tinggi. Misalnya, jika RSS mendekati batas container cluster, hal ini dapat menyebabkan masalah OOM.

redis.googleapis.com/cluster/node/memory/scripts_usage Metrik ini melacak overhead memori yang terkait dengan skrip di node cluster. Metrik ini mengukur jumlah byte overhead memori yang digunakan fungsi EVAL. Memori ini dianggap sebagai bagian dari used_memory keseluruhan cluster.
redis.googleapis.com/cluster/node/memory/maxmemory_policy Metrik ini melacak konfigurasi kebijakan pengusiran untuk node cluster. Metrik ini melaporkan setelan maxmemory-policy saat ini untuk node, yang menentukan cara Memorystore for Redis Cluster memilih kunci untuk pengusiran saat mencapai batas maxmemory.
redis.googleapis.com/cluster/node/persistence/aof_enabled Metrik ini menunjukkan apakah persistensi File Hanya Tambah (AOF) diaktifkan di node cluster.
redis.googleapis.com/cluster/node/persistence/async_loading Metrik ini menunjukkan apakah Memorystore for Redis Cluster memuat set data replikasi secara asinkron saat melayani data yang ada. Metrik ini melacak status saat Memorystore for Redis Cluster memuat set data. Hal ini terjadi saat konfigurasi repl-diskless-load diaktifkan dan ditetapkan ke swapdb.
redis.googleapis.com/cluster/node/persistence/loading Metrik ini menunjukkan apakah Memorystore for Redis Cluster memuat file dump di node cluster. Anda dapat menggunakan metrik untuk menilai apakah Memorystore for Redis Cluster memuat data dari penyimpanan persisten, seperti snapshot Database Redis (RDB) atau file AOF.
redis.googleapis.com/cluster/node/persistence/current_cow_peak

Metrik ini melacak penggunaan memori puncak yang terkait dengan operasi copy-on-write (COW) selama proses fork turunan pada node cluster. Metrik ini mengukur ukuran maksimum (dalam byte) memori COW saat fork turunan berjalan. Hal ini terjadi selama operasi yang melibatkan proses forking, seperti membuat snapshot RDB atau melakukan penulisan ulang AOF.

Memantau ukuran COW puncak penting untuk perencanaan kapasitas dan mencegah masalah OOM karena total penggunaan memori node meningkat selama proses fork sebesar jumlah data yang diubah saat fork aktif.

redis.googleapis.com/cluster/node/persistence/current_cow_size

Metrik ini melacak ukuran memori COW saat proses fork turunan aktif di node cluster. Metrik ini mengukur ukuran (dalam byte) memori yang disalin selama proses fork, seperti membuat snapshot RDB atau melakukan penulisan ulang AOF.

Anda dapat menggunakan metrik ini untuk memantau overhead memori real-time dari fork yang sedang berlangsung.

redis.googleapis.com/cluster/node/persistence/rdb_last_bgsave_time_sec

Metrik ini melacak durasi operasi penyimpanan di latar belakang terbaru (BGSAVE) untuk RDB di node cluster. Metrik ini mengukur durasi (dalam detik) yang diperlukan untuk menyelesaikan operasi penyimpanan RDB terakhir.

Anda dapat menggunakan metrik ini untuk memantau dampak performa operasi persistensi, terutama selama peristiwa pemeliharaan atau penskalaan.

redis.googleapis.com/cluster/node/persistence/rdb_last_cow_size

Metrik ini melacak ukuran memori COW selama operasi penyimpanan RDB terbaru pada node cluster. Metrik ini mengukur jumlah memori (dalam byte) yang disalin saat snapshot RDB terakhir dibuat di latar belakang.

Anda dapat menggunakan metrik ini untuk men-debug potensi masalah dengan sinkronisasi penuh selama pemeliharaan atau update konfigurasi karena metrik ini memberikan insight tentang overhead memori dari proses persistensi.

redis.googleapis.com/cluster/node/persistence/current_fork_percentage Metrik ini melacak progres proses fork saat ini di node cluster. Metrik ini menunjukkan persentase penyelesaian untuk operasi fork aktif, seperti yang digunakan untuk snapshot RDB atau penulisan ulang AOF.
redis.googleapis.com/cluster/node/persistence/aof_rewrite_in_progress Metrik ini memberikan status real-time (1 untuk benar dan 0 untuk salah) apakah Memorystore for Redis Cluster melakukan penulisan ulang AOF pada node cluster. Anda dapat menggunakan metrik ini untuk menentukan apakah operasi AOF latar belakang berkontribusi pada peningkatan latensi atau penggunaan memori yang signifikan. Operasi penulisan ulang dapat memicu lonjakan beban sementara.
redis.googleapis.com/cluster/node/persistence/aof_last_cow_size

Metrik ini melacak ukuran memori COW yang digunakan selama operasi penulisan ulang AOF terbaru pada node cluster. Metrik ini mengukur jumlah memori (dalam byte) yang disalin oleh Memorystore for Redis Cluster saat melakukan penulisan ulang AOF latar belakang terakhir.

Anda dapat menggunakan metrik ini untuk memantau ukuran memori COW selama operasi persistensi. Hal ini sangat penting untuk perencanaan kapasitas karena total penggunaan memori node meningkat selama proses fork sebesar jumlah data yang diubah saat fork aktif. Jika Anda tidak mengelola memori COW, Anda mungkin mengalami masalah OOM untuk cluster.

redis.googleapis.com/cluster/node/persistence/aof_last_rewrite_time_sec Metrik ini mengukur berapa lama (dalam detik) operasi penulisan ulang AOF latar belakang terbaru selesai di node cluster. Anda dapat menggunakan metrik ini untuk menilai dampak performa persistensi AOF di latar belakang dan untuk memahami durasi lonjakan beban sementara yang disebabkan oleh operasi penulisan ulang.
redis.googleapis.com/cluster/node/errorstats/errors_count Metrik ini memberikan tampilan terperinci tentang error yang berasal dari bagian ERRORSTATS statistik internal Memorystore for Redis Cluster. Metrik ini mengukur perubahan jumlah error selama suatu interval.
redis.googleapis.com/cluster/node/stats/acl_access_denied_auths_count Metrik ini melaporkan jumlah total kegagalan autentikasi yang ditolak aksesnya (access-denied) pada daftar kontrol akses (ACL) selama suatu interval.
redis.googleapis.com/cluster/node/stats/expire_cycle_cpu_millisecond_count Metrik ini mengukur jumlah kumulatif waktu CPU yang dihabiskan untuk siklus masa berlaku aktif selama interval.
redis.googleapis.com/cluster/node/stats/expired_keys_percentage Metrik ini menunjukkan perkiraan persentase kunci yang habis masa berlakunya pada suatu titik waktu. Metrik ini memberikan insight tentang proses habis masa berlaku. Jika persentasenya terus tinggi, Memorystore untuk Cluster Redis mungkin tidak mengalokasikan siklus CPU latar belakang yang cukup untuk mengimbangi tingkat habis masa berlaku kunci.
redis.googleapis.com/cluster/node/stats/expired_time_cap_reached_count Metrik ini mengukur jumlah kumulatif siklus yang mencapai batas waktu selama interval. Nilai metrik yang tinggi atau meningkat sering kali berkorelasi dengan penggunaan memori yang tinggi dari kunci yang sudah tidak berlaku. Untuk menjaga kualitas set data, mungkin diperlukan lebih banyak siklus CPU di latar belakang.
redis.googleapis.com/cluster/node/stats/pubsub_channels Metrik ini menunjukkan jumlah global channel Pub/Sub yang memiliki langganan klien.
redis.googleapis.com/cluster/node/stats/pubsub_patterns Metrik ini menunjukkan jumlah global pola Pub/Sub yang memiliki langganan klien.
redis.googleapis.com/cluster/node/stats/pubsubshard_channels Metrik ini menunjukkan jumlah global channel shard Pub/Sub yang memiliki langganan klien.
redis.googleapis.com/cluster/node/stats/total_fork_count

Metrik ini mengukur perubahan jumlah total fork selama interval. Metrik ini adalah indikator utama aktivitas latar belakang Memorystore untuk Cluster Redis.

Anda dapat menggunakan metrik ini untuk memantau frekuensi fork untuk perencanaan kapasitas karena setiap proses fork melibatkan memori COW. Memori COW meningkatkan jejak memori keseluruhan node cluster.

redis.googleapis.com/cluster/node/stats/tracking_total_keys Metrik ini menunjukkan jumlah kunci yang dilacak oleh Memorystore for Redis Cluster. Metrik ini adalah komponen fitur pelacakan sisi server, yang memungkinkan klien mempertahankan cache lokal yang dibatalkan saat kunci berubah di Memorystore for Redis Cluster.
redis.googleapis.com/cluster/node/stats/tracking_total_items Metrik ini menunjukkan jumlah total item yang dilacak oleh Memorystore for Redis Cluster. Metrik ini menampilkan jumlah semua klien yang menonton setiap kunci.
redis.googleapis.com/cluster/node/stats/tracking_total_prefixes Metrik ini menunjukkan jumlah awalan yang dilacak dalam tabel prefix Memorystore for Redis Cluster.
redis.googleapis.com/cluster/node/stats/latest_fork_usec Metrik ini menunjukkan durasi operasi fork terbaru (dalam mikrodetik).
redis.googleapis.com/cluster/node/replication/primary_sync_in_progress

Metrik ini menunjukkan apakah cluster utama sedang menyinkronkan dengan replika. Nilai 1 menunjukkan bahwa sinkronisasi sedang berlangsung; nilai 0 menandakan bahwa cluster tidak menyinkronkan dengan replika.

Anda dapat menggunakan metrik ini untuk memecahkan masalah konsistensi data dan memahami progres peristiwa penskalaan atau pemeliharaan.

redis.googleapis.com/cluster/node/replication/sync_partial_ok_count Metrik ini mengukur jumlah upaya sinkronisasi ulang sebagian yang berhasil.
redis.googleapis.com/cluster/node/replication/sync_partial_err_count

Metrik ini mengukur jumlah upaya sinkronisasi ulang parsial yang gagal.

Anda dapat menggunakan metrik ini sebagai indikator kondisi replikasi. Jika sinkronisasi ulang sebagian gagal, replika harus melakukan sinkronisasi ulang penuh. Hal ini melibatkan pembuatan snapshot RDB di cluster utama dan mentransfer seluruh set data melalui jaringan.

redis.googleapis.com/cluster/node/replication/sync_full_count

Metrik ini mengukur perubahan jumlah sinkronisasi ulang penuh yang dilakukan cluster utama dengan replika. Resinkronisasi penuh terjadi saat resinkronisasi sebagian gagal. Hal ini terjadi saat backlog replikasi pada cluster utama tidak cukup besar untuk menyimpan data yang terlewatkan oleh replika selama terputus.

Anda dapat menggunakan metrik ini untuk mendiagnosis masalah kapasitas dan kondisi replikasi untuk cluster.

redis.googleapis.com/cluster/node/memory/maxmemory

Metrik ini mencerminkan setelan konfigurasi maxmemory untuk node cluster, yaitu jumlah maksimum memori yang dapat digunakan Memorystore for Redis Cluster. Setelan ini menentukan kapan Memorystore for Redis Cluster mulai mengeluarkan kunci, berdasarkan setelan yang dikonfigurasi untuk maxmemory-policy.

Anda dapat menggunakan metrik ini untuk perencanaan kapasitas dan pemecahan masalah OOM karena metrik ini menentukan batas atas penggunaan memori untuk penyimpanan data dan overhead server.

Untuk mengetahui informasi selengkapnya tentang setelan maxmemory dan maxmemory-policy, lihat Parameter konfigurasi yang dapat diubah.

Metrik replikasi lintas region

Bagian ini mencantumkan dan menjelaskan metrik replikasi lintas-region.

Nama metrik Deskripsi
redis.googleapis.com/cluster/cross_cluster_replication/secondary_replication_links Metrik ini menunjukkan jumlah link shard antara cluster primer dan sekunder. Dalam grup replikasi lintas region, cluster primer melaporkan jumlah link replikasi CRR yang dimilikinya dengan cluster sekunder dalam grup. Untuk setiap cluster sekunder, jumlah ini diharapkan sama dengan jumlah shard. Jika, secara tidak terduga, jumlahnya turun di bawah jumlah shard, hal ini mengidentifikasi jumlah shard tempat replikasi antara replikator dan pengikut telah berhenti. Dalam kondisi ideal, metrik ini harus memiliki jumlah yang sama dengan jumlah sharding cluster utama.
redis.googleapis.com/cluster/cross_cluster_replication/secondary_maximum_replication_offset_diff Metrik ini mengukur perbedaan offset replikasi maksimum (dalam byte) antara shard primer dan sekunder (replika) dari cluster di berbagai region.
redis.googleapis.com/cluster/cross_cluster_replication/secondary_average_replication_offset_diff Metrik ini mengukur perbedaan offset replikasi rata-rata (dalam byte) antara shard utama dan replika dari cluster di berbagai region. Nilai metrik yang tinggi menunjukkan jeda replikasi, yang dapat Anda selesaikan dengan menjeda lalu melanjutkan replikasi.

Metrik JSON

Bagian ini mencantumkan metrik tingkat node untuk dokumen JSON.

Metrik tingkat node

Metrik ini menawarkan insight mendetail tentang jumlah total dokumen JSON dan jumlah memori yang digunakan oleh dokumen ini.

Nama metrik Deskripsi
redis.googleapis.com/cluster/node/json/documents_count Metrik ini mengukur jumlah total dokumen JSON yang berada di node cluster. Anda dapat menggunakan metrik ini untuk melacak distribusi dan kapasitas data karena metrik ini menunjukkan jumlah dokumen yang diindeks, dihapus, atau digabungkan di tingkat node.
redis.googleapis.com/cluster/node/json/used_memory Metrik ini mengukur jumlah memori (dalam byte atau sebagai persentase memori yang tersedia) yang digunakan oleh dokumen JSON. Anda dapat menggunakan metrik untuk memantau kapasitas, mengidentifikasi node yang terikat memori, dan memicu tindakan penskalaan.

Metrik persistensi

Bagian ini mencantumkan dan menjelaskan metrik persistensi.

Metrik persistensi RDB

Bagian ini mencantumkan dan menjelaskan metrik persistensi RDB.

Metrik tingkat cluster

Bagian ini mencantumkan dan menjelaskan metrik persistensi RDB tingkat cluster.

Nama metrik Deskripsi
redis.googleapis.com/cluster/persistence/rdb_saves_count

Metrik ini melacak jumlah kumulatif pengambilan snapshot persistensi RDB (juga dikenal sebagai penyimpanan RDB) pada node cluster. Anda dapat menggunakan metrik ini untuk memantau frekuensi dan keberhasilan snapshot RDB berdasarkan per-node.

Metrik memiliki kolom status_code. Untuk memeriksa apakah snapshot RDB gagal, filter kolom status_code untuk status 3 - INTERNAL_ERROR.

redis.googleapis.com/cluster/persistence/rdb_save_ages Metrik ini menampilkan usia snapshot distribusi untuk semua node di seluruh cluster. Dalam kasus insiden pemulihan, Anda dapat menggunakan metrik ini untuk melihat jangka waktu keusangan data. Idealnya, distribusi memiliki nilai yang memiliki waktu jeda yang lebih sedikit (atau waktu jeda yang sama) daripada frekuensi pengambilan data.

Metrik tingkat node

Nama metrik Deskripsi
redis.googleapis.com/cluster/node/persistence/rdb_bgsave_in_progress Metrik ini menunjukkan apakah penyimpanan latar belakang RDB (BGSAVE) aktif di node cluster. Status TRUE berarti BGSAVE aktif.
redis.googleapis.com/cluster/node/persistence/rdb_last_bgsave_status Metrik ini menunjukkan apakah operasi BGSAVE pada node cluster selesai atau mengalami error. Status TRUE berarti operasi telah selesai.
redis.googleapis.com/cluster/node/persistence/rdb_saves_count Metrik ini melacak jumlah kumulatif snapshot RDB yang dibuat di node cluster. Anda dapat menggunakan metrik untuk memantau frekuensi dan keberhasilan snapshot di node.
redis.googleapis.com/cluster/node/persistence/rdb_last_save_age Metrik ini mengukur waktu, dalam detik, yang berlalu sejak snapshot RDB terakhir yang berhasil. Anda dapat menggunakan metrik ini untuk memantau keusangan data persistensi RDB pada node cluster.
redis.googleapis.com/cluster/node/persistence/rdb_next_save_time_until Metrik ini mengukur waktu yang tersisa, dalam detik, hingga snapshot RDB berikutnya dijadwalkan terjadi di node cluster. Anda dapat menggunakan metrik ini untuk memantau jadwal persistensi RDB dan melacak kapan snapshot otomatis berikutnya diambil.
redis.googleapis.com/cluster/node/persistence/current_save_keys_total Metrik ini melacak jumlah total kunci yang diproses dalam operasi penyimpanan RDB saat ini pada node cluster.

Metrik persistensi AOF

Bagian ini mencantumkan dan menjelaskan metrik persistensi AOF.

Metrik tingkat cluster

Bagian ini mencantumkan dan menjelaskan metrik persistensi AOF tingkat cluster.

Nama metrik Deskripsi
redis.googleapis.com/cluster/persistence/aof_fsync_lags

Metrik ini mengukur perbedaan waktu (atau jeda) untuk semua node dalam cluster yang terjadi antara penulisan data ke AOF dan saat data tersebut berhasil disinkronkan ke penyimpanan yang tahan lama.

Jika parameter appendfsync disetel ke everysec, Anda dapat menggunakan metrik untuk menilai kondisi persistensi untuk cluster. Idealnya, Anda ingin distribusi jeda memiliki nilai yang memiliki waktu jeda lebih sedikit (atau waktu yang sama) daripada frekuensi sinkronisasi AOF.

redis.googleapis.com/cluster/persistence/aof_rewrite_count

Metrik ini melacak jumlah kumulatif saat node cluster memicu operasi penulisan ulang AOF. Anda dapat menggunakan metrik ini untuk mendiagnosis masalah performa karena frekuensi penulisan ulang AOF yang tinggi dapat menyebabkan lonjakan latensi atau tekanan memori pada cluster.

Metrik memiliki kolom status_code. Untuk memeriksa apakah penulisan ulang AOF gagal, filter kolom ini untuk status 3 - INTERNAL_ERROR.

Metrik tingkat node

Bagian ini mencantumkan dan menjelaskan metrik persistensi AOF tingkat node.

Nama metrik Deskripsi
redis.googleapis.com/cluster/node/persistence/aof_last_write_status Metrik ini menunjukkan status operasi tulis terakhir ke file AOF di node cluster. Jika statusnya TRUE, berarti operasi penulisan berhasil. Anda dapat menggunakan metrik ini untuk memverifikasi bahwa Memorystore for Redis Cluster berhasil mempertahankan data.
redis.googleapis.com/cluster/node/persistence/aof_last_bgrewrite_status Metrik ini menunjukkan status operasi AOF bgrewrite terakhir di node cluster. Jika statusnya TRUE, berarti operasi berhasil.
redis.googleapis.com/cluster/node/persistence/aof_fsync_lag

Metrik ini mengukur selisih waktu (atau jeda) untuk node cluster yang terjadi antara saat data ditulis ke AOF dan saat data tersebut berhasil disinkronkan ke penyimpanan yang tahan lama.

Jika parameter appendfsync disetel ke everysec, Anda dapat menggunakan metrik untuk menilai kondisi persistensi untuk node. Jika proses menyinkronkan data memerlukan waktu lebih dari 1 detik, maka persistensi tertinggal dari data yang masuk, yang dapat menyebabkan penurunan performa atau kehilangan data dalam skenario error.

redis.googleapis.com/cluster/node/persistence/aof_rewrites_count

Metrik ini melacak jumlah kumulatif node cluster yang memicu operasi penulisan ulang AOF. Anda dapat menggunakan metrik ini untuk mendiagnosis masalah performa. Frekuensi penulisan ulang AOF yang tinggi dapat menyebabkan peningkatan latensi atau tekanan memori pada cluster.

Metrik memiliki kolom status_code. Untuk memeriksa apakah penulisan ulang AOF gagal, filter kolom ini untuk status 3 - INTERNAL_ERROR.

redis.googleapis.com/cluster/node/persistence/aof_fsync_errors_count Metrik ini melacak jumlah kumulatif kegagalan panggilan sistem AOF fsync() pada node cluster. Metrik ini hanya berlaku untuk cluster yang mendukung AOF dengan parameter appendfsync ditetapkan ke everysec atau always.

Metrik persistensi umum

Bagian ini mencantumkan dan menjelaskan metrik yang berlaku untuk persistensi AOF dan RDB.

Metrik tingkat node

Bagian ini mencantumkan dan menjelaskan metrik persistensi AOF dan RDB tingkat node.

Nama metrik Deskripsi
redis.googleapis.com/cluster/node/persistence/auto_restore_count

Metrik ini melacak jumlah kumulatif node cluster yang dipulihkan dari file dump persistensi (AOF atau RDB) secara otomatis.

Metrik memiliki kolom status_code. Untuk memeriksa apakah pemulihan gagal, filter kolom ini untuk status 3 - INTERNAL_ERROR.

Contoh kasus penggunaan untuk metrik persistensi

Bagian ini menjelaskan contoh kasus penggunaan untuk metrik persistensi AOF dan RDB.

Memeriksa apakah operasi tulis AOF menyebabkan latensi dan tekanan memori

Misalkan Anda mendeteksi peningkatan latensi atau penggunaan memori pada cluster atau node dalam cluster. Jika hal ini terjadi, periksa apakah penggunaan tambahan terkait dengan persistensi AOF.

Operasi penulisan ulang AOF dapat memicu lonjakan beban sementara. Sebaiknya Anda memeriksa metrik aof_rewrites_count karena metrik ini memberikan jumlah kumulatif penulisan ulang AOF selama masa aktif cluster atau node cluster.

Misalkan metrik ini menunjukkan bahwa peningkatan jumlah penulisan ulang sesuai dengan peningkatan latensi. Untuk mengurangi frekuensi penulisan ulang, kurangi kecepatan penulisan atau tingkatkan jumlah shard.

Memeriksa apakah operasi penyimpanan RDB menyebabkan latensi dan tekanan memori

Misalkan Anda mendeteksi peningkatan latensi atau penggunaan memori pada cluster atau node dalam cluster. Jika hal ini terjadi, periksa apakah penggunaan ekstra terkait dengan persistensi RDB.

Operasi penyimpanan RDB dapat memicu lonjakan beban sementara. Sebaiknya periksa metrik rdb_saves_count karena metrik ini memberikan jumlah kumulatif penyimpanan RDB selama masa aktif cluster atau node cluster.

Misalkan metrik ini menunjukkan bahwa peningkatan jumlah penyimpanan RDB sesuai dengan peningkatan latensi. Untuk mengurangi frekuensi penyimpanan RDB, tingkatkan interval snapshot RDB. Selain itu, untuk mengurangi tingkat beban dasar pengukuran, lakukan penskalaan cluster.

Menafsirkan metrik untuk Memorystore for Redis Cluster

Banyak metrik termasuk dalam kategori berikut: rata-rata, maksimum, dan total.

Kami menyediakan variasi rata-rata dan maksimum dari metrik yang sama sehingga Anda dapat menggunakan kedua metrik untuk mengidentifikasi titik aktif untuk keluarga metrik tersebut.

Nilai total metrik tidak bergantung pada variasi rata-rata dan maksimum metrik. Nilai ini memberikan insight yang terpisah dan tidak terkait dengan tujuan variasi untuk hotspot.

Memahami metrik rata-rata dan maksimum

Misalkan Anda membandingkan nilai metrik average_keyspace_hits dan maximum_keyspace_hits untuk cluster. Seiring bertambahnya perbedaan antara kedua metrik, perbedaan yang lebih besar menunjukkan lebih banyak hotspot untuk hit dalam cluster. Nilai yang mendekati antara metrik menunjukkan bahwa hit didistribusikan secara lebih merata di seluruh node dalam cluster.

Prinsip ini berlaku untuk semua metrik yang memiliki variasi rata-rata dan maksimum dari metrik yang sama.

Contoh hotspot

Jika Anda membandingkan nilai metrik average_keyspace_hits dan maximum_keyspace_hits untuk semua shard dalam cluster, Anda dapat menentukan di shard mana hotspot terjadi. Misalnya, anggaplah shard dalam cluster enam shard memiliki jumlah hit berikut:

  • Shard 1 – 2 hits
  • Shard 2 – 2 hit
  • Shard 3 – 2 hit
  • Shard 4 – 2 hit
  • Shard 5 – 2 hit
  • Shard 6 – 8 hits

Dalam contoh ini, metrik average_keyspace_hits menampilkan nilai 3, tetapi metrik maximum_keyspace_hits menampilkan nilai 8. Hit tidak didistribusikan secara merata di seluruh shard dalam cluster. Shard 6 adalah hotspot karena menangani traffic dalam jumlah yang sangat tinggi secara tidak proporsional.