Memantau dan memecahkan masalah dengan bantuan AI

Dokumen ini menjelaskan cara menggunakan bantuan AI untuk membantu Anda memantau dan memecahkan masalah resource AlloyDB untuk PostgreSQL. Anda dapat menggunakan alat pemecahan masalah yang didukung AI dari AlloyDB dan Gemini Cloud Assist untuk memecahkan masalah kueri lambat dan memecahkan masalah beban database tinggi.

Batasan

Batasan berikut berlaku untuk pemecahan masalah yang dibantu AI di AlloyDB:

  • Pemecahan masalah yang dibantu AI menawarkan insight berharga berdasarkan konfigurasi PostgreSQL standar. Arsitektur unik AlloyDB, termasuk penyimpanan yang tidak digabungkan, caching, columnar engine, dan proses latar belakang yang dioptimalkan, berarti pemeriksaan dan rekomendasi tertentu dapat berbeda dari metrik performa AlloyDB yang sebenarnya. Sebaiknya Anda mempertimbangkan rekomendasi pemecahan masalah yang dibantu AI sebagai titik awal dan merujuk ke dokumentasi AlloyDB untuk mendapatkan panduan yang pasti.
  • Pemecahan masalah dengan dukungan AI tidak didukung untuk konfigurasi AlloyDB berikut:

Sebelum memulai

Pastikan Gemini Cloud Assist disiapkan untuk Google Cloud akun pengguna dan project Anda.

Setelah menyiapkan Gemini Cloud Assist, Anda mungkin perlu menunggu lima menit agar layanan dapat beroperasi sebelum Anda dapat mengaktifkan pemecahan masalah dengan bantuan AI di AlloyDB.

Peran dan izin yang diperlukan

Untuk mendapatkan izin yang Anda perlukan untuk menggunakan pemecahan masalah yang dibantu AI, minta administrator Anda untuk memberi Anda peran IAM berikut di project yang menghosting instance AlloyDB:

Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.

Peran bawaan ini berisi izin yang diperlukan untuk menggunakan pemecahan masalah yang dibantu AI. Untuk melihat izin yang benar-benar diperlukan, perluas bagian Izin yang diperlukan:

Izin yang diperlukan

Izin berikut diperlukan untuk menggunakan pemecahan masalah yang dibantu AI:

  • databaseinsights.performanceIssues.detect
  • databaseinsights.performanceIssues.investigate

Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.

Untuk mengetahui informasi selengkapnya tentang peran dan izin yang diperlukan untuk menggunakan investigasi Gemini Cloud Assist, lihat Memecahkan masalah terkait Investigasi Gemini Cloud Assist.

Mengaktifkan pemecahan masalah yang didukung AI

Saat Anda mengaktifkan pemecahan masalah yang dibantu AI untuk instance AlloyDB, AlloyDB dapat menganalisis performa database Anda dan mendeteksi anomali dalam eksekusi kueri Anda. Saat AlloyDB mendeteksi anomali dalam performa kueri atau mengidentifikasi beban sistem yang tinggi, pemecahan masalah yang dibantu AI membantu Anda menganalisis situasi dengan bukti dan memberikan rekomendasi.

Untuk mengaktifkan pemecahan masalah yang dibantu AI untuk instance AlloyDB Anda, lakukan hal berikut:

  1. Di konsol Google Cloud , buka halaman Clusters.

    Buka Cluster

  2. Dari daftar cluster dan instance, klik instance.

  3. Klik Query Insight.

  4. Klik Aktifkan atau Edit setelan.

  5. Di tab Edit setelan Query Insight, centang kotak Aktifkan fitur Query Insight lanjutan untuk AlloyDB.

    Secara default, tindakan ini akan mencentang kotak Pemecahan masalah dengan bantuan AI.

  6. Klik Simpan.

  7. Untuk hasil terbaik, tunggu 24 jam setelah Anda mengaktifkan pemecahan masalah yang dibantu AI di konsol Google Cloud agar AlloyDB dapat membuat tolok ukur performa rata-rata instance, database, dan kueri Anda.

Untuk mengetahui informasi selengkapnya tentang cara mengaktifkan insight kueri lanjutan, lihat Meningkatkan performa kueri menggunakan insight kueri lanjutan.

Membuka Gemini Cloud Assist

Untuk menggunakan Gemini Cloud Assist dengan AlloyDB, lakukan hal berikut:

  1. Di konsol Google Cloud , buka halaman Clusters.
  2. Buka Cluster
  3. Dari daftar cluster dan instance, klik instance.
  4. Klik Query Insight.
  5. Untuk membuka panel Cloud Assist, klik Open or close Gemini Cloud Assist chat.
  6. Di panel Cloud Assist, masukkan perintah yang menjelaskan informasi yang Anda minati.
  7. Setelah Anda memasukkan perintah, klik Kirim perintah. Gemini menampilkan respons terhadap perintah Anda berdasarkan informasi dari satu jam terakhir.

Memecahkan masalah kueri lambat

Untuk menggunakan bantuan AI dalam memecahkan masalah kueri lambat Anda, buka dasbor Query insights untuk instance AlloyDB Anda di konsol Google Cloud .

Tabel kueri teratas

Anda dapat mulai memecahkan masalah kueri lambat dengan bantuan AI di bagian Tabel kueri teratas pada dasbor Query Insights.

AlloyDB dapat membantu Anda mengidentifikasi kueri mana yang performanya lebih lambat dari rata-rata selama periode waktu deteksi tertentu. Setelah Anda memilih rentang waktu di dasbor Analisis kueri, AlloyDB akan memeriksa apakah ada kueri yang performanya lebih lambat dari rata-rata dengan menggunakan periode waktu deteksi 24 jam sebelum akhir rentang waktu yang Anda pilih.

Saat Anda menyesuaikan filter rentang waktu pada diagram Beban database, atau filter lainnya seperti database atau pengguna, AlloyDB akan memuat ulang Tabel kueri teratas dan menjalankan kembali deteksi anomali berdasarkan daftar kueri baru dan periode waktu deteksi yang diperbarui.

Saat AlloyDB mendeteksi anomali:

  • AlloyDB melakukan analisis performa dasar untuk kueri Anda.

  • Setiap kueri yang tercantum dalam tabel memiliki ikon Selidiki atau ikon Peringatan warning_spark yang ditampilkan di samping nilai Waktu eksekusi rata-rata (ms) kueri.

Jika kueri berjalan lebih lambat dari yang diperkirakan, ikon Peringatan warning_spark akan ditampilkan. Saat Anda mengklik salah satu ikon, Gemini Cloud Assist digunakan untuk membantu menganalisis eksekusi kueri dan menawarkan pengamatan tentang apa yang mungkin menyebabkan masalah. Berdasarkan pengamatan ini, Gemini Cloud Assist membuat hipotesis yang dapat membantu Anda mengatasi masalah tersebut.

Untuk memecahkan masalah kueri lambat di tabel Top queries di dasbor Query insights, lakukan hal berikut:

  1. Di konsol Google Cloud , buka halaman Clusters.
  2. Buka Cluster
  3. Dari daftar cluster dan instance, klik instance.
  4. Klik Query Insight.
  5. Pada diagram Kueri yang dieksekusi, gunakan filter Rentang waktu untuk memilih 1 jam, 6 jam, 1 hari, 7 hari, 30 hari, atau rentang kustom.
  6. Di tabel Top queries, di tab Queries, tinjau daftar kueri untuk database Anda.
  7. Jika ikon Peringatan warning_spark muncul di samping nilai Waktu eksekusi rata-rata (ms) kueri untuk suatu kueri, berarti AlloyDB telah mendeteksi anomali dalam performa kueri Anda. AlloyDB memeriksa anomali dalam jangka waktu 24 jam yang terjadi sebelum akhir rentang waktu yang Anda pilih.
  8. Klik ikon Peringatan warning_spark.
  9. Dalam dialog Kueri lebih lambat dari biasanya, klik Investigasi Baru untuk mulai memecahkan masalah dengan bantuan AI dari Gemini Cloud Assist. Setelah sekitar dua menit, panel Detail investigasi akan terbuka dengan bagian berikut:
    • Masalah. Deskripsi masalah yang sedang diselidiki, termasuk waktu mulai dan berhenti penyelidikan.
    • Pengamatan. Daftar pengamatan tentang masalah ini. Misalnya, hal ini dapat mencakup detail pertentangan kunci, seperti rasio tunggu kunci kueri yang lebih lama dari yang diharapkan.
    • Hipotesis. Daftar tindakan yang direkomendasikan AI untuk membantu mengatasi kueri yang berjalan lambat.
  10. Jika Anda ingin melihat semua penyelidikan yang terkait dengan kueri, di dialog Kueri lebih lambat dari biasanya, klik Lihat semua penyelidikan. Halaman Gemini Cloud Assist akan terbuka dan Anda dapat melihat semua investigasi yang sedang berjalan dan yang telah selesai sebelumnya. Anda dapat memfilter halaman menurut project atau label, misalnya, untuk menemukan penyelidikan spesifik yang Anda butuhkan.

    Atau, untuk melihat semua penyelidikan sebelumnya, klik ikon Notifikasi , lalu pilih notifikasi yang terkait dengan penyelidikan apa pun untuk membuka halaman Gemini Cloud Assist.

  11. Atau, jika Anda ingin menyelidiki latensi kueri apa pun, selesaikan langkah-langkah berikut:
    1. Identifikasi kueri tertentu yang ingin Anda selidiki.
    2. Di kolom Tindakan, klik ikon Tindakan yang terkait dengan kueri tersebut.
    3. Pilih Investigate latency di menu untuk menjalankan investigasi Gemini Cloud Assist.

Detail kueri

Anda juga dapat memecahkan masalah kueri lambat dengan bantuan AI dari halaman Detail kueri.

  1. Di konsol Google Cloud , buka halaman Clusters.
  2. Buka Cluster
  3. Dari daftar cluster dan instance, klik instance.
  4. Klik Query insights untuk membuka dasbor Query insights.
  5. Di dasbor Query insights, klik kueri di Kueri teratas yang ingin Anda lihat. Halaman Query details akan muncul.
  6. Opsional: Gunakan Filter rentang waktu untuk memilih 1 jam, 6 jam, 1 hari, 7 hari, 30 hari, atau rentang kustom. Saat Anda menyesuaikan Filter rentang waktu di halaman Detail kueri AlloyDB akan menjalankan ulang deteksi anomali.
  7. Jika AlloyDB tidak mendeteksi anomali untuk kueri, Anda masih dapat menjalankan analisis pada kueri dengan mengklik tombol Selidiki di kartu Latensi kueri.

Menganalisis latensi kueri

Dengan bantuan AI, Anda dapat menganalisis dan memecahkan masalah detail latensi kueri.

Periode waktu analisis

Periode waktu analisis terdiri dari 24 jam yang terjadi sebelum akhir rentang waktu yang Anda pilih dalam diagram Pemuatan database di dasbor Query insights atau halaman Detail kueri. AlloyDB menggunakan jangka waktu ini untuk membandingkan metrik dasar dengan metrik yang diambil selama jangka waktu anomali.

Di halaman Detail kueri, jika AlloyDB telah mendeteksi anomali pada kueri, setelah Anda memilih kueri dari dasbor Insight kueri, AlloyDB akan melakukan analisis performa dasar untuk kueri menggunakan 24 jam terakhir sejak akhir anomali. Jika AlloyDB belum mendeteksi anomali pada kueri dan menjalankan deteksi anomali pada kueri lagi, maka AlloyDB menggunakan 48 jam sebelum akhir rentang waktu yang dipilih sebagai dasar pengukuran performa untuk jangka waktu analisis.

Periode anomali yang terdeteksi

Periode anomali yang terdeteksi menunjukkan jangka waktu saat AlloyDB menemukan perubahan anomali dalam performa kueri. AlloyDB menggunakan performa dasar yang diukur untuk kueri selama periode waktu analisis.

Jika AlloyDB mendeteksi beberapa anomali untuk kueri dalam jangka waktu yang dipilih, AlloyDB akan menggunakan anomali yang terakhir terdeteksi.

Contoh perintah performa kueri

Anda juga dapat menggunakan Gemini Cloud Assist untuk memasukkan perintah guna membantu Anda meningkatkan performa kueri. Gemini Cloud Assist menjawab pertanyaan untuk instance dan database AlloyDB yang dipilih.

Perintah Jenis respons
Apa saja kueri teratas berdasarkan latensi di database saya?
  • Ringkasan kueri yang diurutkan berdasarkan latensi. Gemini mencakup respons berdasarkan filter rentang waktu yang dipilih dalam diagram pemuatan database insight kueri.
  • Panduan tentang cara mengidentifikasi dan mengurutkan kueri menurut latensi.
Apa kueri paling lambat dalam instance database ini? Panduan tentang cara mengidentifikasi kueri paling lambat berdasarkan latensi.

Memecahkan masalah beban database yang tinggi

Dengan mengakses dasbor Insight kueri di konsol Google Cloud , Anda dapat menganalisis database dan memecahkan masalah peristiwa saat sistem Anda mengalami beban database yang lebih tinggi dari rata-rata. AlloyDB menggunakan data 24 jam yang terjadi sebelum rentang waktu yang Anda pilih untuk menghitung perkiraan beban database Anda. Anda dapat menyelidiki alasan peristiwa pemuatan yang lebih tinggi dan menganalisis bukti di balik penurunan performa. AlloyDB juga memberikan rekomendasi untuk mengoptimalkan database Anda guna meningkatkan performa.

Untuk menggunakan bantuan AI dalam memecahkan masalah beban database yang tinggi, buka halaman Ringkasan Instance atau dasbor Query insights di konsol Google Cloud .

Halaman ringkasan instance

Pecahkan masalah beban database tinggi dengan bantuan AI di halaman Instance overview menggunakan langkah-langkah berikut:

  1. Di konsol Google Cloud , buka halaman Clusters.
  2. Buka Cluster
  3. Dari daftar cluster dan instance, klik instance.
  4. Di halaman Overview, dari menu Chart, pilih metrik untuk database. Anda dapat memilih metrik apa pun, misalnya, pemakaian CPU.
  5. Opsional: Untuk memilih jangka waktu analisis tertentu, gunakan filter Rentang waktu untuk memilih 1 jam, 6 jam, 1 hari, 7 hari, 30 hari, atau rentang kustom.

    Anda dapat memperbesar bagian tertentu dari diagram tempat Anda melihat area beban tinggi yang ingin dianalisis. Misalnya, area beban tinggi dapat menampilkan tingkat pemakaian CPU yang mendekati 100%. Untuk memperbesar, Anda dapat mengklik dan memilih bagian diagram.

    Klik tombol Selidiki performa untuk mulai memecahkan masalah beban database yang tinggi dengan bantuan AI dari Gemini Cloud Assist.

    Setelah sekitar dua menit, panel Detail investigasi akan terbuka dengan bagian berikut:

    • Masalah. Deskripsi masalah yang sedang diselidiki, termasuk waktu mulai dan berhenti penyelidikan.
    • Pengamatan. Daftar pengamatan tentang masalah ini. Misalnya, hal ini dapat mencakup detail pertentangan kunci, seperti rasio tunggu kunci kueri yang lebih lama dari yang diharapkan.
    • Hipotesis. Daftar tindakan yang direkomendasikan AI untuk membantu mengatasi kueri yang berjalan lambat.

Dasbor Query Insight

Pecahkan masalah beban database yang tinggi dengan bantuan AI di dasbor Query Insight menggunakan langkah-langkah berikut:

  1. Di konsol Google Cloud , buka halaman Clusters.
  2. Buka Cluster
  3. Dari daftar cluster dan instance, klik instance.
  4. Klik Query insights untuk membuka dasbor Query insights.
  5. Opsional: Gunakan filter Rentang waktu untuk memilih 1 jam, 6 jam, 1 hari, 7 hari, 30 hari, atau rentang kustom.
  6. Anda dapat memperbesar bagian tertentu dari diagram tempat Anda melihat area dengan beban database yang lebih tinggi berdasarkan waktu eksekusi kueri. Untuk memperbesar, Anda dapat mengklik dan memilih bagian diagram.

    Di Database load chart, klik tombol Investigate performance untuk mulai memecahkan masalah beban database yang tinggi dengan bantuan AI dari Gemini Cloud Assist.

    Setelah sekitar dua menit, panel Detail investigasi akan terbuka dengan bagian berikut:

    • Masalah. Deskripsi masalah yang sedang diselidiki, termasuk waktu mulai dan berhenti penyelidikan.
    • Pengamatan. Daftar pengamatan tentang masalah ini. Misalnya, hal ini dapat mencakup detail pertentangan kunci, seperti rasio tunggu kunci kueri yang lebih lama dari yang diharapkan.
    • Hipotesis. Daftar tindakan yang direkomendasikan AI untuk membantu mengatasi kueri yang berjalan lambat.

Menganalisis beban database yang tinggi

Dengan bantuan AI, Anda dapat menganalisis dan memecahkan masalah detail pemuatan database.

Periode waktu analisis

AlloyDB menganalisis database Anda untuk jangka waktu yang Anda pilih dalam diagram pemuatan database dari dasbor Query insights atau halaman Instance overview. Jika Anda memilih jangka waktu kurang dari 24 jam, AlloyDB akan menganalisis seluruh jangka waktu. Jika Anda memilih jangka waktu lebih dari 24 jam, AlloyDB hanya akan memilih 24 jam terakhir dari jangka waktu tersebut untuk dianalisis.

Untuk menghitung analisis performa dasar database Anda, AlloyDB menyertakan periode waktu dasar selama 24 jam dalam periode waktu analisisnya. Jika periode waktu yang Anda pilih terjadi pada hari selain hari Senin, AlloyDB akan menggunakan periode waktu dasar 24 jam sebelumnya dari periode waktu yang Anda pilih. Jika jangka waktu yang Anda pilih terjadi pada hari Senin, AlloyDB akan menggunakan jangka waktu dasar 7 hari sebelumnya dari jangka waktu yang Anda pilih.

Analisis metrik

Saat memulai analisis, AlloyDB akan memeriksa perubahan signifikan dalam berbagai metrik, termasuk, tetapi tidak terbatas pada, berikut ini:

  • Kueri per detik (QPS)
  • CPU
  • Memori
  • I/O Disk

AlloyDB membandingkan data gabungan dasar untuk database Anda dalam data performa jangka waktu analisis Anda. Jika AlloyDB mendeteksi perubahan signifikan pada nilai minimum untuk metrik utama, AlloyDB akan menunjukkan kemungkinan masalah pada database Anda. Situasi yang teridentifikasi dapat menjelaskan penyebab utama beban tinggi pada database Anda selama jangka waktu yang dipilih.

Rekomendasi

Setelah Gemini Cloud Assist menyelesaikan analisis, bagian Hipotesis di panel Detail investigasi mencantumkan insight yang dapat ditindaklanjuti untuk membantu memperbaiki masalah.

Untuk beberapa situasi, berdasarkan analisis, mungkin tidak ada rekomendasi.

Contoh perintah performa sistem

Anda juga dapat menggunakan Gemini Cloud Assist untuk memasukkan perintah guna mengumpulkan informasi tentang performa sistem Anda. Gemini Cloud Assist menjawab pertanyaan untuk instance AlloyDB yang dipilih.

Perintah Jenis respons
Berapa banyak entri log error untuk instance database ini dalam 7 hari terakhir? Ringkasan entri log yang dikelompokkan berdasarkan jenis tingkat keparahannya. Gemini mencakup respons berdasarkan filter rentang waktu yang dipilih dalam diagram performa instance.
Berapa penggunaan CPU untuk instance database ini sekitar pukul 14.00 hari ini? Hasil metrik dalam rentang persentase untuk pemakaian CPU dalam interval waktu.

Mendapatkan rekomendasi indeks

Anda dapat memperoleh rekomendasi indeks dari AlloyDB di insight kueri. Untuk mengetahui informasi selengkapnya, lihat Ringkasan penasihat indeks.

Contoh perintah rekomendasi indeks

Gunakan Gemini Cloud Assist untuk mendapatkan informasi selengkapnya tentang cara menggunakan indeks di database Anda. Gemini Cloud Assist menjawab pertanyaan untuk instance AlloyDB yang dipilih.

Perintah Jenis respons
Menampilkan rekomendasi indeks untuk kueri yang dijalankan dalam 7 hari terakhir. Panduan tentang jenis kueri yang dapat memperoleh manfaat dari indeks.

Memantau kueri aktif

Gunakan dasbor Insight kueri untuk memantau kueri aktif, dan jika perlu, akhiri proses yang berjalan lama. Untuk mengetahui informasi selengkapnya, lihat Memantau kueri aktif.

Contoh perintah kueri aktif

Gunakan Gemini Cloud Assist untuk mengetahui informasi selengkapnya tentang kueri yang menyebabkan latensi tinggi atau beban CPU tinggi. Gemini Cloud Assist menjawab pertanyaan untuk instance AlloyDB yang dipilih.

Perintah Jenis respons
Apa saja kueri teratas yang saat ini berjalan di database saya? Panduan tentang cara menemukan kueri yang berjalan paling lama dan paling banyak menggunakan resource.

Memecahkan masalah keterlambatan replika baca

Anda dapat menganalisis jeda replikasi menggunakan Gemini Cloud Assist atau dasbor Ringkasan di konsol Google Cloud .

Bantuan AI mengevaluasi faktor-faktor berikut untuk menentukan alasan replika baca tertinggal dari instance utama.

  • Volume penulisan instance utama

    Tingkat modifikasi data yang tinggi pada instance utama dapat menghasilkan log WAL lebih cepat daripada yang dapat diputar ulang oleh replika. Gemini memeriksa pola penulisan "bursty" yang berkorelasi dengan lonjakan latensi.

  • Batasan resource (CPU/Memori)

    Pemutaran ulang replikasi adalah proses yang intensif CPU. Gemini menganalisis apakah tingkat mesin replika tidak cukup untuk menangani beban pemutaran ulang saat ini atau apakah kueri baca serentak menghabiskan resource proses pemutaran ulang.

  • Performa jaringan dan penyimpanan

    Dalam deployment lintas region, throughput jaringan dapat memengaruhi seberapa cepat log dikirim ke replika. AI menilai metadata operasi internal untuk mengidentifikasi apakah hambatan ada pada transportasi atau penerapan log.

Menyelidiki jeda replika baca

Untuk menggunakan bantuan AI dalam memecahkan masalah keterlambatan replika baca, lakukan hal berikut:

  1. Di konsol Google Cloud , buka halaman Clusters.
  2. Buka Cluster
  3. Buka System Insights. Dari menu Instance, pilih replika baca Anda.
  4. Di panel Resolve database issues with AI-assisted troubleshooting, klik Explore investigations.
  5. Di jendela Opsi investigasi, cari bagian Keterlambatan replika baca.
  6. Opsional: Pilih jangka waktu analisis tertentu menggunakan filter Rentang waktu, baik 1 jam, 6 jam, 1 hari, 7 hari, atau rentang kustom.
  7. Klik Investigasi.

    Gemini memulai analisis sinyal khusus replikasi, termasuk kecepatan pembuatan WAL (Write Ahead Log) dan kecepatan pemutaran ulang replika. Setelah analisis selesai, panel Detail investigasi akan menampilkan bagian berikut:

    • Masalah: Ringkasan durasi jeda dan "jeda byte" atau "jeda waktu" saat ini antara server utama dan replika.
    • Pengamatan: Metrik tertentu seperti pemakaian CPU yang tinggi pada replika atau pertentangan kunci selama pemutaran ulang WAL.
    • Hipotesis: Langkah-langkah yang direkomendasikan AI, seperti mengoptimalkan transaksi penulisan berat di primer atau meningkatkan tingkat mesin replika.

Contoh perintah jeda replika baca

Anda juga dapat menggunakan Gemini Cloud Assist dan kueri natural language untuk memecahkan masalah jeda antara replika baca dan instance utama Anda.

Perintah Jenis respons
Mengapa jeda replika baca AlloyDB saya sangat tinggi? Panduan tentang cara mengurangi jeda replika dengan menyesuaikan database atau mengonfigurasi cluster.

Langkah berikutnya