Saat mengelola musim puncak atau peristiwa dengan traffic tinggi di cloud, terdapat tiga tahap utama:
- Persiapan: selesaikan aktivitas dan tugas untuk mempersiapkan peristiwa, termasuk peninjauan arsitektur, perencanaan kapasitas, dan pembuatan reservasi.
- Pelaksanaan: saat acara Anda dimulai, pantau secara ketat dan tanggapi sesuai kebutuhan.
- Analisis: setelah peristiwa selesai, tinjau keberhasilan, kendala yang terjadi, dan cara meningkatkan kualitas untuk peristiwa berikutnya.
Anda harus memahami dan mengikuti praktik terbaik di setiap tahap agar layanan Anda tetap berjalan dengan sedikit atau tanpa waktu henti, serta tanpa penurunan performa maupun kepuasan pengguna selama peristiwa berlangsung.
Persiapan: menjelaskan proses perencanaan peristiwa Anda
Selama tahap persiapan untuk peristiwa kapasitas puncak, Anda harus berkoordinasi dengan tim akun atau TAM untuk membantu meninjau arsitektur, membuat diagram, linimasa, dan checklist peluncuran, memeriksa kuota layanan berdasarkan perkiraan profil traffic, dan menentukan dampak keseluruhan terhadap project Anda.
Perencanaan sebaiknya dimulai jauh sebelum tanggal peristiwa. Dalam beberapa kasus, Anda perlu mulai merencanakan beberapa bulan sebelumnya saat layanan Anda masih dalam tahap pengembangan. Mengumpulkan tim yang dapat membantu Anda meninjau alur kerja peristiwa yang diusulkan, perkiraan audiens, persyaratan dan kriteria keberhasilan, serta keseluruhan proses distribusi media. Fase persiapan harus mencakup penilaian risiko, perencanaan mitigasi, dan peninjauan kesiapan operasional untuk memastikan alur kerja Anda dirancang dengan baik.
Untuk mengetahui informasi lebih lanjut, tinjau Framework ArsitekturGoogle Cloud , yang memberikan rekomendasi untuk membantu arsitek, developer, administrator, dan praktisi cloud lainnya dalam merancang dan mengoperasikan topologi cloud yang aman, efisien, tangguh, berperforma tinggi, dan hemat biaya.
Pelaksanaan: memantau dan menanggapi selama proses berlangsung
Saat musim puncak atau peristiwa peluncuran dimulai, Anda perlu memantau aktivitas dengan cermat dan merespons sesuai kebutuhan. Setelah menyiapkan pemantauan, pemberitahuan, dan logging pada tahap persiapan, Anda dapat memantau traffic, log, dan tingkat kuota, lalu menggunakan informasi tersebut untuk menemukan akar masalah dan menyelesaikannya dengan cepat. Untuk mengetahui informasi lebih lanjut, lihat Meninjau pemberitahuan dan dasbor.
Jika terjadi masalah, proses manajemen insiden dan eskalasi yang jelas sangat penting untuk meminimalkan upaya dan waktu yang diperlukan untuk mengatasi dan menyelesaikan masalah tersebut. Jika Anda belum melakukannya, buatlah proses manajemen insiden. Untuk mengetahui informasi lebih lanjut, lihat Bersiap untuk menyelesaikan masalah selama peristiwa.
Analisis: meninjau dan mendokumentasikan analisis Anda
Setelah musim puncak atau peristiwa peluncuran selesai, tinjau dan analisis peristiwa tersebut, lalu dokumentasikan pelajaran yang diperoleh agar dapat diterapkan pada peristiwa besar berikutnya.
Fokuslah pada area berikut:
Rekapitulasi linimasa: catat waktu traffic mulai meningkat serta peristiwa penting (puncak) yang terjadi selama periode peristiwa. Mengidentifikasi waktu terjadinya masalah, jika ada.
Analisis akar masalah: selidiki setiap masalah yang terjadi. Apakah ada hal yang bisa Anda atau Google Cloud lakukan dengan cara berbeda? Apakah hal ini perlu dipertimbangkan untuk waktu berikutnya? Dokumentasikan pelajaran yang diperoleh dan langkah yang diperlukan untuk perbaikan di masa mendatang.
Bandingkan prediksi dengan data sebenarnya: analisis prediksi traffic dengan traffic sebenarnya yang Anda catat. Di mana resource tambahan diperlukan? Di mana resource kurang dimanfaatkan atau tidak diperlukan?
Retrospektif: membagikan dan meninjau kembali informasi sebelumnya dengan pemangku kepentingan utama. Mempromosikan budaya tanpa saling menyalahkan, dengan menganggap semua orang yang terlibat memiliki niat baik dan Anda berfokus untuk mengidentifikasi faktor penyebab tanpa menunjuk individu atau tim mana pun.