Halaman ini menjelaskan beberapa aspek yang perlu dipertimbangkan saat mengonfigurasi layanan Cloud Run Anda. Tidak ada solusi tunggal untuk pengoptimalan biaya. Penting untuk memantau kebutuhan, anggaran, dan sumber daya Anda untuk menentukan apa yang paling cocok untuk Anda.
Praktik terbaik yang diuraikan dalam dokumen ini khusus untuk Cloud Run. Produk ini tidak mencakup produk Google Cloud lainnya.
Konfigurasi resource
Mengoptimalkan layanan untuk biaya melibatkan pertimbangan banyak konfigurasi yang berbeda. Sesuaikan konfigurasi ini dengan kebutuhan Anda untuk membuat layanan yang andal dan hemat biaya.
Memilih region yang sesuai
Lokasi deployment layanan Anda memengaruhi total biaya. Cloud Run menggunakan model harga regional dua tingkat. Region Tingkat 1 menawarkan biaya per vCPU dan memori yang lebih rendah dibandingkan dengan region Tingkat 2, jadi pertimbangkan untuk men-deploy ke region Tingkat 1.
Wajibkan autentikasi
Saat mengonfigurasi layanan Cloud Run, Anda dapat memilih salah satu dari dua opsi autentikasi:
- Izinkan akses publik: Pemeriksaan autentikasi tidak diperlukan.
- Wajibkan autentikasi: Hanya pengguna terautentikasi yang dapat mengakses layanan Cloud Run Anda.
Sebaiknya Anda mewajibkan autentikasi, kecuali jika Anda memiliki kebutuhan khusus untuk mengizinkan akses publik. Tindakan ini akan mencegah permintaan yang tidak diinginkan yang dapat menimbulkan biaya.
Jika Anda mengelola pengguna dengan Identity-Aware Proxy (IAP), IAP mungkin memiliki biaya terkaitnya sendiri.
Membandingkan penagihan berbasis instance dan berbasis permintaan
Layanan Cloud Run memiliki dua setelan penagihan:
- Penagihan berbasis permintaan (default): Anda ditagih per permintaan, ditambah tarif per detik yang lebih tinggi untuk vCPU dan memori yang digunakan selama pemrosesan permintaan.
- Penagihan berbasis instance: Anda akan ditagih selama masa aktif instance. Tidak ada biaya per permintaan, dan tarif per detik untuk vCPU dan memori lebih rendah.
Untuk layanan dengan traffic yang stabil dan bervariasi secara perlahan, pertimbangkan untuk menggunakan penagihan berbasis instance. Penghematan dari tarif komputasi yang lebih rendah dan tanpa biaya per permintaan lebih besar daripada biaya untuk membayar waktu tunggu antara permintaan. Untuk layanan dengan traffic sporadis, bergejolak, atau tajam, pertimbangkan untuk menggunakan penagihan berbasis permintaan. Jika Anda masih tidak yakin tentang setelan penagihan yang akan digunakan, lihat Pemberi Rekomendasi. Recommender melihat traffic yang diterima oleh layanan Cloud Run Anda selama sebulan terakhir dan memberikan rekomendasi untuk beralih dari penagihan berbasis permintaan ke penagihan berbasis instance, jika hal ini lebih murah.
Mengonfigurasi penskalaan layanan di tingkat layanan
Untuk menetapkan dasar keamanan biaya, konfigurasikan instance maksimum untuk layanan Anda. Menetapkan jumlah maksimum yang lebih tinggi memprioritaskan ketersediaan, tetapi menimbulkan potensi risiko penagihan dari lonjakan traffic yang tidak terduga atau kesalahan konfigurasi. Anda harus mengonfigurasi setelan ini di tingkat layanan saat pertama kali men-deploy layanan untuk menetapkan dasar biaya. Untuk alat kontrol biaya tambahan, lihat kuota alokasi resource atau anggaran dan pemberitahuan penagihan.
Mengoptimalkan pemanfaatan CPU dan memori
Biaya layanan Cloud Run Anda dipengaruhi oleh konfigurasi CPU/memori dan durasi layanan Anda aktif, di antara faktor-faktor lainnya. Penyediaan sumber daya yang berlebihan dapat meningkatkan biaya Anda. Untuk menentukan konfigurasi mana yang mungkin paling cocok untuk layanan Anda:
- Tetapkan konfigurasi dasar.
- Pantau metrik Anda saat menguji metrik pemanfaatan CPU dan memori di Cloud Monitoring.
- Sesuaikan konfigurasi Anda sesuai kebutuhan.
Jika penggunaan CPU selalu rendah saat beban puncak, pertimbangkan untuk mengurangi alokasi vCPU. Jika latensi tinggi, pertimbangkan untuk meningkatkan alokasi vCPU.
Jika penggunaan memori terus rendah, pertimbangkan untuk mengurangi memori yang dialokasikan. Jika latensi tinggi dan penggunaan memori mendekati 100%, pertimbangkan untuk meningkatkan memori yang dialokasikan. Jika Anda mengalami error Kehabisan Memori (OOM), Anda harus meningkatkan memori yang dialokasikan atau mengubah aplikasi untuk mencegah kebocoran memori atau menggunakan lebih sedikit memori. Lihat dasbor Cloud Monitoring untuk lebih memahami pemanfaatan memori Anda.
Mengonfigurasi GPU
Semua layanan Cloud Run yang menggunakan GPU harus dikonfigurasi dengan penagihan berbasis instance. Artinya, instance Cloud Run ditagih untuk seluruh siklus proses instance, bahkan saat tidak ada permintaan yang masuk. Konfigurasi CPU dan memori minimum yang diperlukan untuk GPU juga memengaruhi biaya layanan Cloud Run Anda. Secara default, redundansi per zona GPU diaktifkan. Menonaktifkan redundansi zona GPU akan menghasilkan biaya per detik GPU yang lebih rendah, tetapi tidak menjamin kapasitas yang dipesan untuk skenario failover.
Mengoptimalkan biaya jaringan
Saat mengonfigurasi opsi jaringan untuk layanan Anda, pertimbangkan hal-hal berikut:
- Tempatkan resource Anda secara bersamaan: Coba deploy layanan Cloud Run Anda di region yang sama dengan database backend Anda (seperti Cloud SQL atau Firestore) dan bucket Cloud Storage. Transfer data antar-resource dalam region yang sama tidak dikenai biaya. Google Cloud
- Beralih ke traffic keluar VPC Langsung: Jika Anda merutekan traffic ke resource jaringan VPC internal secara aman, pertimbangkan untuk beralih dari konektor Akses VPC Serverless ke traffic keluar VPC Langsung. Traffic keluar VPC langsung diskalakan ke nol, sehingga menghilangkan biaya dasar komputasi dan biaya tidak ada aktivitas yang terkait dengan instance konektor.
- Gunakan Cloud CDN: Offload aset statis dan konten yang sangat dapat di-cache dengan menempatkan Cloud CDN di depan layanan Cloud Run Anda. Menyajikan data dari edge jauh lebih murah daripada membayar traffic keluar internet standar langsung dari Cloud Run.
- Memantau traffic keluar internet: Traffic masuk (ingress) selalu gratis, dan Anda menerima transfer data keluar internet gratis sebesar 1 GiB per bulan di Amerika Utara. Fokuskan upaya pemantauan Anda pada traffic keluar yang melintasi batas region atau melampaui paket gratis.
Mengonfigurasi setelan konkurensi
Saat lebih banyak instance memproses permintaan, Cloud Run mengalokasikan lebih banyak CPU dan memori dengan biaya yang lebih tinggi. Setelan konkurensi yang lebih tinggi memungkinkan lebih sedikit instance menangani volume permintaan yang sama, sehingga dapat mengurangi biaya. Namun, kode aplikasi harus dapat menangani permintaan paralel secara efisien. Untuk mengetahui informasi selengkapnya, lihat Menyesuaikan serentak untuk penskalaan otomatis dan pemanfaatan resource.
Diskon abonemen
Diskon abonemen (DA) memberikan harga diskon sebagai imbalan atas komitmen untuk terus menggunakan Cloud Run selama jangka waktu tertentu. CUD berlaku di tingkat akun Penagihan Cloud. Anda dapat membeli CUD fleksibel Compute untuk resource Cloud Run. CUD fleksibel Compute tidak berlaku untuk GPU atau jaringan. Lihat Menghitung diskon abonemen yang fleksibel di Compute Engine untuk mengetahui detail selengkapnya.
Alat yang berguna
Anda dapat menggunakan alat berikut untuk lebih memahami biaya dan membantu menghindari pembengkakan biaya.
Ringkasan Cloud Run: Panel penagihan
Halaman ringkasan Cloud Run menampilkan biaya per nama resource di panel Penagihan. Angka-angka tersebut mencerminkan biaya kotor untuk rentang waktu yang dipilih per resource. Alat ini membantu Anda lebih memahami biaya resource Anda.
Pemberitahuan anggaran
Buat pemberitahuan anggaran di Penagihan Cloud untuk melacak biaya aktual terhadap biaya yang direncanakan. Anggaran adalah mekanisme pemberitahuan yang memicu notifikasi saat batas pengeluaran terlampaui, bukan batas pengeluaran yang ketat. Ada keterlambatan data penagihan yang dapat memengaruhi waktu Anda menerima pemberitahuan.
Penagihan Cloud
Penagihan Cloud adalah kumpulan alat yang membantu Anda melacak dan memahami pengeluaran Google Cloud . Alat ini membantu Anda memantau biaya penggunaan, memperkirakan pengeluaran, dan mengidentifikasi peluang untuk menghemat biaya.
Cost Explorer
Cost Explorer memungkinkan Anda memahami biaya dan pemanfaatan resource Anda. Gunakan Cost Explorer untuk:
- Filter resource Anda menurut biaya untuk melihat resource mana yang paling mahal.
- Pahami proporsi biaya yang disebabkan oleh konfigurasi seperti vCPU, GPU, jaringan, dan lainnya.
- Lacak dampak perubahan pada konfigurasi resource terhadap tagihan bulanan Anda.
Google Cloud kalkulator harga
Ringkasan hargaGoogle Cloud berisi informasi untuk lebih memahami model harga Google Cloud . Di sini juga Anda dapat menemukan Daftar harga mendetail. Anda dapat memperkirakan biaya dengan menambahkan dan mengonfigurasi produk menggunakan kalkulator harga.
Pemberi Rekomendasi
Recommender adalah alat yang memberikan rekomendasi dan insight penggunaan untuk produk Cloud.
Pemberi rekomendasi otomatis melihat traffic yang diterima oleh layanan Cloud Run Anda selama sebulan terakhir, dan akan merekomendasikan untuk beralih dari penagihan berbasis permintaan ke penagihan berbasis instance, jika ini lebih murah.Pengoptimalan Hub Cloud
Anda dapat melihat data biaya ringkasan, data pemanfaatan, dan rekomendasi pengoptimalan biaya untuk layanan Google Cloud di halaman Pengoptimalan Cloud Hub.