Mengonfigurasi layanan Cloud Run

Halaman ini memberikan ringkasan opsi konfigurasi untuk layanan Cloud Run. Konfigurasi ini dicantumkan dalam urutan kemunculannya di konsolGoogle Cloud saat Anda men-deploy layanan baru.

Setelah menentukan opsi deployment, nama layanan, dan region, Anda akan melihat setelan konfigurasi berikut yang dijelaskan di halaman ini. Beberapa setelan konfigurasi memerlukan izin tambahan atau pengaktifan API, dan beberapa setelan tambahan akan muncul di antarmuka web jika Anda memilih GitHub atau Functions sebagai opsi deployment.

Mengonfigurasi setelan tingkat layanan

Mengonfigurasi setelan tingkat layanan, seperti autentikasi, penagihan, penskalaan layanan, dan ingress.

.

Tabel berikut menjelaskan fitur untuk bagian ini:

Bagian Fitur Deskripsi
A Autentikasi Semua layanan Cloud Run di-deploy secara pribadi secara default, yang berarti layanan tersebut tidak dapat diakses tanpa memberikan kredensial autentikasi dalam permintaan. Anda dapat memilih untuk mengizinkan akses publik (tanpa autentikasi).
B Penagihan Gunakan setelan penagihan untuk mengontrol cara penagihan, baik per permintaan dan hanya saat instance memproses permintaan, atau untuk seluruh siklus proses instance.
C Penskalaan layanan Anda dapat menyetel layanan ke penskalaan otomatis atau penskalaan manual, bergantung pada seberapa besar kontrol yang Anda butuhkan atas perilaku penskalaan.

Saat menggunakan penskalaan otomatis, setiap revisi Cloud Run secara otomatis diskalakan ke jumlah instance yang diperlukan untuk menangani semua permintaan, peristiwa, atau pemanfaatan CPU yang masuk. Anda dapat mengontrol jumlah instance yang dibuat oleh layanan Cloud Run untuk melayani permintaan dengan menetapkan instance maksimum dan instance minimum. Anda dapat menghindari cold start untuk aplikasi dan mengurangi latensi aplikasi dengan menetapkan jumlah minimum instance. Menetapkan jumlah maksimum instance dapat membantu menekan biaya dan mencegah tingkat permintaan tinggi yang tidak normal.

Penskalaan manual memungkinkan Anda menetapkan jumlah instance tertentu, terlepas dari traffic atau pemanfaatan, dan tanpa memerlukan deployment ulang. Secara default, Cloud Run secara otomatis melakukan penskalaan ke jumlah instance maksimum yang ditentukan atau default. Namun, untuk beberapa kasus penggunaan, Anda mungkin menginginkan kemampuan untuk menetapkan jumlah instance tertentu.

D Masuk Gunakan setelan traffic masuk untuk membatasi akses jaringan ke layanan Cloud Run Anda.

Container

Anda dapat mengonfigurasi container dengan menentukan port, setelan, variabel dan secret, serta pemasangan volume container.

.

Bagian Fitur Deskripsi
A Port container Tentukan port tujuan pengiriman permintaan yang Anda inginkan. Nilai default 8080. Untuk layanan Cloud Run, Cloud Run memasukkan variabel lingkungan PORT ke dalam container. Jika Anda men-deploy beberapa container ke layanan, ini adalah container ingress. Lihat Mengonfigurasi port container untuk layanan.
B Konfigurasi container Anda dapat mengonfigurasi lebih lanjut penampung di tab Setelan, Variabel & Secret, dan Volume. Fitur ini dijelaskan di bagian berikut.

Setelan

Sesuaikan layanan Anda dengan mengonfigurasi container, kapasitas, GPU, dan pemeriksaan kondisi.

.

Tabel berikut menjelaskan fitur untuk bagian ini:

Bagian Fitur Deskripsi
A Container Konfigurasi entrypoint dan argumen untuk layanan jika Anda ingin mengganti default image.
B Kapasitas Anda dapat mengontrol jumlah memori dan CPU yang dapat digunakan oleh layanan.
C GPU Jika perlu menghosting workload AI, seperti model inferensi dan pelatihan model, Anda dapat mengonfigurasi layanan Cloud Run dengan GPU.
D Health Check Cloud Run memungkinkan Anda mengonfigurasi tiga jenis pemeriksaan health check. Pemeriksaan startup menentukan kapan container siap menerima traffic, pemeriksaan keaktifan menentukan apakah container harus dimulai ulang, dan pemeriksaan kesiapan (Pratinjau) menentukan kapan instance di layanan Cloud Run Anda harus melayani traffic. Pelajari lebih lanjut pemeriksaan kondisi container.

Anda juga dapat mengonfigurasi waktu tunggu, konkurensi maksimum, lingkungan eksekusi, penskalaan revisi, peningkatan CPU startup, atau terhubung ke instance Cloud SQL.

.

Tabel berikut menjelaskan fitur untuk bagian ini:

Bagian Fitur Deskripsi
A Waktu tunggu Anda dapat menyetel waktu tunggu permintaan Cloud Run yang menentukan waktu saat respons harus ditampilkan.
B Konkurensi maksimum Anda dapat mengonfigurasi permintaan serentak maksimum per instance untuk menentukan jumlah maksimum permintaan yang dapat diproses secara bersamaan oleh instance tertentu. Anda dapat meningkatkannya hingga maksimum 1.000.
C Lingkungan eksekusi Cloud Run memiliki dua lingkungan eksekusi. Pelajari perbedaan antara kedua lingkungan eksekusi, dan cara memilih mana yang akan digunakan.
D Penskalaan revisi Setiap perubahan konfigurasi akan menghasilkan revisi baru. Secara default, revisi Cloud Run dikonfigurasi untuk melakukan penskalaan hingga maksimum 100 instance. Jika perlu mengubah jumlah default instance container yang tetap aktif dan siap menerima permintaan, Anda dapat menetapkan instance maksimum dan instance minimum tingkat revisi.
E Peningkatan CPU startup Peningkatan CPU startup untuk revisi menyediakan CPU tambahan selama waktu startup instance dan selama 10 detik setelah instance dimulai.
F Koneksi Cloud SQL Hubungkan ke instance Cloud SQL dari layanan yang berjalan di Cloud Run.

Variabel & Rahasia

Konfigurasi variabel lingkungan dan secret untuk mengelola layanan Anda secara aman.

.

Tabel berikut menjelaskan fitur untuk bagian ini:

Bagian Fitur Deskripsi
A Variabel lingkungan Anda dapat membuat pasangan key-value untuk digunakan dengan layanan Cloud Run Anda. Lihat Mengonfigurasi variabel lingkungan untuk layanan untuk mempelajari lebih lanjut.
B Rahasia Anda dapat menggunakan Secret Manager dengan Cloud Run untuk menyimpan kunci API, sandi, dan informasi sensitif lainnya dengan aman. Lihat Mengonfigurasi secret untuk mempelajari lebih lanjut.

Pemasangan volume

Konfigurasi pemasangan volume untuk layanan Anda.

.

Pemasangan volume Cloud Run memungkinkan Anda mengakses data bersama yang disimpan dalam sistem file lokal, seperti konten server file atau bucket penyimpanan, dari container Anda. Anda dapat memasang bucket Cloud Storage, berbagi NFS seperti instance Filestore, sistem file dalam memori yang disediakan oleh Cloud Run, atau sistem file jaringan CIFS/SMB.

Jaringan

Menghubungkan ke Google Cloud layanan lain menggunakan HTTP/2, pembagian traffic, jaringan VPC, atau service mesh.

.

Tabel berikut menjelaskan fitur untuk bagian ini:

Bagian Fitur Deskripsi
A Menggunakan HTTP/2 untuk layanan Konfigurasi layanan Anda untuk menggunakan HTTP/2 end-to-end, yang mencegah Cloud Run mendowngrade permintaan ke HTTP/1.
B Afinitas sesi Setiap kali Anda men-deploy atau men-deploy ulang layanan, revisi baru dari layanan Cloud Run yang mendasarinya akan dibuat secara otomatis. Lihat Afinitas sesi dan pemisahan traffic untuk mengetahui detail selengkapnya.
C Menghubungkan ke VPC Aktifkan layanan Cloud Run Anda untuk mengirim traffic ke jaringan VPC menggunakan traffic keluar VPC Langsung. Lihat opsi VPC.
D Mesh layanan Cloud Service Mesh memungkinkan Anda mengaktifkan kemampuan pengelolaan traffic lanjutan mesh, seperti pemisahan traffic berbobot dan load balancing global, serta kebijakan keamanan dan kemampuan observasi untuk traffic dari satu layanan Cloud Run ke layanan Cloud Run lainnya.

Keamanan

Konfigurasi akun layanan, Otorisasi Biner, atau kunci enkripsi untuk layanan Anda.

.

Tabel berikut menjelaskan fitur untuk bagian ini:

Bagian Fitur Deskripsi
A Akun layanan Identitas layanan Cloud Run adalah akun layanan yang digunakan sebagai akun terautentikasi untuk mengakses API Google Cloud dari container instance Cloud Run Anda. Sebaiknya buat akun layanan dan tentukan serangkaian izin paling minimal yang diperlukan akun layanan untuk mengakses resource Google Cloud tertentu.
B Otorisasi Biner Otorisasi Biner adalah kontrol keamanan berdasarkan waktu deployment untuk memastikan bahwa hanya image container tepercaya yang di-deploy ke resource Cloud Run Anda.
C Enkripsi Jika ingin mengontrol kunci enkripsi, Anda dapat menggunakan kunci enkripsi yang dikelola pelanggan.

Setelah deployment

Setelah layanan berhasil di-deploy, Anda dapat melanjutkan konfigurasi setelan tambahan untuk layanan Anda.

Label

Label Cloud Run adalah pasangan nilai kunci yang dapat Anda terapkan ke layanan Cloud Run, revisi, dan Cloud Run Functions. Label membantu Anda mengatur resource Cloud Run dan mengelola biaya dalam skala besar dengan perincian yang Anda butuhkan.

Label yang sebelumnya Anda tetapkan untuk fungsi Cloud Run menggunakan perintah gcloud functions atau Cloud Functions v2 API akan diteruskan ke Cloud Run saat Anda men-deploy fungsi di Cloud Run.

Rekomendasi

Lihat Mengoptimalkan dengan Pemberi Rekomendasi untuk mempelajari pengoptimalan yang disediakan oleh Pemberi Rekomendasi di Cloud Run.

Layanan tag

Tag adalah pasangan nilai kunci yang dapat Anda terapkan ke resource untuk kontrol akses yang terperinci menggunakan konsol Cloud Run.

Administrator tag membuat tag untuk resource di seluruh Google Cloud pada level organisasi atau project. Tag menyediakan cara untuk mengizinkan atau menolak kebijakan secara bersyarat berdasarkan apakah resource memiliki tag tertentu. Untuk mempelajari lebih lanjut, lihat Layanan tag.