Langsung ke konten utama
Google Cloud Documentation
Area teknologi
  • AI dan ML
  • Pengembangan aplikasi
  • Hosting aplikasi
  • Compute
  • Pipeline dan analisis data
  • Database
  • Terdistribusi, hybrid, dan multicloud
  • AI Generatif
  • Solusi industri
  • Jaringan
  • Kemampuan observasi dan pemantauan
  • Keamanan
  • Storage
Alat cross product
  • Pengelolaan akses dan resource
  • Pengelolaan biaya dan penggunaan
  • Infrastruktur sebagai kode
  • Migrasi
  • SDK, bahasa, framework, dan alat
/
Konsol
  • English
  • Deutsch
  • Español
  • Español – América Latina
  • Français
  • Indonesia
  • Italiano
  • Português
  • Português – Brasil
  • 中文 – 简体
  • 中文 – 繁體
  • 日本語
  • 한국어
Masuk
  • Cloud Run
Mulai gratis
Ringkasan Panduan Referensi Contoh Referensi
Google Cloud Documentation
  • Area teknologi
    • Lainnya
    • Ringkasan
    • Panduan
    • Referensi
    • Contoh
    • Referensi
  • Alat cross product
    • Lainnya
  • Konsol
  • Temukan
  • Ringkasan produk
  • Model resource Cloud Run
  • Kontrak runtime container
  • Kasus penggunaan
    • Apakah aplikasi saya cocok untuk layanan Cloud Run?
    • Kapan saya harus men-deploy fungsi?
    • Kasus penggunaan AI di Cloud Run
  • Mulai
  • Ringkasan
  • Men-deploy layanan web contoh
    • Men-deploy container contoh
    • Men-deploy dari repositori git
    • Men-deploy layanan Halo Dunia dari kode sumber
      • Go
      • Node.js
      • Python
        • Flask
        • FastAPI
        • Gradio
        • Streamlit
        • Agent Development Kit (ADK) untuk Python
      • Java
      • Kotlin
      • C#
      • C++
      • PHP
      • Ruby
      • Lainnya
      • Framework
        • Ringkasan
        • SSR Angular
        • Next.js
        • Nuxt.js
        • SvelteKit
  • Men-deploy fungsi contoh
    • Men-deploy fungsi menggunakan konsol
    • Men-deploy fungsi menggunakan gcloud
  • Menjalankan tugas contoh
    • Menjalankan tugas
    • Menjalankan tugas dari kode sumber
      • Go
      • Node.js
      • Python
      • Java
      • Shell
  • Men-deploy kumpulan pekerja contoh
  • Mengembangkan aplikasi
  • Menyiapkan lingkungan
  • Merencanakan dan menyiapkan layanan Anda
    • Mengembangkan layanan Anda
    • Masukkan kode Anda ke container
    • Terhubung ke layanan Google Cloud
    • Menginstal paket sistem di container Anda
    • Menjalankan perintah gcloud dalam container Anda
  • Merencanakan dan menyiapkan fungsi
    • Ringkasan
    • Membandingkan Cloud Run Functions
    • Menulis fungsi Cloud Run
    • Runtime
      • Ringkasan
      • Node.js
        • Ringkasan
        • Dependensi Node.js
      • Python
        • Ringkasan
        • Dependensi Python
      • Go
        • Ringkasan
        • Dependensi Go
      • Java
        • Ringkasan
        • Dependensi Java
      • .NET
      • Ruby
      • PHP
    • Pengembangan fungsi lokal
    • Pemicu fungsi
    • Tutorial
      • Membuat fungsi yang menampilkan hasil BigQuery
      • Buat fungsi yang menampilkan hasil Spanner
      • Terintegrasi dengan database Cloud
      • Codelab
  • Membuat dan melakukan pengujian
    • Membangun sumber ke container
    • Membangun fungsi ke container
    • Pengujian lokal
  • Menayangkan permintaan HTTP
  • Men-deploy layanan
    • Men-deploy image container
    • Deployment berkelanjutan dari git
    • Men-deploy dari kode sumber
    • Men-deploy dari Compose
    • Men-deploy fungsi
  • Melayani traffic web
    • Memetakan Domain Kustom
    • Menayangkan aset statis dengan CDN
    • Menayangkan traffic dari beberapa region
    • Mengaktifkan afinitas sesi
    • Menggunakan Nginx sebagai proxy frontend
  • Mengelola layanan
    • Melihat, menyalin, atau menghapus layanan
    • Melihat atau menghapus revisi
    • Migrasi traffic, peluncuran bertahap, rollback
  • Mengonfigurasi layanan
    • Ringkasan
    • Kapasitas
      • Batas memori
      • Batas CPU
      • GPU
        • Konfigurasi GPU
        • Praktik terbaik performa GPU
      • Waktu tunggu permintaan
      • Permintaan maksimum serentak
        • Tentang permintaan serentak maksimum per instance
        • Mengonfigurasi permintaan serentak maksimum
      • Penagihan
      • Mengoptimalkan konfigurasi keamanan dengan Pemberi Rekomendasi
    • Lingkungan
      • Port container dan titik masuk
      • Variabel lingkungan
      • Pemasangan volume
        • Volume Cloud Storage
        • Volume NFS
        • Volume dalam memori
      • Lingkungan eksekusi
        • Ringkasan
        • Memilih lingkungan eksekusi
      • Health check container
      • Permintaan HTTP/2
      • Rahasia
      • Service identity
    • Penskalaan
      • Tentang penskalaan otomatis instance untuk layanan
      • Instance maksimum
        • Tentang instance maksimum untuk layanan
        • Mengonfigurasi instance maksimum
      • Instance minimum
      • Penskalaan manual
    • Metadata
      • Deskripsi
      • Label
      • Tag
    • Konfigurasi deployment sumber
      • Runtime bahasa dan image dasar yang didukung
      • Mengonfigurasi update image dasar otomatis
      • Variabel lingkungan build
      • Membangun akun layanan
      • Membangun kumpulan pekerja
  • Memanggil dan memicu layanan
    • Memanggil dengan permintaan HTTPS
    • Menghosting target webhook
    • Streaming dengan WebSocket
      • Ringkasan
      • Membuat tutorial layanan Chat WebSocket
    • Memanggil secara asinkron
      • Memanggil layanan sesuai jadwal
      • Buat workflow
        • Memanggil layanan sebagai bagian dari Alur Kerja
        • Tutorial menghubungkan serangkaian layanan dari Cloud Functions dan Cloud Run
      • Menjalankan tugas asinkron
      • Memanggil layanan dari langganan push Pub/Sub
        • Layanan pemicu dari Pub/Sub
        • Tutorial contoh mengintegrasikan pemrosesan gambar ke dalam Pub/Sub
    • Pemicu dari peristiwa
      • Membuat pemicu dengan Eventarc
      • Pemicu Pub/Sub
        • Membuat pemicu EventArc Pub/Sub
        • Memicu fungsi dari Pub/Sub menggunakan Eventarc
        • Memicu fungsi dari entri log yang dirutekan
      • Pemicu Cloud Storage
        • Membuat pemicu dengan Cloud Storage
        • Memicu layanan dari Cloud Storage menggunakan Eventarc
        • Memicu fungsi dari Cloud Storage menggunakan Eventarc
      • Pemicu Firestore
        • Membuat pemicu dengan Firestore
        • Memicu fungsi dari peristiwa di database Firestore
    • Terhubung dengan layanan lain menggunakan gRPC
  • Praktik terbaik
    • Tips pengembangan umum untuk layanan
    • Mengoptimalkan layanan Java
    • Mengoptimalkan layanan Python
    • Mengoptimalkan layanan Node.js
    • Praktik terbaik pengujian beban
    • Memahami redundansi zona
    • Praktik terbaik fungsi
      • Ringkasan
      • Mengonfigurasi percobaan ulang fungsi berbasis peristiwa
  • Menjalankan tugas pekerjaan hingga selesai
  • Membuat tugas
  • Menjalankan tugas
    • Menjalankan tugas
    • Menjalankan tugas terjadwal
    • Menjalankan tugas terjadwal di perimeter VPC SC
    • Menjalankan tugas dari Workflows
  • Mengonfigurasi tugas
    • Titik entri container
    • Batas CPU
    • Batas memori
    • GPU
      • Konfigurasi GPU
      • Praktik terbaik GPU
    • Variabel lingkungan
    • Health check container
    • Pemasangan volume
      • Volume Cloud Storage
      • Volume NFS
      • Volume dalam memori
      • Sistem file jaringan lainnya
    • Label
    • Percobaan ulang maksimum
    • Keparalelan
    • Rahasia
    • Service identity
    • Waktu tunggu tugas
    • Tag
  • Kelola lowongan
    • Melihat atau menghapus tugas
    • Melihat atau menghentikan eksekusi tugas
  • Praktik terbaik
  • Melakukan pekerjaan latar belakang berkelanjutan
  • Men-deploy kumpulan pekerja
    • Men-deploy kumpulan pekerja
    • Men-deploy gabungan worker dari kode sumber
  • Mengelola kumpulan pekerja
    • Melihat atau menghapus kumpulan pekerja
    • Melihat atau menghapus revisi kumpulan pekerja
    • Pemisahan dan rollback instance
  • Mengonfigurasi kumpulan pekerja
    • Kapasitas
      • Batas memori
      • Batas CPU
      • GPU
        • Konfigurasi GPU
        • Praktik terbaik GPU
    • Lingkungan
      • Container dan titik entri
      • Variabel lingkungan
      • Pemasangan volume
        • Volume Cloud Storage
        • Volume NFS
        • Volume dalam memori
        • Sistem file jaringan lainnya
      • Health check container
      • Rahasia
      • Service identity
    • Jumlah instance
    • Metadata
      • Deskripsi
      • Label
      • Tag
  • Menskalakan berdasarkan metrik eksternal
    • Menskalakan otomatis kumpulan pekerja dengan metrik eksternal
    • Penskala otomatis Kafka
    • Menghosting runner GitHub dengan kumpulan pekerja
  • Mengonfigurasi jaringan
  • Praktik terbaik untuk jaringan Cloud Run
  • Mengonfigurasi jaringan pribadi
  • Mengirim traffic ke jaringan VPC
    • Ringkasan
    • Traffic keluar VPC Langsung
    • Layanan dan tugas stack ganda
    • Memigrasikan konektor VPC standar ke Traffic keluar VPC langsung
    • Konektor VPC
  • Mengirim traffic ke jaringan VPC Bersama
    • Ringkasan
    • Traffic keluar VPC Langsung
    • Memigrasikan konektor VPC Bersama ke traffic keluar VPC Langsung
    • Konektor dalam project layanan
    • Konektor di project host
  • Alamat IP keluar statis
  • Keamanan jaringan
    • Membatasi ingress (layanan)
    • Menggunakan Kontrol Layanan VPC (VPC SC)
  • Cloud Service Mesh
  • Aman
  • Ringkasan desain keamanan
  • Mengautentikasi permintaan
    • Ringkasan
    • Izinkan akses publik
    • Audiens kustom
    • Mengautentikasi developer
    • Layanan-ke-layanan
    • Mengautentikasi pengguna
    • Tutorial autentikasi pengguna akhir
  • Mengamankan resource Anda
    • Kontrol akses dengan IAM
    • Mengonfigurasi IAP untuk Cloud Run
    • Pengantar identitas layanan
    • Melindungi layanan dengan Cloud Armor
    • Menggunakan Otorisasi Biner
    • Menggunakan Deteksi Ancaman Cloud Run
    • Menggunakan kunci enkripsi yang dikelola pelanggan
    • Mengelola batasan kustom untuk project
    • Melihat insight keamanan supply chain software
    • Tutorial layanan Cloud Run yang aman
  • Memantau dan mencatat
  • Ringkasan pemantauan dan logging
  • Melihat metrik bawaan
  • Menulis metrik Prometheus
  • Menulis metrik OpenTelemetry
  • Mencatat dan melihat log
  • Logging audit
  • Pelaporan error
  • Menggunakan pelacakan terdistribusi untuk layanan
  • Menjalankan solusi AI
  • Ringkasan
  • Pelajari referensi
  • Agen AI
    • Ringkasan
    • Membangun dan men-deploy agen A2A
      • Ringkasan
      • Men-deploy agen A2A
    • Membangun dan men-deploy agen ADK
    • Membangun dan men-deploy agen n8n
  • Server MCP
    • Ringkasan
    • Membangun dan men-deploy server MCP jarak jauh
  • Alat
    • Eksekusi kode
    • Otomatisasi browser
  • Inferensi dengan GPU
    • Ringkasan
    • Layanan
      • Menjalankan inferensi LLM di GPU Cloud Run dengan Ollama
      • Menjalankan model Gemma 3 di Cloud Run
      • Menjalankan inferensi LLM di GPU Cloud Run dengan vLLM
      • Menjalankan OpenCV di Cloud Run dengan akselerasi GPU
      • Menjalankan inferensi LLM di GPU Cloud Run dengan Hugging Face Transformers.js
      • Menjalankan inferensi LLM di GPU Cloud Run dengan Hugging Face TGI
    • Tugas
      • Menyesuaikan LLM menggunakan GPU dengan tugas Cloud Run
      • Menjalankan inferensi batch menggunakan GPU dengan tugas Cloud Run
      • Transcoding video yang diakselerasi GPU dengan FFmpeg
  • Pengembangan yang dibantu AI dan coding suasana
    • Pengantar Cloud Run untuk developer yang dibantu AI
  • Memigrasikan
  • Layanan web yang sudah ada
  • Dari App Engine
  • Dari fungsi Cloud Run (generasi ke-1)
  • Dari AWS Lambda
  • Dari Heroku
  • Dari Cloud Foundry
    • Ringkasan migrasi
    • Memilih strategi yang mematuhi OCI
    • Bermigrasi ke container OCI
    • Memigrasikan konfigurasi
    • Sampel migrasi: Spring Music
  • Dari VMWare Tanzu
  • Dari VM menggunakan Migrate to Containers
  • Dari Kubernetes
  • Ke GKE
  • Memecahkan masalah
  • Pengantar
  • Mengatasi error
  • Tutorial pemecahan masalah lokal
  • Masalah umum
  • Contoh
  • Semua contoh kode Cloud Run
  • Semua contoh kode Cloud Run Functions
  • Contoh kode untuk semua produk
  • AI dan ML
  • Pengembangan aplikasi
  • Hosting aplikasi
  • Compute
  • Pipeline dan analisis data
  • Database
  • Terdistribusi, hybrid, dan multicloud
  • AI Generatif
  • Solusi industri
  • Jaringan
  • Kemampuan observasi dan pemantauan
  • Keamanan
  • Storage
  • Pengelolaan akses dan resource
  • Pengelolaan biaya dan penggunaan
  • Infrastruktur sebagai kode
  • Migrasi
  • SDK, bahasa, framework, dan alat
  • Home
  • Documentation
  • Application hosting
  • Cloud Run
  • Panduan

Menyesuaikan LLM menggunakan GPU dengan tugas Cloud Run Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

Anda dapat menyesuaikan model Gemma 3 pada tugas Cloud Run, lalu menayangkan model yang telah disesuaikan pada layanan Cloud Run menggunakan vLLM.

Lihat codelab instruksional langkah demi langkah di Cara menyetel model menggunakan tugas Cloud Run.

Kecuali dinyatakan lain, konten di halaman ini dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0, sedangkan contoh kode dilisensikan berdasarkan Lisensi Apache 2.0. Untuk mengetahui informasi selengkapnya, lihat Kebijakan Situs Google Developers. Java adalah merek dagang terdaftar dari Oracle dan/atau afiliasinya.

Terakhir diperbarui pada 2026-01-06 UTC.

  • Produk dan harga

    • Lihat semua produk
    • Harga Google Cloud
    • Google Cloud Marketplace
    • Hubungi bagian penjualan
  • Dukungan

    • Forum komunitas
    • Dukungan
    • Catatan Rilis
    • Status sistem
  • Referensi

    • GitHub
    • Mulai Menggunakan Google Cloud
    • Contoh kode
    • Pusat Arsitektur Cloud
    • Pelatihan dan Sertifikasi
  • Interaksi

    • Blog
    • Acara
    • X (Twitter)
    • Google Cloud di YouTube
    • Google Cloud Tech di YouTube
  • Tentang Google
  • Privasi
  • Persyaratan situs
  • Persyaratan Google Cloud
  • Manage cookies
  • Dekade ketiga aksi iklim Google: bergabunglah bersama kami
  • Daftar ke newsletter Google Cloud Berlangganan
  • English
  • Deutsch
  • Español
  • Español – América Latina
  • Français
  • Indonesia
  • Italiano
  • Português
  • Português – Brasil
  • 中文 – 简体
  • 中文 – 繁體
  • 日本語
  • 한국어