Menjalankan inferensi LLM di Cloud Run dengan TGI Hugging Face

Contoh berikut menunjukkan cara menjalankan layanan backend yang menjalankan toolkit Inferensi Pembuatan Teks (TGI) Hugging Face menggunakan Llama 3. Hugging Face TGI adalah Model Bahasa Besar (LLM) terbuka, dan dapat di-deploy serta disajikan di layanan Cloud Run dengan GPU yang diaktifkan.

Lihat contoh lengkapnya di Men-deploy Llama 3.1 8B dengan TGI DLC di Cloud Run.

Kecuali dinyatakan lain, konten di halaman ini dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0, sedangkan contoh kode dilisensikan berdasarkan Lisensi Apache 2.0. Untuk mengetahui informasi selengkapnya, lihat Kebijakan Situs Google Developers. Java adalah merek dagang terdaftar dari Oracle dan/atau afiliasinya.

Terakhir diperbarui pada 2026-03-14 UTC.