Playground didukung oleh endpoint prediksi online Platform Agen Gemini Enterprise yang telah di-deploy sebelumnya dan tidak dikenai biaya. Saat membuka kartu model untuk model yang didukung, Anda dapat menggunakan panel Coba untuk menguji kemampuan model dengan cepat dengan mengirimkan perintah teks. Anda juga dapat menetapkan beberapa parameter yang paling umum seperti temperatur dan jumlah token output. Playground hanya mendukung input dan output teks.
Saat meluncurkan Ruang, Anda memiliki aplikasi web yang berfungsi dan siap digunakan dengan upaya manual yang jauh lebih sedikit daripada men-deploy model dan membangun aplikasi untuk menggunakan endpoint model. Model Garden men-deploy model yang Anda pilih di Platform Agen Gemini Enterprise dan men-deploy aplikasi contoh di instance Cloud Run yang menggunakan endpoint model yang di-deploy. Aplikasi juga dapat menggunakan endpoint yang ada, atau endpoint MaaS.
Sebelum memulai
Tutorial ini mengharuskan Anda menyiapkan Google Cloud project dan mengaktifkan Agent Platform API.
- Login ke akun Google Cloud Anda. Jika Anda baru menggunakan Google Cloud, buat akun untuk mengevaluasi performa produk kami dalam skenario dunia nyata. Pelanggan baru juga mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Gemini Enterprise Agent Platform, Artifact Registry, Cloud Build, Cloud Logging, and Cloud Run Admin APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Gemini Enterprise Agent Platform, Artifact Registry, Cloud Build, Cloud Logging, and Cloud Run Admin APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.- Jika Anda ingin mencoba Ruang Model Garden, pastikan akun layanan default Compute Engine memiliki izin yang diperlukan untuk meluncurkan Ruang.
Peran yang diperlukan
Untuk menguji kemampuan model di Model Garden, pastikan Anda dan akun layanan default Compute Engine memiliki peran IAM yang diperlukan.
Peran yang diperlukan untuk pengguna
Untuk mendapatkan izin yang Anda perlukan untuk menguji kemampuan model di Model Garden, minta administrator Anda untuk memberi Anda peran IAM berikut di project Anda: Google Cloud
- Service Usage Admin (
roles/serviceusage.serviceUsageAdmin) - Administrator Artifact Registry (
roles/artifactregistry.admin) - Admin Cloud Run (
roles/run.admin) - Storage Admin (
roles/storage.admin) - Pengguna Platform Agen (
roles/aiplatform.user)
Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.
Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.
Peran yang diperlukan untuk akun layanan default Compute Engine
Akun layanan default Compute Engine digunakan untuk meluncurkan Ruang.
Untuk memastikan bahwa akun layanan default Compute Engine memiliki izin yang diperlukan untuk meluncurkan Ruang, minta administrator untuk memberikan peran IAM berikut kepada akun layanan default Compute Engine di project Anda: Google Cloud
- Agent Platform Service Agent (
roles/aiplatform.serviceAgent) - Akun Layanan Cloud Build (
roles/cloudbuild.builds.builder)
Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.
Administrator Anda mungkin juga dapat memberikan izin yang diperlukan kepada akun layanan default Compute Engine melalui peran khusus atau peran bawaan lainnya.
Mencoba Playground
Di konsol Google Cloud , buka kartu model dari model yang didukung, seperti kartu model Gemma 2.
Di panel Coba:
- Untuk Region, terima default atau pilih region Anda.
- Untuk Endpoint, pilih Demo playground.
- Di kotak Prompt, masukkan
Why is the sky blue?. - Luaskan bagian Advanced options dan lihat parameter default.
Klik Kirim. Output akan muncul di bawah tombol Kirim.
Mencoba Ruang
Untuk meluncurkan model, buka kartu model untuk model yang didukung, dan di panel Coba Ruang, klik Ruang untuk meluncurkannya. Anda ditagih untuk mesin yang digunakan untuk deployment dan untuk instance Cloud Run yang menghosting aplikasi.
Anda dapat meluncurkan Ruang dengan model seperti Gemini, Gemma, Llama, dan Stable Diffusion.
Meluncurkan Ruang
Luncurkan Ruang untuk menguji dan bereksperimen dengan model dari aplikasi Gradio contoh.
Di konsol Google Cloud , buka Model Garden untuk melihat kartu model.
Pilih model yang akan digunakan. Model yang didukung memiliki panel Coba Ruang, seperti kartu model Gemma 3.
Klik rocket_launch Jalankan untuk meluncurkan Ruang.
- Anda dapat memilih untuk Mewajibkan autentikasi (melalui Identity Aware Proxy) atau Mengizinkan akses publik. Untuk informasi selengkapnya, lihat Mengaktifkan API untuk deployment pertama dan memberikan izin.
- Klik Create new service untuk memulai deployment. Anda dapat memantau status deployment dari kartu model.
Setelah status Ruang berubah menjadi Siap, klik Ruang tersebut untuk melihat detail tentang deployment.
Untuk perlindungan dasar, aplikasi web memerlukan kunci rahasia yang harus ditambahkan ke URL saat mengirimkan perintah. Kunci rahasia ini diberikan di kolom Secret key.
- Klik Open untuk mulai menggunakan aplikasi. Anda dapat mengirim perintah ke model dan melihat responsnya dari dalam aplikasi.
Anda dapat membagikan URL agar orang lain juga dapat mencoba aplikasi ini.
- Untuk menutup akses ke aplikasi, klik Edit di kolom Kontrol akses.
Di tab Security untuk aplikasi Cloud Run Anda, pilih Require authentication, lalu klik Save. Aplikasi tidak lagi tersedia melalui URL. Kunjungan ke URL menghasilkan error 403 (dilarang).
Pembersihan
Agar akun Google Cloud Anda tidak dikenai biaya untuk resource yang digunakan di halaman ini, ikuti langkah-langkah berikut.
Menghapus Ruang
Untuk membersihkan Spaces, Anda harus menghapus resource model dan resource aplikasi contoh di Cloud Run.
Menghapus resource model
Dari dalam aplikasi Gradio, Anda dapat menghapus endpoint model untuk membersihkan resource Gemini Enterprise Agent Platform. Kemudian, Anda perlu menghapus layanan Cloud Run untuk menghentikan dan menghapus aplikasi Gradio.
Untuk menghapus resource Platform Agen Gemini Enterprise secara manual, lihat Membatalkan deployment model dan menghapus resource.
Menghapus layanan Cloud Run
Menghapus resource yang terkait dengan layanan, termasuk semua revisi layanan. Menghapus layanan tidak mencakup item seperti image container dari Artifact Registry. Untuk mengetahui informasi selengkapnya, lihat Mengelola layanan dalam dokumentasi Cloud Run.
Di konsol Google Cloud , lihat daftar layanan Cloud Run:
Temukan layanan yang akan dihapus, lalu pilih.
Klik hapus Hapus. Tindakan ini akan menghapus semua revisi layanan.
Menghapus project
Cara termudah untuk menghilangkan penagihan adalah dengan menghapus project yang Anda buat untuk tutorial.
Untuk menghapus project:
- Di Konsol Google Cloud , buka halaman Manage resources.
- Pada daftar project, pilih project yang ingin Anda hapus, lalu klik Delete.
- Pada dialog, ketik project ID, lalu klik Shut down untuk menghapus project.
Langkah berikutnya
Lihat ringkasan Model Garden.