Menguji kemampuan model di Model Garden

Model Garden menyediakan beberapa opsi bagi Anda untuk melihat dan menguji kemampuan model dengan cepat. Untuk model yang didukung, Anda dapat mencoba platform demo atau meluncurkan aplikasi demo yang disebut Ruang Model Garden yang dapat Anda bagikan kepada orang lain untuk menunjukkan kemampuan model.

Playground didukung oleh endpoint prediksi online Platform Agen Gemini Enterprise yang telah di-deploy sebelumnya dan tidak dikenai biaya. Saat membuka kartu model untuk model yang didukung, Anda dapat menggunakan panel Coba untuk menguji kemampuan model dengan cepat dengan mengirimkan perintah teks. Anda juga dapat menetapkan beberapa parameter yang paling umum seperti temperatur dan jumlah token output. Playground hanya mendukung input dan output teks.

Saat meluncurkan Ruang, Anda memiliki aplikasi web yang berfungsi dan siap digunakan dengan upaya manual yang jauh lebih sedikit daripada men-deploy model dan membangun aplikasi untuk menggunakan endpoint model. Model Garden men-deploy model yang Anda pilih di Platform Agen Gemini Enterprise dan men-deploy aplikasi contoh di instance Cloud Run yang menggunakan endpoint model yang di-deploy. Aplikasi juga dapat menggunakan endpoint yang ada, atau endpoint MaaS.

Sebelum memulai

Tutorial ini mengharuskan Anda menyiapkan Google Cloud project dan mengaktifkan Agent Platform API.

  1. Login ke akun Google Cloud Anda. Jika Anda baru menggunakan Google Cloud, buat akun untuk mengevaluasi performa produk kami dalam skenario dunia nyata. Pelanggan baru juga mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  4. Verify that billing is enabled for your Google Cloud project.

  5. Enable the Gemini Enterprise Agent Platform, Artifact Registry, Cloud Build, Cloud Logging, and Cloud Run Admin APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  6. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  7. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  8. Verify that billing is enabled for your Google Cloud project.

  9. Enable the Gemini Enterprise Agent Platform, Artifact Registry, Cloud Build, Cloud Logging, and Cloud Run Admin APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  10. Jika Anda ingin mencoba Ruang Model Garden, pastikan akun layanan default Compute Engine memiliki izin yang diperlukan untuk meluncurkan Ruang.

Peran yang diperlukan

Untuk menguji kemampuan model di Model Garden, pastikan Anda dan akun layanan default Compute Engine memiliki peran IAM yang diperlukan.

Peran yang diperlukan untuk pengguna

Untuk mendapatkan izin yang Anda perlukan untuk menguji kemampuan model di Model Garden, minta administrator Anda untuk memberi Anda peran IAM berikut di project Anda: Google Cloud

Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.

Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.

Peran yang diperlukan untuk akun layanan default Compute Engine

Akun layanan default Compute Engine digunakan untuk meluncurkan Ruang.

Untuk memastikan bahwa akun layanan default Compute Engine memiliki izin yang diperlukan untuk meluncurkan Ruang, minta administrator untuk memberikan peran IAM berikut kepada akun layanan default Compute Engine di project Anda: Google Cloud

Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.

Administrator Anda mungkin juga dapat memberikan izin yang diperlukan kepada akun layanan default Compute Engine melalui peran khusus atau peran bawaan lainnya.

Mencoba Playground

  1. Di konsol Google Cloud , buka kartu model dari model yang didukung, seperti kartu model Gemma 2.

    Buka Gemma 2

  2. Di panel Coba:

    1. Untuk Region, terima default atau pilih region Anda.
    2. Untuk Endpoint, pilih Demo playground.
    3. Di kotak Prompt, masukkan Why is the sky blue?.
    4. Luaskan bagian Advanced options dan lihat parameter default.

    Panel coba untuk Gemma 2b-it

  3. Klik Kirim. Output akan muncul di bawah tombol Kirim.

Mencoba Ruang

Untuk meluncurkan model, buka kartu model untuk model yang didukung, dan di panel Coba Ruang, klik Ruang untuk meluncurkannya. Anda ditagih untuk mesin yang digunakan untuk deployment dan untuk instance Cloud Run yang menghosting aplikasi.

Anda dapat meluncurkan Ruang dengan model seperti Gemini, Gemma, Llama, dan Stable Diffusion.

Meluncurkan Ruang

Luncurkan Ruang untuk menguji dan bereksperimen dengan model dari aplikasi Gradio contoh.

  1. Di konsol Google Cloud , buka Model Garden untuk melihat kartu model.

    Buka Model Garden

  2. Pilih model yang akan digunakan. Model yang didukung memiliki panel Coba Ruang, seperti kartu model Gemma 3.

    Buka Gemma 3

  3. Klik rocket_launch Jalankan untuk meluncurkan Ruang.

    1. Anda dapat memilih untuk Mewajibkan autentikasi (melalui Identity Aware Proxy) atau Mengizinkan akses publik. Untuk informasi selengkapnya, lihat Mengaktifkan API untuk deployment pertama dan memberikan izin.
    1. Klik Create new service untuk memulai deployment. Anda dapat memantau status deployment dari kartu model.
  4. Setelah status Ruang berubah menjadi Siap, klik Ruang tersebut untuk melihat detail tentang deployment.

    Untuk perlindungan dasar, aplikasi web memerlukan kunci rahasia yang harus ditambahkan ke URL saat mengirimkan perintah. Kunci rahasia ini diberikan di kolom Secret key.

    1. Klik Open untuk mulai menggunakan aplikasi. Anda dapat mengirim perintah ke model dan melihat responsnya dari dalam aplikasi.

    Anda dapat membagikan URL agar orang lain juga dapat mencoba aplikasi ini.

    1. Untuk menutup akses ke aplikasi, klik Edit di kolom Kontrol akses.

    Di tab Security untuk aplikasi Cloud Run Anda, pilih Require authentication, lalu klik Save. Aplikasi tidak lagi tersedia melalui URL. Kunjungan ke URL menghasilkan error 403 (dilarang).

Pembersihan

Agar akun Google Cloud Anda tidak dikenai biaya untuk resource yang digunakan di halaman ini, ikuti langkah-langkah berikut.

Menghapus Ruang

Untuk membersihkan Spaces, Anda harus menghapus resource model dan resource aplikasi contoh di Cloud Run.

Menghapus resource model

Dari dalam aplikasi Gradio, Anda dapat menghapus endpoint model untuk membersihkan resource Gemini Enterprise Agent Platform. Kemudian, Anda perlu menghapus layanan Cloud Run untuk menghentikan dan menghapus aplikasi Gradio.

Untuk menghapus resource Platform Agen Gemini Enterprise secara manual, lihat Membatalkan deployment model dan menghapus resource.

Menghapus layanan Cloud Run

Menghapus resource yang terkait dengan layanan, termasuk semua revisi layanan. Menghapus layanan tidak mencakup item seperti image container dari Artifact Registry. Untuk mengetahui informasi selengkapnya, lihat Mengelola layanan dalam dokumentasi Cloud Run.

  1. Di konsol Google Cloud , lihat daftar layanan Cloud Run:

    Buka Cloud Run

  2. Temukan layanan yang akan dihapus, lalu pilih.

  3. Klik hapus Hapus. Tindakan ini akan menghapus semua revisi layanan.

Menghapus project

Cara termudah untuk menghilangkan penagihan adalah dengan menghapus project yang Anda buat untuk tutorial.

Untuk menghapus project:

  1. Di Konsol Google Cloud , buka halaman Manage resources.

    Buka Kelola resource

  2. Pada daftar project, pilih project yang ingin Anda hapus, lalu klik Delete.
  3. Pada dialog, ketik project ID, lalu klik Shut down untuk menghapus project.

Langkah berikutnya

Lihat ringkasan Model Garden.