Pelajari cara mulai menggunakan layanan evaluasi AI generatif menggunakan konsol Google. Google Cloud
Sebelum memulai
- Login ke akun Google Cloud Anda. Jika Anda baru menggunakan Google Cloud, buat akun untuk mengevaluasi performa produk kami dalam skenario dunia nyata. Pelanggan baru juga mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Make sure that you have the following role or roles on the project: Storage Admin
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
- Click Grant access.
-
In the New principals field, enter your user identifier. This is typically the email address for a Google Account.
- Click Select a role, then search for the role.
- To grant additional roles, click Add another role and add each additional role.
- Click Save.
-
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Make sure that you have the following role or roles on the project: Storage Admin
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
- Click Grant access.
-
In the New principals field, enter your user identifier. This is typically the email address for a Google Account.
- Click Select a role, then search for the role.
- To grant additional roles, click Add another role and add each additional role.
- Click Save.
-
Mengevaluasi model Anda
Untuk mengevaluasi model Anda:
Di konsol Google Cloud , buka halaman Evaluasi Gen AI.
Klik Evaluasi baru untuk membuka halaman evaluasi.
Pilih sumber untuk memuat set data untuk evaluasi:
Untuk mengupload file CSV atau JSONL lokal, pilih Upload file. Set data harus berisi perintah atau rekaman untuk digunakan dalam template perintah dan, secara opsional, respons model. Jumlah maksimumnya adalah 200 baris.
Untuk membuat perintah dari template perintah, pilih Buat data. Layanan evaluasi AI generatif membuat dan mengisi variabel yang Anda tentukan dalam template perintah saat membuat set data. Untuk mengetahui informasi selengkapnya tentang cara membuat template perintah, lihat Menggunakan template perintah.
Masukkan template perintah dengan variabel Anda di kolom Prompt template.
Untuk menambahkan deskripsi untuk setiap variabel atau menentukan jumlah sampel yang akan dibuat, luaskan Tentukan variabel dan ukuran sampel.
Klik Buat set data untuk membuat perintah.
Membuat dan mengevaluasi respons berdasarkan perintah Anda:
Di bagian Kandidat evaluasi, klik Tambahkan kandidat evaluasi, atau jika kandidat sudah ada, klik Edit untuk menentukan perintah dan respons yang akan dievaluasi. Misalnya, Anda dapat menentukan perintah atau respons dari file yang Anda upload atau dari data yang dihasilkan.
Untuk membandingkan beberapa kandidat, klik Tambahkan kandidat perbandingan.
Di bagian Metrik, tambahkan setidaknya satu metrik untuk memberi skor kualitas respons kandidat Anda. Untuk mengetahui informasi selengkapnya tentang jenis metrik, lihat bagian Metrik evaluasi di halaman ringkasan layanan evaluasi AI generatif.
Untuk beberapa rubrik adaptif, Anda dapat mengarahkan rubrik yang dihasilkan dari setiap perintah dengan meluaskan Lanjutan dan memberikan petunjuk kustom, seperti
Evaluate the dataset on cultural sensitivity.- Di bagian Name and storage configuration, tentukan nama untuk evaluasi Anda dan bucket Cloud Storage tempat hasil evaluasi Anda disimpan.
Klik Evaluasi.
Melihat hasil evaluasi Anda
Untuk melihat hasil evaluasi:
Di konsol Google Cloud , buka halaman Evaluasi GenAI.
Klik nama evaluasi.
Untuk setiap perintah dalam set data evaluasi Anda, respons ditampilkan bersama dengan hasil evaluasi.
Mengevaluasi model partner
Anda dapat menggunakan layanan evaluasi AI generatif untuk mengevaluasi model partner berikut:
- Anthropic
- Llama
Model partner didukung melalui Vertex AI Model Garden. Anda harus mengaktifkan model partner di Model Garden sebelum memilihnya untuk evaluasi. Untuk mengevaluasi model partner, pilih model tersebut di menu pemilihan model selama penyiapan evaluasi.
Harga
Harga untuk mengevaluasi model pihak ketiga didasarkan pada biaya yang dikeluarkan untuk inferensi model di Vertex AI Model Garden. Lihat halaman Harga untuk AI Generatif di Vertex AI.