Halaman ini menjelaskan cara mengevaluasi model menggunakan Platform Agen Gemini Enterprise. Untuk mengetahui ringkasannya, lihat evaluasi model di Platform Agen.
Prasyarat
Ikuti langkah-langkah di Menyiapkan project dan lingkungan pengembangan. Selain itu, aktifkan layanan berikut:
Platform Agen dapat mengevaluasi model yang dilatih melalui AutoML atau pelatihan kustom. Untuk mengetahui panduan Google Cloud konsol, Anda harus memiliki model terlatih yang diimpor ke Model Registry Platform Agen Gemini Enterprise.
Upload set data pengujian Anda ke BigQuery atau Cloud Storage. Set data pengujian harus berisi kebenaran dasar, yang merupakan hasil sebenarnya yang diharapkan untuk sebuah inferensi. Dapatkan link ke file atau ID set data.
Memiliki output inferensi batch dalam bentuk tabel BigQuery atau Cloud Storage URI.
Pastikan akun layanan Compute Engine default Anda memiliki izin IAM berikut:
- Administrator Platform Agen (
aiplatform.admin) - Agen Layanan Platform Agen (
aiplatform.serviceAgent) - Storage Object Admin (
storage.objectAdmin) - Dataflow Worker (
dataflow.worker) - BigQuery Data Editor (
bigquery.dataEditor) (hanya diperlukan jika Anda memberikan data dalam bentuk tabel BigQuery)
- Administrator Platform Agen (
Membuat evaluasi
Konsol
Di Google Cloud konsol, buka halaman Model Platform Agen Gemini Enterprise.
Klik nama model yang ingin dievaluasi.
Klik nomor versi untuk model tersebut.
Di tab Evaluasi, klik Buat Evaluasi.
Masukkan Nama evaluasi.
Pilih Tujuan, seperti klasifikasi atau regresi.
Masukkan Nama kolom target evaluasi, yang merupakan kolom dari data pelatihan yang dilatih untuk diprediksi oleh model.
Untuk Pilih sumber, pilih sumber untuk set data pengujian Anda.
Untuk Tabel BigQuery, masukkan jalur BigQuery.
Untuk File di Cloud Storage, masukkan jalur Cloud Storage.
Untuk Output prediksi batch, pilih format output.
- Masukkan jalur BigQuery atau Cloud Storage URI.
Klik Mulai Evaluasi.
Python
Untuk melihat alur kerja evaluasi model Agent Platform API di Gemini Enterprise Agent Platform Pipelines, lihat contoh notebook untuk jenis model berikut:
Python SDK
SDK untuk mengevaluasi model dengan Agent Platform masih dalam versi Eksperimental. Untuk mendaftar ke versi Eksperimental, isi formulir aktivasi.
Platform Agen otomatis mengirim notifikasi email ketika tugas evaluasi model telah selesai.
Melihat metrik evaluasi
Konsol
Di Google Cloud konsol, buka halaman Model Platform Agen Gemini Enterprise.
Buka versi model.
Lihat metrik di tab Evaluasi.
Python
Untuk melihat alur kerja evaluasi model Agent Platform API di Gemini Enterprise Agent Platform Pipelines, lihat contoh notebook untuk jenis model berikut:
Python SDK
SDK untuk mengevaluasi model dengan Agent Platform masih dalam versi Eksperimental. Untuk mendaftar ke versi Eksperimental, isi formulir aktivasi.
Membandingkan metrik evaluasi
Anda dapat membandingkan hasil evaluasi antara berbagai model, versi model, dan tugas evaluasi. Untuk mengetahui informasi selengkapnya tentang pembuatan versi model, lihat Pembuatan versi di Model Registry.
Anda hanya dapat membandingkan model dari jenis yang sama, seperti klasifikasi, regresi, atau perkiraan. Saat membandingkan model yang berbeda, semua versi model harus berjenis sama.
Anda hanya dapat membandingkan 5 evaluasi atau kurang dari jumlah itu sekaligus.
Buka Model Registry Platform Agen Gemini Enterprise di Google Cloud konsol:
Buka model atau versi model Anda:
Untuk membandingkan berbagai model di halaman Model, centang kotak di samping nama model yang ingin Anda bandingkan.
Untuk membandingkan berbagai versi model:
Klik nama model Anda di halaman Model untuk membuka daftar versi model.
Pilih kotak centang di samping versi yang ingin dibandingkan.
Untuk membandingkan berbagai tugas evaluasi untuk versi model yang sama:
Klik nama model Anda di halaman Model untuk membuka daftar versi model.
Klik nomor versi.
Pilih kotak centang di samping tugas evaluasi yang ingin dibandingkan.
Klik Bandingkan.
Langkah berikutnya
- Pelajari cara melakukan iterasi pada model.