Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Mengevaluasi model menggunakan Agent Platform

Halaman ini menjelaskan cara mengevaluasi model menggunakan Gemini Enterprise Agent Platform. Untuk mengetahui ringkasannya, lihat evaluasi model di Agent Platform.

Prasyarat

Ikuti langkah-langkah di Menyiapkan project dan lingkungan pengembangan. Selain itu, aktifkan layanan berikut:
- Compute Engine API
- Dataflow API
Agent Platform dapat mengevaluasi model yang dilatih melalui AutoML atau pelatihan kustom. Untuk mengetahui panduan Google Cloud konsol, Anda harus memiliki model terlatih yang diimpor ke Gemini Enterprise Agent Platform Model Registry.
Upload set data pengujian Anda ke BigQuery atau Cloud Storage. Set data pengujian harus berisi kebenaran dasar, yang merupakan hasil sebenarnya yang diharapkan untuk sebuah inferensi. Dapatkan link ke file atau ID set data.
Memiliki output inferensi batch dalam bentuk tabel BigQuery atau Cloud Storage URI.
Pastikan akun layanan Compute Engine default Anda memiliki izin IAM berikut:
- Administrator Agent Platform (aiplatform.admin)
- Agen Layanan Agent Platform (aiplatform.serviceAgent)
- Storage Object Admin (storage.objectAdmin)
- Dataflow Worker (dataflow.worker)
- BigQuery Data Editor (bigquery.dataEditor) (hanya diperlukan jika Anda memberikan data dalam bentuk tabel BigQuery)

Membuat evaluasi

Konsol

Di Google Cloud konsol, buka halaman Model Gemini Enterprise Agent Platform.

Buka halaman Model
Klik nama model yang ingin dievaluasi.
Klik nomor versi untuk model tersebut.
Di tab Evaluasi, klik Buat Evaluasi.
Masukkan Nama evaluasi.
Pilih Tujuan, seperti klasifikasi atau regresi.
Masukkan Nama kolom target evaluasi, yang merupakan kolom dari data pelatihan yang dilatih untuk diprediksi oleh model.
Untuk Pilih sumber, pilih sumber untuk set data pengujian Anda.
1. Untuk Tabel BigQuery, masukkan jalur BigQuery.
2. Untuk File di Cloud Storage, masukkan jalur Cloud Storage.
Untuk Output prediksi batch, pilih format output.
1. Masukkan jalur BigQuery atau Cloud Storage URI.
Klik Mulai Evaluasi.

Python

Untuk melihat alur kerja evaluasi model Agent Platform API di Gemini Enterprise Agent Platform Pipelines, lihat contoh notebook untuk jenis model berikut:

Python SDK

SDK untuk mengevaluasi model dengan Agent Platform masih dalam versi Eksperimental. Untuk mendaftar ke versi Eksperimental, isi formulir aktivasi.

Agent Platform otomatis mengirim notifikasi email ketika tugas evaluasi model telah selesai.

Melihat metrik evaluasi

Konsol

Di Google Cloud konsol, buka halaman Model Gemini Enterprise Agent Platform.

Buka halaman Model
Buka versi model.
Lihat metrik di tab Evaluasi.

Python

Untuk melihat alur kerja evaluasi model Agent Platform API di Gemini Enterprise Agent Platform Pipelines, lihat contoh notebook untuk jenis model berikut:

Python SDK

SDK untuk mengevaluasi model dengan Agent Platform masih dalam versi Eksperimental. Untuk mendaftar ke versi Eksperimental, isi formulir aktivasi.

Membandingkan metrik evaluasi

Anda dapat membandingkan hasil evaluasi antara berbagai model, versi model, dan tugas evaluasi. Untuk mengetahui informasi selengkapnya tentang pembuatan versi model, lihat Pembuatan versi di Model Registry.

Anda hanya dapat membandingkan model dari jenis yang sama, seperti klasifikasi, regresi, atau perkiraan. Saat membandingkan model yang berbeda, semua versi model harus berjenis sama.

Anda hanya dapat membandingkan 5 evaluasi atau kurang dari jumlah itu sekaligus.

Buka Gemini Enterprise Agent Platform Model Registry di Google Cloud konsol:

Buka halaman Model
Buka model atau versi model Anda:
- Untuk membandingkan berbagai model di halaman Model, centang kotak di samping nama model yang ingin Anda bandingkan.
- Untuk membandingkan berbagai versi model:
  1. Klik nama model Anda di halaman Model untuk membuka daftar versi model.
  2. Pilih kotak centang di samping versi yang ingin dibandingkan.
- Untuk membandingkan berbagai tugas evaluasi untuk versi model yang sama:
  1. Klik nama model Anda di halaman Model untuk membuka daftar versi model.
  2. Klik nomor versi.
  3. Pilih kotak centang di samping tugas evaluasi yang ingin dibandingkan.
Klik Bandingkan.

Langkah berikutnya

Pelajari cara melakukan iterasi pada model.

Mengevaluasi model menggunakan Agent Platform Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

Prasyarat

Membuat evaluasi

Konsol

Python

Python SDK

Melihat metrik evaluasi

Konsol

Python

Python SDK

Membandingkan metrik evaluasi

Langkah berikutnya

Mengevaluasi model menggunakan Agent Platform