Google menggunakan teknologi AI untuk menerjemahkan konten ke dalam bahasa pilihan Anda. Terjemahan AI mungkin mengandung kesalahan.

Ringkasan cara mendapatkan inferensi di Platform Agen

Inferensi adalah output dari model machine learning yang telah dilatih. Halaman ini menyediakan ringkasan alur kerja untuk mendapatkan inferensi dari model Anda di Gemini Enterprise Agent Platform.

Agent Platform menawarkan dua metode untuk mendapatkan inferensi:

Inferensi online adalah permintaan sinkron yang dibuat untuk model yang di-deploy ke Endpoint. Oleh karena itu, sebelum mengirim permintaan, Anda harus men-deploy resource Model ke endpoint terlebih dahulu. Hal ini mengaitkan resource komputasi dengan model sehingga model dapat menyajikan inferensi online dengan latensi rendah. Gunakan inferensi online saat Anda membuat permintaan sebagai respons terhadap input aplikasi atau dalam situasi yang memerlukan inferensi tepat waktu.
Inferensi batch adalah permintaan asinkron yang dibuat ke model yang tidak di-deploy ke endpoint. Anda mengirim permintaan (sebagai resource BatchPredictionJob ) langsung ke resource Model. Gunakan inferensi batch jika Anda tidak memerlukan respons langsung dan ingin memproses data yang terakumulasi menggunakan satu permintaan.

Menguji model Anda secara lokal

Sebelum mendapatkan inferensi, sebaiknya deploy model Anda ke endpoint lokal selama fase pengembangan dan pengujian. Hal ini memungkinkan Anda melakukan iterasi dengan lebih cepat dan menguji model tanpa men-deploy-nya ke endpoint online atau menimbulkan biaya inferensi. Deployment lokal ditujukan untuk pengembangan dan pengujian lokal, bukan untuk deployment produksi.

Untuk men-deploy model secara lokal, gunakan Agent Platform SDK untuk Python dan deploy LocalModel ke LocalEndpoint. Untuk demonstrasi, lihat notebook ini.

Meskipun klien Anda tidak ditulis dalam Python, Anda tetap dapat menggunakan Agent Platform SDK untuk Python guna meluncurkan container dan server sehingga Anda dapat menguji permintaan dari klien Anda.

Mendapatkan inferensi dari model terlatih kustom

Untuk mendapatkan inferensi, Anda harus mengimpor model terlebih dahulu. Setelah diimpor, resource tersebut menjadi resource Model yang terlihat di Model Registry.

Kemudian, baca dokumentasi berikut untuk mempelajari cara mendapatkan inferensi:

Mendapatkan inferensi dari model AutoML

Tidak seperti model terlatih kustom, model AutoML secara otomatis diimpor ke Model Registry setelah pelatihan.

Selain itu, alur kerja untuk model AutoML serupa, tetapi sedikit berbeda berdasarkan jenis data dan tujuan model Anda. Dokumentasi untuk mendapatkan inferensi AutoML terletak di samping dokumentasi AutoML lainnya. Bagian berikut menyediakan link ke dokumentasi.

Gambar

Pelajari cara mendapatkan inferensi dari jenis model AutoML gambar berikut:

Berbentuk tabel

Pelajari cara mendapatkan inferensi dari jenis model AutoML berbentuk tabel berikut:

Model klasifikasi dan regresi berbentuk tabel
- Inferensi online
- Inferensi batch
Model perkiraan tabel (khusus inferensi batch)

Mendapatkan inferensi dari model BigQuery ML

Anda bisa mendapatkan inferensi dari model BigQuery ML dengan dua cara:

Minta inferensi batch langsung dari model di BigQuery ML.
Daftarkan model langsung dengan Model Registry, tanpa mengekspornya dari BigQuery ML atau mengimpornya ke Model Registry.

Langkah berikutnya

Pelajari Resource komputasi untuk inferensi.

Ringkasan cara mendapatkan inferensi di Platform Agen Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.