Jika Anda menulis kode pelatihan sendiri alih-alih menggunakan AutoML}, ada beberapa cara untuk melakukan pelatihan serverless Gemini Enterprise Agent Platform yang perlu dipertimbangkan. Dokumen ini memberikan ringkasan singkat dan perbandingan terkait berbagai cara menjalankan pelatihan serverless.
Resource pelatihan serverless di Agent Platform
Ada tiga jenis resource Agent Platform yang dapat Anda buat untuk melatih model kustom di Agent Platform:
Saat membuat tugas kustom, Anda menentukan setelan yang diperlukan Agent Platform untuk menjalankan kode pelatihan Anda, termasuk:
- Satu pool worker
untuk pelatihan node tunggal (
WorkerPoolSpec), atau beberapa kumpulan worker untuk pelatihan yang terdistribusi - Setelan opsional untuk mengonfigurasi penjadwalan tugas (
Scheduling), menetapkan variabel lingkungan tertentu untuk kode pelatihan Anda, menggunakan akun layanan khusus, dan menggunakan Peering Jaringan VPC
Dalam kumpulan worker, Anda dapat menentukan setelan berikut:
- Jenis mesin dan akselerator
- Konfigurasi jenis kode pelatihan yang dijalankan oleh
kumpulan worker: aplikasi
pelatihan Python (
PythonPackageSpec) atau container kustom (ContainerSpec)
Tugas penyesuaian hyperparameter memiliki setelan tambahan yang perlu dikonfigurasi, seperti metrik. Pelajari lebih lanjut penyesuaian hyperparameter.
Pipeline pelatihan mengatur tugas pelatihan serverless atau tugas penyesuaian hyperparameter dengan langkah-langkah tambahan, seperti memuat set data atau mengupload model ke Agent Platform setelah tugas pelatihan berhasil diselesaikan.
Resource pelatihan serverless
Untuk melihat pipeline pelatihan yang ada dalam project Anda, buka halaman Training Pipelines di bagian Agent Platform pada Google Cloud konsol.
Untuk melihat tugas kustom yang ada di project Anda, buka halaman Tugas kustom.
Untuk melihat tugas penyesuaian hyperparameter yang ada di project Anda, buka halaman Penyesuaian hyperparameter.
Buka Penyesuaian hyperparameter
Container kustom dan bawaan
Sebelum mengirim tugas pelatihan serverless, tugas penyesuaian hyperparameter atau pipeline pelatihan ke Agent Platform, Anda harus membuat aplikasi pelatihan Python atau container kustom untuk menentukan kode pelatihan dan dependensi yang ingin Anda jalankan di Agent Platform. Jika membuat aplikasi pelatihan Python menggunakan TensorFlow, PyTorch, scikit-learn, atau XGBoost, Anda dapat menggunakan container bawaan kami untuk menjalankan kode Anda. Jika Anda tidak yakin opsi mana yang harus dipilih, lihat persyaratan kode pelatihan untuk mempelajari lebih lanjut.
Pelatihan terdistribusi
Anda dapat mengonfigurasi tugas pelatihan serverless, tugas penyesuaian hyperparameter, atau pipeline pelatihan untuk pelatihan terdistribusi dengan menentukan beberapa kumpulan worker:
- Gunakan kumpulan worker pertama Anda untuk mengonfigurasi replika utama, dan tetapkan jumlah replika ke 1.
- Tambahkan lebih banyak pool worker untuk mengonfigurasi replika worker, replika server parameter, atau replika evaluator, jika framework machine learning Anda mendukung tugas cluster tambahan ini untuk pelatihan terdistribusi.
Pelajari lebih lanjut cara menggunakan pelatihan terdistribusi.
Langkah berikutnya
- Mempelajari cara membuat resource persisten untuk menjalankan tugas pelatihan serverless.
- Membaca artikel Membuat tugas pelatihan serverless untuk mempelajari cara membuat tugas pelatihan serverless guna menjalankan aplikasi pelatihan serverless di Gemini Enterprise Agent Platform.
- Membaca artikel Membuat pipeline pelatihan untuk mempelajari cara membuat pipeline pelatihan guna menjalankan aplikasi pelatihan serverless di Gemini Enterprise Agent Platform.
- Membaca artikel Menggunakan penyesuaian hyperparameter untuk mempelajari Penelusuran penyesuaian hyperparameter.