Menggunakan IP pribadi untuk terhubung ke tugas pelatihan akan memberikan lebih banyak keamanan jaringan dan latensi jaringan yang lebih rendah daripada menggunakan IP publik. Untuk menggunakan IP pribadi, gunakan Virtual Private Cloud (VPC) untuk melakukan peering jaringan Anda dengan semua jenis tugas pelatihan tanpa server Gemini Enterprise Agent Platform. Dengan begitu, kode pelatihan Anda dapat mengakses alamat IP pribadi di dalam jaringan Anda Google Cloud atau lokal.
Panduan ini menunjukkan cara menjalankan tugas pelatihan tanpa server di jaringan Anda setelah Anda
menyiapkan Peering Jaringan VPC untuk melakukan peering jaringan Anda
dengan resource CustomJob, HyperparameterTuningJob, atau kustom
TrainingPipeline Agent Platform.
Ringkasan
Sebelum mengirimkan tugas pelatihan tanpa server menggunakan IP pribadi, Anda harus mengonfigurasi akses layanan pribadi untuk membuat koneksi peering antara jaringan Anda dan Agent Platform. Jika sudah mengaturnya, Anda dapat menggunakan koneksi peering yang ada.
Panduan ini mencakup tugas-tugas berikut:
- Memahami rentang IP yang akan dicadangkan untuk pelatihan tanpa server.
- Memverifikasi status koneksi peering yang ada.
- Melakukan pelatihan tanpa server Gemini Enterprise Agent Platform di jaringan Anda.
- Memeriksa pelatihan aktif yang terjadi di suatu jaringan sebelum melakukan pelatihan di jaringan lain.
- Menguji apakah kode pelatihan Anda dapat mengakses IP pribadi di jaringan Anda.
Mencadangkan rentang IP untuk pelatihan tanpa server
Saat Anda mencadangkan rentang IP untuk produsen layanan, rentang tersebut dapat digunakan oleh Agent Platform dan layanan lainnya. Tabel ini menunjukkan jumlah maksimum tugas pelatihan paralel yang dapat Anda jalankan dengan rentang yang dicadangkan dari /16 hingga /18, dengan asumsi rentang tersebut digunakan hampir secara eksklusif oleh Agent Platform. Jika Anda terhubung dengan produsen layanan lain menggunakan rentang yang sama, alokasikan rentang yang lebih besar untuk mengakomodasinya guna menghindari kehabisan IP.
| Konfigurasi mesin untuk tugas pelatihan | Rentang yang dicadangkan | Jumlah maksimum tugas paralel | |
|---|---|---|---|
| Hingga 8 node. Misalnya: 1 replika utama di kumpulan pekerja pertama, 6 replika di kumpulan pekerja kedua, dan 1 pekerja di kumpulan pekerja ketiga (untuk bertindak sebagai server parameter) |
/16 | 63 | |
| /17 | 31 | ||
| /18 | 15 | ||
| Hingga 16 node. Misalnya: 1 replika utama di kumpulan pekerja pertama, 14 replika di kumpulan pekerja kedua, dan 1 pekerja di kumpulan pekerja ketiga (untuk bertindak sebagai server parameter) |
/16 | 31 | |
| /17 | 15 | ||
| /18 | 7 | ||
| Hingga 32 node. Misalnya: 1 replika utama di kumpulan pekerja pertama, 30 replika di kumpulan pekerja kedua, dan 1 pekerja di kumpulan pekerja ketiga (untuk bertindak sebagai server parameter) |
/16 | 15 | |
| /17 | 7 | ||
| /18 | 3 | ||
Pelajari lebih lanjut cara mengonfigurasi kumpulan pekerja untuk pelatihan terdistribusi.
Memeriksa status koneksi peering yang ada
Jika sudah memiliki koneksi peering yang digunakan dengan Agent Platform, Anda dapat mencantumkannya untuk memeriksa status:
gcloud compute networks peerings list --network NETWORK_NAME
Anda akan melihat status koneksi peering ACTIVE.
Pelajari lebih lanjut koneksi peering aktif.
Melakukan pelatihan tanpa server
Saat melakukan pelatihan tanpa server, Anda harus menentukan nama jaringan yang dapat diakses oleh Agent Platform.
Bergantung pada cara Anda melakukan pelatihan tanpa server, tentukan jaringan di salah satu kolom API berikut:
Jika Anda membuat
CustomJob, tentukan kolomCustomJob.jobSpec.network.Jika menggunakan Google Cloud CLI, Anda dapat menggunakan flag
--configpada perintahgcloud ai custom-jobs createuntuk menentukan kolomnetwork.Pelajari lebih lanjut cara membuat
CustomJob.Jika Anda membuat
HyperparameterTuningJob, tentukan kolomHyperparameterTuningJob.trialJobSpec.network.Jika menggunakan gcloud CLI, Anda dapat menggunakan flag
--configpada perintahgcloud ai hpt-tuning-jobs createuntuk menentukan kolomnetwork.Pelajari lebih lanjut cara membuat
HyperparameterTuningJob.Jika Anda membuat
TrainingPipelinetanpa penyesuaian hyperparameter, tentukan kolomTrainingPipeline.trainingTaskInputs.network.Pelajari lebih lanjut cara membuat
TrainingPipelinekustom.Jika Anda membuat
TrainingPipelinedengan penyesuaian hyperparameter, tentukan kolomTrainingPipeline.trainingTaskInputs.trialJobSpec.network.
Jika Anda tidak menentukan nama jaringan, Agent Platform akan menjalankan pelatihan tanpa server tanpa koneksi peering dan tanpa akses ke IP pribadi dalam project Anda.
Contoh: Membuat CustomJob dengan gcloud CLI
Contoh berikut menunjukkan cara menentukan jaringan saat Anda menggunakan gcloud CLI untuk menjalankan CustomJob yang menggunakan container bawaan. Jika
Anda melakukan pelatihan tanpa server dengan cara yang berbeda, tambahkan kolom network bidang
sebagaimana dijelaskan untuk jenis tugas pelatihan tanpa server yang Anda gunakan.
Buat file
config.yamluntuk menentukan jaringan. Jika Anda menggunakan VPC Bersama, gunakan nomor project host VPC Anda.Pastikan nama jaringan diformat dengan benar:
PROJECT_NUMBER=$(gcloud projects describe $PROJECT_ID --format="value(projectNumber)") cat <<EOF > config.yaml network: projects/PROJECT_NUMBER/global/networks/NETWORK_NAME EOFBuat aplikasi pelatihan untuk dijalankan di Agent Platform.
Buat
CustomJob, dengan meneruskan fileconfig.yamlAnda:gcloud ai custom-jobs create \ --region=LOCATION \ --display-name=JOB_NAME \ --python-package-uris=PYTHON_PACKAGE_URIS \ --worker-pool-spec=machine-type=MACHINE_TYPE,replica-count=REPLICA_COUNT,executor-image-uri=PYTHON_PACKAGE_EXECUTOR_IMAGE_URI,python-module=PYTHON_MODULE \ --config=config.yaml
Untuk mempelajari cara mengganti placeholder dalam perintah ini, baca Membuat tugas pelatihan kustom.
Menjalankan tugas di jaringan yang berbeda
Anda tidak dapat melakukan pelatihan tanpa server di jaringan baru saat masih melakukan pelatihan tanpa server di jaringan lain. Sebelum beralih ke jaringan lain, Anda harus menunggu semua resource CustomJob, HyperparameterTuningJob, dan TrainingPipeline kustom yang dikirimkan selesai, atau Anda harus membatalkannya.
Menguji akses tugas pelatihan
Bagian ini menjelaskan cara menguji apakah resource pelatihan tanpa server dapat mengakses IP pribadi di jaringan Anda.
- Buat instance Compute Engine di jaringan VPC Anda.
- Periksa aturan firewall Anda untuk memastikan aturan tersebut tidak membatasi traffic masuk dari jaringan Agent Platform. Jika demikian, tambahkan aturan untuk memastikan jaringan Agent Platform dapat mengakses rentang IP yang Anda cadangkan untuk Agent Platform (dan produsen layanan lainnya).
- Siapkan server lokal di instance VM guna membuat endpoint yang akan diakses oleh
CustomJobAgent Platform. - Buat aplikasi pelatihan Python untuk dijalankan di Agent Platform. Alih-alih membuat kode pelatihan model, buat kode yang mengakses endpoint yang Anda siapkan di langkah sebelumnya.
- Ikuti contoh sebelumnya untuk membuat
CustomJob.
Masalah umum
Bagian ini berisi daftar beberapa masalah umum dalam mengonfigurasi Peering Jaringan VPC dengan Agent Platform.
Saat mengonfigurasi Agent Platform untuk menggunakan jaringan Anda, tentukan nama lengkap jaringan:
"projects/YOUR_PROJECT_NUMBER/global/networks/YOUR_NETWORK_NAME"
Pastikan Anda tidak melakukan pelatihan tanpa server di satu jaringan sebelum melakukan pelatihan tanpa server di jaringan lain.
Pastikan Anda telah mengalokasikan rentang IP yang cukup untuk semua produsen layanan yang terhubung ke jaringan Anda, termasuk Agent Platform.
Untuk mengetahui informasi pemecahan masalah tambahan, lihat panduan pemecahan masalah Peering Jaringan VPC.
Langkah berikutnya
- Pelajari lebih lanjut Peering Jaringan VPC.
- Lihat arsitektur referensi dan praktik terbaik untuk desain VPC.