Menggunakan IP pribadi untuk pelatihan tanpa server Gemini Enterprise Agent Platform

Menggunakan IP pribadi untuk terhubung ke tugas pelatihan akan memberikan lebih banyak keamanan jaringan dan latensi jaringan yang lebih rendah daripada menggunakan IP publik. Untuk menggunakan IP pribadi, gunakan Virtual Private Cloud (VPC) untuk melakukan peering jaringan Anda dengan semua jenis tugas pelatihan tanpa server Gemini Enterprise Agent Platform. Dengan begitu, kode pelatihan Anda dapat mengakses alamat IP pribadi di dalam jaringan Anda Google Cloud atau lokal.

Panduan ini menunjukkan cara menjalankan tugas pelatihan tanpa server di jaringan Anda setelah Anda menyiapkan Peering Jaringan VPC untuk melakukan peering jaringan Anda dengan resource CustomJob, HyperparameterTuningJob, atau kustom TrainingPipeline Agent Platform.

Ringkasan

Sebelum mengirimkan tugas pelatihan tanpa server menggunakan IP pribadi, Anda harus mengonfigurasi akses layanan pribadi untuk membuat koneksi peering antara jaringan Anda dan Agent Platform. Jika sudah mengaturnya, Anda dapat menggunakan koneksi peering yang ada.

Panduan ini mencakup tugas-tugas berikut:

  • Memahami rentang IP yang akan dicadangkan untuk pelatihan tanpa server.
  • Memverifikasi status koneksi peering yang ada.
  • Melakukan pelatihan tanpa server Gemini Enterprise Agent Platform di jaringan Anda.
  • Memeriksa pelatihan aktif yang terjadi di suatu jaringan sebelum melakukan pelatihan di jaringan lain.
  • Menguji apakah kode pelatihan Anda dapat mengakses IP pribadi di jaringan Anda.

Mencadangkan rentang IP untuk pelatihan tanpa server

Saat Anda mencadangkan rentang IP untuk produsen layanan, rentang tersebut dapat digunakan oleh Agent Platform dan layanan lainnya. Tabel ini menunjukkan jumlah maksimum tugas pelatihan paralel yang dapat Anda jalankan dengan rentang yang dicadangkan dari /16 hingga /18, dengan asumsi rentang tersebut digunakan hampir secara eksklusif oleh Agent Platform. Jika Anda terhubung dengan produsen layanan lain menggunakan rentang yang sama, alokasikan rentang yang lebih besar untuk mengakomodasinya guna menghindari kehabisan IP.

Konfigurasi mesin untuk tugas pelatihan Rentang yang dicadangkan Jumlah maksimum tugas paralel
Hingga 8 node.
Misalnya: 1 replika utama di kumpulan pekerja pertama, 6 replika di kumpulan pekerja kedua, dan 1 pekerja di kumpulan pekerja ketiga (untuk bertindak sebagai server parameter)
/16 63
/17 31
/18 15
Hingga 16 node.
Misalnya: 1 replika utama di kumpulan pekerja pertama, 14 replika di kumpulan pekerja kedua, dan 1 pekerja di kumpulan pekerja ketiga (untuk bertindak sebagai server parameter)
/16 31
/17 15
/18 7
Hingga 32 node.
Misalnya: 1 replika utama di kumpulan pekerja pertama, 30 replika di kumpulan pekerja kedua, dan 1 pekerja di kumpulan pekerja ketiga (untuk bertindak sebagai server parameter)
/16 15
/17 7
/18 3

Pelajari lebih lanjut cara mengonfigurasi kumpulan pekerja untuk pelatihan terdistribusi.

Memeriksa status koneksi peering yang ada

Jika sudah memiliki koneksi peering yang digunakan dengan Agent Platform, Anda dapat mencantumkannya untuk memeriksa status:

gcloud compute networks peerings list --network NETWORK_NAME

Anda akan melihat status koneksi peering ACTIVE. Pelajari lebih lanjut koneksi peering aktif.

Melakukan pelatihan tanpa server

Saat melakukan pelatihan tanpa server, Anda harus menentukan nama jaringan yang dapat diakses oleh Agent Platform.

Bergantung pada cara Anda melakukan pelatihan tanpa server, tentukan jaringan di salah satu kolom API berikut:

Jika Anda tidak menentukan nama jaringan, Agent Platform akan menjalankan pelatihan tanpa server tanpa koneksi peering dan tanpa akses ke IP pribadi dalam project Anda.

Contoh: Membuat CustomJob dengan gcloud CLI

Contoh berikut menunjukkan cara menentukan jaringan saat Anda menggunakan gcloud CLI untuk menjalankan CustomJob yang menggunakan container bawaan. Jika Anda melakukan pelatihan tanpa server dengan cara yang berbeda, tambahkan kolom network bidang sebagaimana dijelaskan untuk jenis tugas pelatihan tanpa server yang Anda gunakan.

  1. Buat file config.yaml untuk menentukan jaringan. Jika Anda menggunakan VPC Bersama, gunakan nomor project host VPC Anda.

    Pastikan nama jaringan diformat dengan benar:

    PROJECT_NUMBER=$(gcloud projects describe $PROJECT_ID --format="value(projectNumber)")
    
    cat <<EOF > config.yaml
    network: projects/PROJECT_NUMBER/global/networks/NETWORK_NAME
    EOF
    
  2. Buat aplikasi pelatihan untuk dijalankan di Agent Platform.

  3. Buat CustomJob, dengan meneruskan file config.yaml Anda:

    gcloud ai custom-jobs create \
      --region=LOCATION \
      --display-name=JOB_NAME \
      --python-package-uris=PYTHON_PACKAGE_URIS \
      --worker-pool-spec=machine-type=MACHINE_TYPE,replica-count=REPLICA_COUNT,executor-image-uri=PYTHON_PACKAGE_EXECUTOR_IMAGE_URI,python-module=PYTHON_MODULE \
      --config=config.yaml
    

Untuk mempelajari cara mengganti placeholder dalam perintah ini, baca Membuat tugas pelatihan kustom.

Menjalankan tugas di jaringan yang berbeda

Anda tidak dapat melakukan pelatihan tanpa server di jaringan baru saat masih melakukan pelatihan tanpa server di jaringan lain. Sebelum beralih ke jaringan lain, Anda harus menunggu semua resource CustomJob, HyperparameterTuningJob, dan TrainingPipeline kustom yang dikirimkan selesai, atau Anda harus membatalkannya.

Menguji akses tugas pelatihan

Bagian ini menjelaskan cara menguji apakah resource pelatihan tanpa server dapat mengakses IP pribadi di jaringan Anda.

  1. Buat instance Compute Engine di jaringan VPC Anda.
  2. Periksa aturan firewall Anda untuk memastikan aturan tersebut tidak membatasi traffic masuk dari jaringan Agent Platform. Jika demikian, tambahkan aturan untuk memastikan jaringan Agent Platform dapat mengakses rentang IP yang Anda cadangkan untuk Agent Platform (dan produsen layanan lainnya).
  3. Siapkan server lokal di instance VM guna membuat endpoint yang akan diakses oleh CustomJob Agent Platform.
  4. Buat aplikasi pelatihan Python untuk dijalankan di Agent Platform. Alih-alih membuat kode pelatihan model, buat kode yang mengakses endpoint yang Anda siapkan di langkah sebelumnya.
  5. Ikuti contoh sebelumnya untuk membuat CustomJob.

Masalah umum

Bagian ini berisi daftar beberapa masalah umum dalam mengonfigurasi Peering Jaringan VPC dengan Agent Platform.

  • Saat mengonfigurasi Agent Platform untuk menggunakan jaringan Anda, tentukan nama lengkap jaringan:

    "projects/YOUR_PROJECT_NUMBER/global/networks/YOUR_NETWORK_NAME"

  • Pastikan Anda tidak melakukan pelatihan tanpa server di satu jaringan sebelum melakukan pelatihan tanpa server di jaringan lain.

  • Pastikan Anda telah mengalokasikan rentang IP yang cukup untuk semua produsen layanan yang terhubung ke jaringan Anda, termasuk Agent Platform.

Untuk mengetahui informasi pemecahan masalah tambahan, lihat panduan pemecahan masalah Peering Jaringan VPC.

Langkah berikutnya