Jaringan

Jika Anda tertarik dengan cluster pelatihan Vertex AI, hubungi perwakilan penjualan Anda untuk mendapatkan akses.

Cluster pelatihan Vertex AI adalah layanan terkelola Google Cloud yang disediakan sebagai instance Compute Engine dalam VPC Anda. Model deployment ini memungkinkan layanan terhubung secara aman ke workload lain dalam VPC Anda, layanan yang dikelola Google, atau jaringan multi-cloud.

Persyaratan MTU jaringan

Untuk mencapai performa jaringan yang optimal untuk infrastruktur pelatihan, Anda harus mengonfigurasi Unit Transmisi Maksimum (MTU) jaringan VPC Anda.

Nilai MTU yang direkomendasikan bergantung pada jenis mesin GPU di cluster Anda:

  • Untuk node A3 Ultra dan A4: Gunakan MTU 8896.
  • Untuk node A3 Mega: Gunakan MTU 8244.

Anda dapat membuat VPC baru atau menggunakan VPC yang sudah ada.

Men-deploy cluster pelatihan di VPC baru (direkomendasikan)

Pendekatan yang direkomendasikan adalah men-deploy cluster pelatihan ke jaringan VPC baru yang telah dikonfigurasi sebelumnya. Hal ini memastikan setelan MTU yang benar diterapkan secara otomatis dan tidak memengaruhi beban kerja yang ada.

Ada dua langkah utama untuk men-deploy cluster pelatihan di VPC baru:

  1. Buat jaringan VPC: Buat jaringan VPC baru. Untuk mengaktifkan jumbo frame, tetapkan MTU-nya ke 8896.

  2. Deploy cluster: Deploy cluster pelatihan ke jaringan yang baru dikonfigurasi ini.

Dengan mengikuti urutan ini, instance VM cluster akan otomatis mewarisi setelan MTU yang benar saat booting awal.

Membuat dan menyiapkan VPC baru

  1. Buat jaringan VPC. Untuk mengaktifkan bingkai jumbo, tetapkan NETWORK_MTU ke 8896.
        # create VPC network
        gcloud compute networks create NETWORK \
          --project=PROJECT_ID \
          --subnet-mode=custom \
          --mtu=NETWORK_MTU
        
  2. Buat subnet yang digunakan untuk men-deploy cluster pelatihan, dan perbarui rentang berdasarkan persyaratan lingkungan Anda. Dalam contoh ini, subnet 192.168.0.0/19 digunakan untuk deployment cluster pelatihan.
        # create VPC subnet
        gcloud compute networks subnets create SUBNETWORK \
          --project=PROJECT_ID \
          --network=NETWORK \
          --region=REGION \
          --enable-private-ip-google-access \
          --range=192.168.0.0/19
        
  3. Buat aturan firewall IAP yang mengizinkan konektivitas SSH ke cluster pelatihan.
        gcloud compute firewall-rules create allow-ssh-ingress-from-iap \
        --direction=INGRESS   --action=allow   --rules=tcp:22 \
        --source-ranges=35.235.240.0/20 --network NETWORK
        
  4. Buat aturan firewall masuk yang mengizinkan semua port dan protokol ke subnet cluster pelatihan.
       gcloud compute --project=PROJECT_ID firewall-rules create allow-internal \
       --direction=INGRESS --priority=1000 --network=NETWORK \
       --action=ALLOW --rules=tcp:1-65535,udp:1-65535,icmp \
       --source-ranges=192.168.0.0/19 --enable-logging
       

Men-deploy cluster pelatihan di VPC yang ada

Jika Anda men-deploy cluster pelatihan ke jaringan yang sudah ada dengan instance Cloud Storage, sebaiknya gunakan frame jumbo (MTU 8896) untuk memastikan performa yang optimal. Sebelum memulai, pastikan sistem operasi dan aplikasi di VM yang ada dapat mendukung perubahan ini.

Untuk menerapkan frame jumbo, Anda harus memperbarui MTU VPC, yang harus dilakukan selama masa pemeliharaan yang direncanakan untuk mencegah ketidakstabilan jaringan.

Satu-satunya prosedur yang aman adalah menghentikan semua instance VM yang berjalan di jaringan tersebut terlebih dahulu. Mengubah MTU saat VM aktif akan menghasilkan setelan yang tidak cocok dan konektivitas yang tidak dapat diandalkan.

Setelah semua VM dihentikan, Anda dapat melanjutkan dengan langkah-langkah berikut:

  1. Ubah MTU jaringan ke setelan yang Anda pilih (misalnya, 8896).
  2. Mulai ulang semua VM setelah update jaringan selesai.
  3. Update VM non-Linux secara manual. Perhatikan bahwa memulai ulang ini tidak cukup untuk semua sistem operasi. Meskipun VM dari image Linux publik otomatis mengadopsi MTU baru, Anda harus mengupdate setelan MTU secara manual di dalam OS untuk semua VM Windows dan VM image kustom yang tidak menggunakan DHCP untuk konfigurasi MTU.

Persyaratan lebih lanjut:

  • Aktifkan Akses Google Pribadi di subnet yang digunakan untuk men-deploy cluster.
  • Buat aturan firewall ingress untuk memberikan akses IAP ke cluster.
  • Buat aturan firewall masuk untuk mengizinkan semua traffic ke cluster.

Langkah berikutnya

Setelah menyiapkan jaringan VPC dengan setelan MTU dan aturan firewall yang benar, langkah berikutnya adalah membuat dan mengamankan cluster pelatihan.

  • Verifikasi konfigurasi jaringan Anda: Sebelum membuat cluster, jalankan Uji Konektivitas untuk memverifikasi setelan MTU dan jaringan VPC Anda, terutama jika Anda mengubah VPC yang ada.
  • Amankan cluster Anda dengan perimeter layanan: Untuk meningkatkan keamanan data, gunakan Kontrol Layanan VPC untuk membuat perimeter layanan di sekitar resource Vertex AI Anda. Tindakan ini membantu mencegah pemindahan data yang tidak sah.
  • Menghubungkan dari lingkungan hybrid atau multi-cloud: Untuk mengakses cluster pelatihan dari pusat data lokal atau cloud publik, gunakan opsiGoogle Clouduntuk konektivitas hybrid.