Dokumen ini menjelaskan persyaratan untuk konfigurasi jaringan Managed Service untuk Apache Spark.
Persyaratan subnetwork Virtual Private Cloud
Dokumen ini menjelaskan persyaratan jaringan Virtual Private Cloud untuk workload batch dan sesi interaktif Managed Service untuk Apache Spark.
Akses Google Pribadi
Workload batch dan sesi interaktif Managed Service untuk Apache Spark berjalan di VM dengan alamat IP internal saja dan di subnetwork regional dengan Akses Google Pribadi (PGA) yang diaktifkan secara otomatis di subnetwork.
Jika Anda tidak menentukan subnetwork, Managed Service untuk Apache Spark akan memilih subnetwork default di region workload atau sesi batch sebagai subnetwork untuk workload atau sesi batch.
Jika workload Anda memerlukan akses internet atau jaringan eksternal, misalnya, untuk mendownload resource seperti model ML dari PyTorch Hub atau Hugging Face, Anda dapat menyiapkan Cloud NAT untuk mengizinkan traffic keluar menggunakan IP internal di jaringan VPC.
Konektivitas subnetwork terbuka
Subnetwork VPC untuk region yang dipilih untuk workload batch atau sesi interaktif Managed Service untuk Apache Spark harus mengizinkan komunikasi internal di semua port antara instance VM dalam subnetwork.
Untuk mencegah skrip berbahaya dalam satu workload memengaruhi workload lain, Managed Service untuk Apache Spark men-deploy langkah-langkah keamanan default measures.
Perintah Google Cloud CLI berikut melampirkan firewall jaringan ke subnetwork yang mengizinkan komunikasi masuk internal antar-VM menggunakan semua protokol di semua port:
gcloud compute firewall-rules create allow-internal-ingress \ --network=NETWORK_NAME \ --source-ranges=SUBNET_RANGES \ --destination-ranges=SUBNET_RANGES \ --direction=ingress \ --action=allow \ --rules=all
Catatan:
SUBNET_RANGES: Lihat Mengizinkan koneksi masuk internal antar- VM. Jaringan VPC
defaultdalam project dengan aturan firewalldefault-allow-internal, yang mengizinkan komunikasi masuk di semua port (tcp:0-65535,udp:0-65535, danicmp protocols:ports), memenuhi persyaratan konektivitas subnetwork terbuka. Namun, aturan ini juga mengizinkan masuk oleh instance VM apa pun di jaringan.
Kebijakan firewall sistem regional yang dibuat secara otomatis
Untuk memenuhi persyaratan konektivitas subnetwork terbuka,
workload batch dan sesi interaktif Managed Service untuk Apache Spark
yang menggunakan versi runtime 3.0 atau yang lebih baru akan otomatis membuat
kebijakan firewall sistem regional dataproc-firewall-policy-[network-id]-region atau
dataproc-fw-[network-id]-region di subnetwork VPC batch atau sesi.
Kebijakan ini berisi aturan masuk dan keluar berikut.
| Nama | Tujuan | Prioritas | Arah | Tindakan | Sumber dan Tujuan | Protokol dan port |
|---|---|---|---|---|---|---|
dataproc-allow-internal-ingress-rule-[subnetworkId] |
Mengizinkan semua komunikasi internal yang diperlukan hanya dari VM Managed Service untuk Apache Spark bertag lain dalam subnetwork yang sama. | 4 | MASUK | IZINKAN |
srcSecureTag: nilai tag aman untuk subnetwork ini.targetSecureTags:nilai tag aman untuk subnetwork ini. |
tcp:0-65535, udp:0-65535, icmp protocols:ports |
dataproc-allow-internal-egress-rule-[subnetworkId] |
Mengizinkan VM Managed Service untuk Apache Spark mendownload paket, misalnya pip dan apt-get, serta mengakses Google API menggunakan Akses Google Pribadi. | 5 | KELUAR | IZINKAN |
destIpRanges: 0.0.0.0/0.targetSecureTags:nilai tag aman untuk subnetwork ini. |
tcp:0-65535, udp:0-65535, icmp protocols:ports |
Catatan:
Managed Service untuk Apache Spark menyediakan project tenant yang terkait dengan project pengguna untuk menyimpan tag aman. Managed Service untuk Apache Spark membuat tag aman untuk subnetwork di project tenant dan melampirkannya ke VM Managed Service untuk Apache Spark, yang memastikan bahwa kebijakan firewall sistem yang dibuat hanya berlaku untuk VM Managed Service untuk Apache Spark.
Kebijakan firewall sistem yang dibuat secara otomatis tidak didukung untuk VPC Bersama.
Managed Service untuk Apache Spark dan jaringan VPC-SC
Dengan Kontrol Layanan VPC, administrator jaringan dapat menentukan perimeter keamanan di sekitar resource layanan yang dikelola Google untuk mengontrol komunikasi ke dan di antara beberapa layanan tersebut.
Pertimbangkan strategi berikut saat Anda menggunakan jaringan VPC-SC dengan Managed Service untuk Apache Spark:
Buat image container kustom yang menginstal dependensi di luar perimeter VPC-SC, lalu kirim workload batch Spark yang menggunakan image container kustom Anda.
Untuk mengetahui informasi selengkapnya, lihat Kontrol Layanan VPC— Managed Service untuk Apache Spark.