Menggunakan Sensitive Data Protection dengan Cloud Data Fusion

Panduan ini menjelaskan cara menggunakan Sensitive Data Protection dengan Cloud Data Fusion.

Cloud Data Fusion menyediakan plugin Sensitive Data Protection yang menyediakan tiga transformasi yang dapat memfilter, menyamarkan, atau mendekripsi data sensitif Anda:

  • Transformasi PII Filter memungkinkan Anda memfilter kumpulan data sensitif dari aliran data input.

  • Transformasi Redact memungkinkan Anda mengubah data sensitif, seperti menyamarkan data atau mengenkripsinya.

  • Transformasi Decrypt memungkinkan Anda mendekripsi data sensitif yang sebelumnya dienkripsi menggunakan transformasi Redact,

Biaya

Dalam dokumen ini, Anda akan menggunakan komponen Google Cloudyang dapat ditagih berikut:

Untuk membuat perkiraan biaya berdasarkan proyeksi penggunaan Anda, gunakan kalkulator harga.

Pengguna Google Cloud baru mungkin memenuhi syarat untuk mendapatkan uji coba gratis.

Sebelum memulai

  1. Di konsol Google Cloud , buka halaman pemilih project, lalu pilih atau buat project.

    Buka pemilih project

  2. Aktifkan Cloud Data Fusion API untuk project Anda.

    Aktifkan Cloud Data Fusion API

  3. Aktifkan DLP API (bagian dari Perlindungan Data Sensitif) untuk project Anda.

    Aktifkan DLP API

  4. Buat instance Cloud Data Fusion.

Memberikan izin Sensitive Data Protection

  1. Di konsol Google Cloud , buka halaman IAM.

    Buka IAM

  2. Di tabel izin, pilih salah satu akun layanan berikut di kolom Principal:

    1. Untuk izin ke resource saat runtime, pilih akun layanan yang digunakan oleh cluster Managed Service for Apache Spark Anda. Defaultnya adalah akun layanan Compute Engine, yang tidak direkomendasikan karena alasan keamanan

    2. Untuk izin ke resource saat menggunakan Wrangler atau Pratinjau di Cloud Data Fusion (bukan saat runtime), pilih akun layanan yang cocok dengan format: service-project-number@gcp-sa-datafusion.iam.gserviceaccount.com.

  3. Klik ikon pensil di sebelah kanan akun layanan.

  4. Klik Add another role.

  5. Klik dropdown yang muncul.

  6. Telusuri menggunakan kotak penelusuran, lalu pilih DLP Administrator.

  7. Klik Simpan. Pastikan DLP Administrator muncul di kolom Role.

Men-deploy plugin Sensitive Data Protection

  1. Buka instance Anda:

    1. Di konsol Google Cloud , buka halaman Cloud Data Fusion.

    2. Untuk membuka instance di Cloud Data Fusion Studio, klik Instance, lalu klik View instance.

      Buka Instance

  2. Di UI web Cloud Data Fusion, klik Hub di kanan atas.

  3. Klik plugin Data Loss Prevention.

  4. Klik Deploy.

  5. Klik Selesai.

  6. Klik Buat pipeline.

Menggunakan transformasi Filter PII

Transformasi ini memisahkan data sensitif dari data non-sensitif. Kumpulan data dianggap sensitif jika cocok dengan kriteria yang Anda tentukan dalam template Sensitive Data Protection. Misalnya, saat membuat template, Anda dapat menentukan data sensitif sebagai informasi kartu kredit atau nomor Jaminan Sosial.

  1. Buat template inspeksi Sensitive Data Protection.

  2. Buka pipeline Anda di Cloud Data Fusion, lalu klik Studio > Transform.

  3. Klik transformasi Filter PII.

  4. Tahan kursor di node PII Filter, lalu klik Properties.

  5. Di bagian Filter pada, pilih apakah Anda ingin memfilter data atau kolom.

    Sesuai dengan batas Sensitive Data Protection, jika sebuah rekaman melebihi 0,5 MB, pipeline Cloud Data Fusion Anda akan gagal. Untuk menghindari kegagalan tersebut, filter menurut kolom, bukan menurut rekaman.

  6. Di bagian Template ID, masukkan ID template Sensitive Data Protection yang Anda buat.

  7. Di bagian Penanganan Error, tentukan cara melanjutkan saat pipeline Anda menemukan data sensitif. Pilih salah satu opsi penanganan error berikut:

    • Hentikan pipeline: Menghentikan pipeline segera setelah terjadi error.
    • Lewati rekaman: Melewati rekaman yang menyebabkan error. Pipeline terus berjalan, dan tidak ada error yang dilaporkan.
    • Kirim ke error: Mengirim error ke port error. Pipeline terus berjalan.
  8. Klik tombol X.

Menggunakan transformasi Redact

Transformasi ini mengidentifikasi kumpulan data sensitif dalam aliran input dan menerapkan transformasi yang telah ditentukan ke kumpulan data tersebut. Kumpulan data dianggap sensitif jika cocok dengan filter Sensitive Data Protection bawaan yang Anda pilih atau template kustom yang Anda tentukan.

  1. Di halaman Studio pada UI web Cloud Data Fusion, klik untuk meluaskan menu Transform.

  2. Klik transformasi Redact.

  3. Tahan kursor di node Redact, lalu klik Properties.

  4. Pilih apakah Anda ingin menerapkan transformasi ke filter standar atau apakah Anda ingin membuat filter sendiri.

    Anda tidak dapat menggabungkan kedua opsi ini. Anda dapat menggunakan filter standar ATAU membuat template kustom.

    Filter standar

    Untuk menerapkan transformasi ke filter standar, biarkan Template Kustom disetel ke Tidak, dan di bagian Pencocokan, tentukan aturan:

    1. Setelah Terapkan, klik dropdown, lalu pilih transformasi. Pelajari lebih lanjut transformasi yang tersedia di bagian Deskripsi pada tab Dokumentasi plugin.

    2. Setelah diaktifkan, klik dropdown dan pilih kategori, yang merupakan sekumpulan filter Sensitive Data Protection bawaan yang dikelompokkan menurut jenis. Untuk mengetahui daftar lengkap kategori yang disediakan dan filter yang ada di dalamnya, lihat bagian Pemetaan Filter DLP di tab Dokumentasi plugin.

    Untuk menetapkan beberapa aturan pencocokan, klik tombol +.

    Template kustom

    Untuk menerapkan transformasi sesuai dengan template kustom, setel Custom Template ke Yes.

    1. Buat template Sensitive Data Protection kustom.

    2. Kembali ke UI web Cloud Data Fusion, di menu properti Redact, di bagian Template ID, masukkan ID template dari template kustom yang Anda buat.

  5. Klik tombol X.

Menggunakan transformasi Dekripsi

Transformasi ini mengidentifikasi kumpulan data yang dienkripsi menggunakan Sensitive Data Protection dalam aliran input dan menerapkan dekripsi. Hanya data yang dienkripsi menggunakan algoritma yang dapat dibalik seperti Format Preserving Encryption atau Deterministic Encryption yang dapat didekripsi.

  1. Di halaman Studio pada UI web Cloud Data Fusion, klik untuk meluaskan menu Transform.

  2. Klik transformasi Decrypt.

  3. Tahan kursor di node Decrypt, lalu klik Properties.

  4. Masukkan nilai yang sama dengan yang digunakan untuk mengonfigurasi plugin Redact yang mengenkripsi data ini. Properti untuk plugin ini identik dengan plugin Redact.

  5. Klik tombol X.

Langkah berikutnya