Tugas dan pemicu tugas

Tugas adalah tindakan yang dijalankan oleh Sensitive Data Protection untuk memindai konten terkait data sensitif atau menghitung risiko identifikasi ulang. Sensitive Data Protection membuat dan menjalankan resource tugas setiap kali Anda memintanya untuk memeriksa data Anda.

Saat ini ada dua jenis tugas Sensitive Data Protection:

  • Tugas inspeksi memeriksa konten Anda terkait data sensitif sesuai dengan kriteria Anda dan membuat laporan ringkasan tentang lokasi dan jenis data sensitif yang ada.
  • Tugas analisis risiko menganalisis data yang di-de-identifikasi dan menampilkan metrik tentang kemungkinan data dapat diidentifikasi ulang.

Anda dapat menjadwalkan kapan Sensitive Data Protection menjalankan tugas dengan membuat pemicu tugas. Pemicu tugas adalah peristiwa yang mengotomatiskan pembuatan tugas Sensitive Data Protection untuk memindai repositori penyimpanan Google Cloud , termasuk bucket Cloud Storage, tabel BigQuery, dan jenis Datastore.

Pemicu tugas memungkinkan Anda menjadwalkan tugas pemindaian dengan menetapkan interval saat setiap pemicu diaktifkan. Pemicu dapat dikonfigurasi untuk mencari temuan baru sejak pemindaian terakhir dijalankan guna membantu memantau perubahan atau penambahan pada konten, atau untuk membuat laporan temuan terbaru. Pemicu terjadwal berjalan pada interval yang Anda tetapkan, dari 1 hari hingga 60 hari.

Langkah berikutnya

Informasi selengkapnya tentang cara membuat, mengedit, dan menjalankan tugas serta pemicu tugas dapat ditemukan di topik berikut:

Selain itu, panduan memulai berikut tersedia:

Objek JobTrigger

Pemicu tugas direpresentasikan dalam DLP API oleh JobTrigger objek.

Kolom konfigurasi pemicu tugas

Setiap JobTrigger berisi beberapa kolom konfigurasi, termasuk:

  • Nama dan nama tampilan pemicu, serta deskripsi.
  • Kumpulan objek Trigger, yang masing-masing berisi objek Schedule, yang menentukan pengulangan pemindaian dalam detik.
  • Objek InspectJobConfig, yang berisi informasi konfigurasi untuk tugas yang dipicu.
  • Enumerasi Status, yang menunjukkan apakah pemicu saat ini aktif.
  • Kolom stempel waktu yang menunjukkan waktu pembuatan, pembaruan, dan waktu terakhir dijalankan.
  • Kumpulan objek Error, jika ada yang ditemukan saat pemicu diaktifkan.

Metode pemicu tugas

Setiap objek JobTrigger juga menyertakan beberapa metode bawaan. Dengan menggunakan metode ini, Anda dapat:

Latensi tugas

Tidak ada tujuan tingkat layanan (SLO) yang dijamin untuk tugas dan pemicu tugas. Latensi dipengaruhi oleh beberapa faktor, termasuk jumlah data yang akan dipindai, repositori penyimpanan yang dipindai, jenis dan jumlah infoType yang Anda pindai, region tempat tugas diproses, dan resource komputasi yang tersedia di region tersebut. Oleh karena itu, latensi tugas inspeksi tidak dapat ditentukan di awal.

Untuk membantu mengurangi latensi tugas, Anda dapat mencoba hal berikut:

  • Jika pengambilan sampel tersedia untuk tugas atau pemicu tugas Anda, aktifkan.
  • Hindari mengaktifkan infoType yang tidak Anda perlukan. Meskipun berguna dalam skenario tertentu, infoType berikut dapat membuat permintaan berjalan jauh lebih lambat daripada permintaan yang tidak menyertakannya:

    • PERSON_NAME
    • FEMALE_NAME
    • MALE_NAME
    • FIRST_NAME
    • LAST_NAME
    • DATE_OF_BIRTH
    • LOCATION
    • STREET_ADDRESS
    • ORGANIZATION_NAME
  • Selalu tentukan infoType secara eksplisit. Jangan gunakan daftar infoType kosong.

  • Jika memungkinkan, gunakan region pemrosesan yang berbeda.

Jika Anda masih mengalami masalah latensi dengan tugas setelah mencoba teknik ini, pertimbangkan untuk menggunakan content.inspect atau content.deidentify permintaan, bukan tugas. Metode ini tercakup dalam Perjanjian Tingkat Layanan. Untuk mengetahui informasi selengkapnya, lihat Perjanjian Tingkat Layanan Sensitive Data Protection.

Batasi pemindaian hanya untuk konten baru

Anda dapat mengonfigurasi pemicu tugas untuk otomatis menetapkan tanggal rentang waktu untuk file yang disimpan di Cloud Storage atau BigQuery. Saat Anda menetapkan objek TimespanConfig ke isi otomatis, Sensitive Data Protection hanya memindai data yang ditambahkan atau diubah sejak pemicu terakhir dijalankan:

...
  timespan_config {
        enable_auto_population_of_timespan_config: true
      }
...

Untuk inspeksi BigQuery, hanya baris yang berusia minimal tiga jam yang disertakan dalam pemindaian. Lihat masalah umum yang terkait dengan operasi ini.

Memicu tugas saat file diupload

Selain dukungan untuk pemicu tugas—yang dibuat ke dalam Sensitive Data Protection—Google Cloud juga memiliki berbagai komponen lain yang dapat Anda gunakan untuk mengintegrasikan atau memicu tugas Sensitive Data Protection jobs. Misalnya, Anda dapat menggunakan fungsi Cloud Run untuk memicu pemindaian Sensitive Data Protection setiap kali file diupload ke Cloud Storage.

Untuk mengetahui informasi tentang cara menyiapkan operasi ini, lihat Mengotomatiskan klasifikasi data yang diupload ke Cloud Storage.