L-diversity adalah properti set data dan perluasan dari k-anonymity yang mengukur keragaman nilai sensitif untuk setiap kolom tempat nilai tersebut muncul. Sebuah set data memiliki l-diversity jika, untuk setiap set baris dengan quasi-ID yang identik, setidaknya ada nilai l yang berbeda untuk setiap atribut sensitif.
Anda dapat menghitung nilai l-diversity berdasarkan satu atau beberapa kolom, atau kolom, dari set data. Topik ini menunjukkan cara menghitung nilai l-diversity untuk set data menggunakan Perlindungan Data Sensitif. Untuk mengetahui informasi selengkapnya tentang l-diversity atau analisis risiko secara umum, lihat topik konsep analisis risikosebelum melanjutkan.
Sebelum memulai
Sebelum melanjutkan, pastikan Anda telah melakukan hal berikut:
- Login ke Akun Google Anda.
- Di Google Cloud konsol, pada halaman pemilih project, pilih atau buat Google Cloud project. Buka pemilih project
- Pastikan penagihan diaktifkan untuk project Anda Google Cloud . Pelajari cara mengonfirmasi bahwa penagihan diaktifkan untuk project Anda.
- Aktifkan Perlindungan Data Sensitif. Aktifkan Perlindungan Data Sensitif
- Pilih set data BigQuery untuk dianalisis. Perlindungan Data Sensitif menghitung metrik l-diversity dengan memindai tabel BigQuery
- Tentukan ID kolom sensitif (jika berlaku) dan setidaknya satu quasi-ID dalam set data. Untuk mengetahui informasi selengkapnya, lihat Istilah dan teknik analisis risiko.
Menghitung l-diversity
Perlindungan Data Sensitif melakukan analisis risiko setiap kali tugas analisis risiko berjalan. Anda harus membuat tugas terlebih dahulu, baik menggunakan Google Cloud konsol, mengirim permintaan DLP API, atau menggunakan library klien Perlindungan Data Sensitif.
Konsol
Di Google Cloud konsol, buka halaman Buat analisis risiko.
Di bagian Pilih data input , tentukan tabel BigQuery yang akan dipindai dengan memasukkan project ID project yang berisi tabel, ID set data tabel, dan nama tabel.
Di bagian Metrik privasi untuk dihitung, pilih l-diversity.
Di bagian ID Tugas, Anda dapat secara opsional memberikan ID kustom ke tugas dan memilih lokasi resource tempat Perlindungan Data Sensitif akan memproses data Anda. Setelah selesai, klik Lanjutkan.
Di bagian Tentukan kolom, Anda menentukan kolom sensitif dan quasi-ID untuk tugas risiko l-diversity. Perlindungan Data Sensitif mengakses metadata tabel BigQuery yang Anda tentukan pada langkah sebelumnya dan mencoba mengisi daftar kolom.
- Pilih kotak centang yang sesuai untuk menentukan kolom sebagai kolom sensitif (S) atau quasi-ID (QI). Anda harus memilih 1 kolom sensitif dan minimal 1 quasi-ID.
- Jika Perlindungan Data Sensitif tidak dapat mengisi kolom, klik Masukkan nama kolom untuk memasukkan satu atau beberapa kolom secara manual dan menetapkan setiap kolom sebagai kolom sensitif atau quasi-ID. Setelah selesai, klik Lanjutkan.
Di bagian Tambahkan tindakan, Anda dapat menambahkan tindakan opsional yang akan dilakukan saat tugas risiko selesai. Opsi yang tersedia adalah:
- Simpan ke BigQuery: Menyimpan hasil pemindaian analisis risiko ke tabel BigQuery.
Publikasikan ke Pub/Sub: Memublikasikan notifikasi ke topik Pub/Sub.
Beri tahu melalui email: Mengirimi Anda email berisi hasil. Setelah selesai, klik Buat.
Tugas analisis risiko l-diversity akan segera dimulai.
C#
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Go
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
PHP
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Perlindungan Data Sensitif, lihat Library klien Perlindungan Data Sensitif.
Untuk melakukan autentikasi ke Perlindungan Data Sensitif, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
REST
Untuk menjalankan tugas analisis risiko baru guna menghitung l-diversity, kirim permintaan ke resource
projects.dlpJobs, dengan PROJECT_ID menunjukkan ID project
Anda:
https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs
Permintaan berisi objek
RiskAnalysisJobConfig, yang terdiri dari hal berikut:
A
PrivacyMetricobjek. Di sinilah Anda menentukan bahwa Anda menghitung l-diversity dengan menyertakan objekLDiversityConfig.Objek
BigQueryTable. Tentukan tabel BigQuery yang akan dipindai dengan menyertakan semua hal berikut:projectId: Project ID project yang berisi tabel.datasetId: ID set data tabel.tableId: Nama tabel.
Kumpulan satu atau beberapa
Actionobjek, yang mewakili tindakan yang akan dijalankan, dalam urutan yang diberikan, setelah tugas selesai. Setiap objekActiondapat berisi salah satu tindakan berikut:SaveFindingsobjek: Menyimpan hasil pemindaian analisis risiko ke tabel BigQuery.PublishToPubSubobjek: Memublikasikan notifikasi ke topik Pub/Sub.JobNotificationEmailsobjek: Mengirimi Anda email berisi hasil.
Dalam objek
LDiversityConfig, Anda menentukan hal berikut:quasiIds[]: Kumpulan quasi-ID (FieldIdobjek) yang menunjukkan cara kelas kesetaraan ditentukan untuk perhitungan l-diversity. SepertiKAnonymityConfig, saat Anda menentukan beberapa kolom, kolom tersebut akan dianggap sebagai satu kunci komposit.sensitiveAttribute: Kolom sensitif (FieldIdobjek) untuk menghitung nilai l-diversity.
Segera setelah Anda mengirim permintaan ke DLP API, API tersebut akan memulai tugas analisis risiko.
Membuat daftar tugas analisis risiko yang telah selesai
Anda dapat melihat daftar tugas analisis risiko yang telah dijalankan di project saat ini.
Konsol
Untuk membuat daftar tugas analisis risiko yang sedang berjalan dan yang sebelumnya dijalankan di Google Cloud konsol, lakukan hal berikut:
Di Google Cloud konsol, buka Perlindungan Data Sensitif.
Klik tab Tugas &pemicu tugas di bagian atas halaman.
Klik tab Tugas risiko.
Daftar tugas risiko akan muncul.
Protokol
Untuk membuat daftar tugas analisis risiko yang sedang berjalan dan yang sebelumnya dijalankan, kirim permintaan GET ke
resource
projects.dlpJobs. Menambahkan filter jenis tugas (?type=RISK_ANALYSIS_JOB) akan mempersempit respons hanya ke tugas analisis risiko.
https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs?type=RISK_ANALYSIS_JOB
Respons yang Anda terima berisi representasi JSON dari semua tugas analisis risiko saat ini dan sebelumnya.
Melihat hasil tugas l-diversity
Perlindungan Data Sensitif di Google Cloud konsol memiliki visualisasi bawaan untuk tugas l-diversity yang telah selesai. Setelah mengikuti petunjuk di bagian sebelumnya, dari daftar tugas analisis risiko, pilih tugas yang hasilnya ingin Anda lihat. Dengan asumsi tugas telah berhasil dijalankan, bagian atas halaman Detail analisis risiko akan terlihat seperti ini:

Di bagian atas halaman terdapat informasi tentang tugas risiko l-diversity, termasuk ID tugasnya dan, di bagian Penampung, lokasi resourcenya.
Untuk melihat hasil perhitungan l-diversity, klik tab L-diversity. Untuk melihat konfigurasi tugas analisis risiko, klik tab Konfigurasi.
Tab L-diversity pertama-tama mencantumkan nilai sensitif dan quasi-ID yang digunakan untuk menghitung l-diversity.
Diagram risiko
Diagram Risiko identifikasi ulang memplot, pada sumbu y, persentase potensi kehilangan data untuk baris unik dan kombinasi quasi-ID unik untuk mencapai, pada sumbu x, nilai l -diversity. Warna diagram juga menunjukkan potensi risiko. Warna biru yang lebih gelap menunjukkan risiko yang lebih tinggi, sedangkan warna yang lebih terang menunjukkan risiko yang lebih rendah.
Nilai l-diversity yang lebih tinggi menunjukkan keragaman nilai yang lebih rendah, yang dapat membuat set data kurang dapat diidentifikasi ulang dan lebih aman. Namun, untuk mencapai nilai l-diversity yang lebih tinggi, Anda harus menghapus persentase baris total yang lebih tinggi dan kombinasi quasi-ID unik yang lebih tinggi, yang dapat mengurangi kegunaan data. Untuk melihat nilai persentase potensi kehilangan tertentu untuk nilai ll Seperti yang ditunjukkan dalam screenshot, tooltip akan muncul di diagram.
Untuk melihat detail selengkapnya tentang nilai l-diversity tertentu, klik titik data yang sesuai. Penjelasan mendetail ditampilkan di bagian bawah diagram dan tabel data contoh muncul lebih jauh ke bawah halaman.
Tabel data contoh risiko
Komponen kedua di halaman hasil tugas risiko adalah tabel data contoh. Tabel ini menampilkan kombinasi quasi-ID untuk nilai l-diversity target tertentu.

Kolom pertama tabel mencantumkan nilai k-anonymity. Klik nilai l-diversity untuk melihat data contoh yang sesuai yang harus dihilangkan untuk mencapai nilai tersebut.
Kolom kedua menampilkan potensi kehilangan data masing-masing baris unik dan kombinasi quasi-ID untuk mencapai nilai l-diversity yang dipilih, serta jumlah grup dengan setidaknya l atribut sensitif dan jumlah total data.
Kolom terakhir menampilkan contoh grup yang berbagi kombinasi quasi-ID, beserta jumlah data yang ada untuk kombinasi tersebut.
Mengambil detail tugas menggunakan REST
Untuk mengambil hasil tugas analisis risiko l-diversity menggunakan REST
API, kirim permintaan GET berikut ke
projects.dlpJobs
resource. Ganti PROJECT_ID dengan project ID Anda dan
JOB_ID dengan ID tugas yang hasilnya ingin Anda dapatkan.
ID tugas ditampilkan saat Anda memulai tugas, dan juga dapat diambil dengan
membuat daftar semua tugas.
GET https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs/JOB_ID
Permintaan menampilkan objek JSON yang berisi instance tugas. Hasil analisis berada di dalam kunci "riskDetails", dalam objek.AnalyzeDataSourceRiskDetails Untuk mengetahui informasi selengkapnya, lihat referensi API untuk
DlpJob
resource.
Langkah berikutnya
- Pelajari cara menghitung nilai k-anonymity untuk set data.
- Pelajari cara menghitung nilai k-map untuk set data.
- Pelajari cara menghitung nilai δ-presence value untuk set data.