Penyuntingan audio Customer Experience Insights adalah framework open source yang secara otomatis mendeteksi dan menyunting informasi identitas pribadi (PII) sensitif dari rekaman audio. Solusi ini menyediakan solusi yang aman, skalabel, dan dapat disesuaikan untuk organisasi yang perlu memproses data audio sambil mempertahankan kepatuhan terhadap peraturan privasi.
Solusi ini bertindak sebagai middleware antara titik penyerapan audio mentah dan platform penyimpanan atau analisis jangka panjang Anda. Solusi ini secara otomatis memproses file audio untuk menghapus data sensitif seperti:
- Nomor kartu kredit
- Nomor Jaminan Sosial
- Nomor telepon
- Alamat email
- Entitas kustom yang ditentukan oleh organisasi Anda
Dengan menyunting informasi ini sebelum penyimpanan permanen, Anda memastikan data lake dan alat analisis Anda tetap bebas dari data beracun, sehingga mengurangi risiko kepatuhan dan paparan data.
Fitur utama
- Penyuntingan otomatis: Menggunakan Speech-to-Text dan Perlindungan Data Sensitif untuk mentranskripsikan, mengidentifikasi, dan menyunting segmen sensitif dari file audio.
- Dukungan pemicu ganda: Opsi deployment yang fleksibel memungkinkan Anda memicu penyuntingan segera setelah file diupload ke Cloud Storage atau hilir setelah diproses oleh Customer Experience Insights.
- Keamanan perusahaan: Dirancang dengan arsitektur "aman secara default", penyuntingan audio Customer Experience Insights mendukung VPC pribadi, Kontrol Layanan VPC, dan pemeriksaan keamanan rantai pasokan untuk mencegah akses tidak sah dan gangguan kode.
- Skalabilitas: Dibangun di Dataflow, pipeline ini otomatis diskalakan untuk menangani volume data audio yang sangat besar, sehingga cocok untuk pusat kontak dengan throughput tinggi.
- Output yang dapat diverifikasi: Menghasilkan file audio yang disunting dan transkrip penyuntingan, sehingga memungkinkan verifikasi dan jalur audit.
Cara kerjanya
Solusi ini mengikuti pipeline pemrosesan linear:
Penyerapan dan pemicuan:
- Opsi A (Langsung): File audio diupload ke bucket Cloud Storage "mentah" . Pemicu Cloud Run segera meluncurkan pipeline.
- Opsi B (Insight): CX Insights memproses percakapan. Pesan Pub/Sub memicu layanan Cloud Run, yang kemudian meluncurkan pipeline.
Pemrosesan (Dataflow). Worker Dataflow melakukan hal berikut:
- Mengambil file audio.
- Mengirim audio ke Speech-to-Text untuk membuat transkrip dengan stempel waktu.
- Mengirim transkrip ke Perlindungan Data Sensitif untuk mengidentifikasi offset waktu informasi sensitif.
- Menggunakan
ffmpeguntuk membisukan segmen audio yang sesuai dengan PII yang diidentifikasi.
Output. Fungsi Cloud Run melakukan hal berikut:
- Opsional: Memindahkan audio mentah asli ke bucket "arsip" yang aman.
- Menulis kembali audio yang disunting ke lokasi asli atau bucket output yang ditentukan, mengganti segmen sensitif dengan suara senyap atau nada.
Mulai
Untuk menggunakan solusi ini, Anda memerlukan Google Cloud project dengan penagihan yang diaktifkan.
Prasyarat
- Google Cloud project
gcloudCLI terinstal dan terautentikasi- Pengaktifan dan akses ke layanan Dataflow, Speech-to-Text, dan Perlindungan Data Sensitif Google Cloud
Akses dan deployment
Kode sumber lengkap dan petunjuk deployment tersedia di repositori GitHub.