Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Penyensoran audio Customer Experience Insights

Penyuntingan audio Customer Experience Insights adalah framework open source yang secara otomatis mendeteksi dan menyunting informasi identitas pribadi (PII) sensitif dari rekaman audio. Solusi ini menyediakan solusi yang aman, skalabel, dan dapat disesuaikan untuk organisasi yang perlu memproses data audio sambil mempertahankan kepatuhan terhadap peraturan privasi.

Solusi ini bertindak sebagai middleware antara titik penyerapan audio mentah dan platform penyimpanan atau analisis jangka panjang Anda. Solusi ini secara otomatis memproses file audio untuk menghapus data sensitif seperti:

Nomor kartu kredit
Nomor Jaminan Sosial
Nomor telepon
Alamat email
Entitas kustom yang ditentukan oleh organisasi Anda

Dengan menyunting informasi ini sebelum penyimpanan permanen, Anda memastikan data lake dan alat analisis Anda tetap bebas dari data beracun, sehingga mengurangi risiko kepatuhan dan paparan data.

Fitur utama

Penyuntingan otomatis: Menggunakan Speech-to-Text dan Perlindungan Data Sensitif untuk mentranskripsikan, mengidentifikasi, dan menyunting segmen sensitif dari file audio.
Dukungan pemicu ganda: Opsi deployment yang fleksibel memungkinkan Anda memicu penyuntingan segera setelah file diupload ke Cloud Storage atau hilir setelah diproses oleh Customer Experience Insights.
Keamanan perusahaan: Dirancang dengan arsitektur "aman secara default", penyuntingan audio Customer Experience Insights mendukung VPC pribadi, Kontrol Layanan VPC, dan pemeriksaan keamanan rantai pasokan untuk mencegah akses tidak sah dan gangguan kode.
Skalabilitas: Dibangun di Dataflow, pipeline ini otomatis diskalakan untuk menangani volume data audio yang sangat besar, sehingga cocok untuk pusat kontak dengan throughput tinggi.
Output yang dapat diverifikasi: Menghasilkan file audio yang disunting dan transkrip penyuntingan, sehingga memungkinkan verifikasi dan jalur audit.

Cara kerjanya

Solusi ini mengikuti pipeline pemrosesan linear:

Penyerapan dan pemicuan:
- Opsi A (Langsung): File audio diupload ke bucket Cloud Storage "mentah" . Pemicu Cloud Run segera meluncurkan pipeline.
- Opsi B (Insight): CX Insights memproses percakapan. Pesan Pub/Sub memicu layanan Cloud Run, yang kemudian meluncurkan pipeline.
Pemrosesan (Dataflow). Worker Dataflow melakukan hal berikut:
1. Mengambil file audio.
2. Mengirim audio ke Speech-to-Text untuk membuat transkrip dengan stempel waktu.
3. Mengirim transkrip ke Perlindungan Data Sensitif untuk mengidentifikasi offset waktu informasi sensitif.
4. Menggunakan ffmpeg untuk membisukan segmen audio yang sesuai dengan PII yang diidentifikasi.
Output. Fungsi Cloud Run melakukan hal berikut:
1. Opsional: Memindahkan audio mentah asli ke bucket "arsip" yang aman.
2. Menulis kembali audio yang disunting ke lokasi asli atau bucket output yang ditentukan, mengganti segmen sensitif dengan suara senyap atau nada.

Mulai

Untuk menggunakan solusi ini, Anda memerlukan Google Cloud project dengan penagihan yang diaktifkan.

Prasyarat

Google Cloud project
gcloud CLI terinstal dan terautentikasi
Pengaktifan dan akses ke layanan Dataflow, Speech-to-Text, dan Perlindungan Data Sensitif Google Cloud

Akses dan deployment

Kode sumber lengkap dan petunjuk deployment tersedia di repositori GitHub.