고객 경험 인사이트 오디오 수정

Customer Experience Insights 오디오 수정은 오디오 녹음 파일에서 민감한 개인 식별 정보(PII)를 자동으로 감지하고 수정하는 오픈소스 프레임워크입니다. 개인 정보 보호 규정을 준수하면서 오디오 데이터를 처리해야 하는 조직을 위한 안전하고 확장 가능하며 맞춤설정 가능한 솔루션을 제공합니다.

이 솔루션은 원시 오디오 수집 지점과 장기 저장소 또는 분석 플랫폼 간의 미들웨어 역할을 합니다. 오디오 파일을 자동으로 처리하여 다음과 같은 민감한 정보를 삭제합니다.

  • 신용카드 번호
  • 주민등록번호
  • 전화번호
  • 이메일 주소
  • 조직에서 정의한 맞춤 항목

영구 저장 전에 이 정보를 수정하면 데이터 레이크와 분석 도구에 유해한 데이터가 없으므로 규정 준수 위험과 데이터 노출을 줄일 수 있습니다.

주요 특징

  • 자동 수정: Speech-to-Text 및 Sensitive Data Protection을 사용하여 오디오 파일에서 민감한 세그먼트를 텍스트로 변환하고, 식별하고, 수정합니다.
  • 이중 트리거 지원: 유연한 배포 옵션을 사용하면 파일을 Cloud Storage에 업로드하는 즉시 또는 고객 경험 통계에서 처리한 후 다운스트림에서 수정 작업을 트리거할 수 있습니다.
  • 엔터프라이즈 보안: '기본적으로 보안' 아키텍처로 설계된 Customer Experience Insights 오디오 수정은 비공개 VPC, VPC 서비스 제어, 공급망 보안 검사를 지원하여 무단 액세스 및 코드 조작을 방지합니다.
  • 확장성: Dataflow를 기반으로 구축된 파이프라인은 대량의 오디오 데이터를 처리하도록 자동으로 확장되므로 처리량이 많은 콜센터에 적합합니다.
  • 확인 가능한 출력: 수정된 오디오 파일과 수정 스크립트를 모두 생성하여 확인 및 감사 추적을 지원합니다.

작동 방식

이 솔루션은 선형 처리 파이프라인을 따릅니다.

  1. 수집 및 트리거링:

    • 옵션 A (직접): 오디오 파일이 '원시' Cloud Storage 버킷에 업로드됩니다. Cloud Run 트리거는 파이프라인을 즉시 실행합니다.
    • 옵션 B (인사이트): CX 인사이트가 대화를 처리합니다. Pub/Sub 메시지가 Cloud Run 서비스를 트리거하고, 그러면 파이프라인이 실행됩니다.
  2. 처리 (Dataflow) Dataflow 작업자는 다음을 실행합니다.

    1. 오디오 파일을 가져옵니다.
    2. 타임스탬프가 지정된 스크립트를 생성하기 위해 오디오를 Speech-to-Text에 전송합니다.
    3. 민감한 정보의 시간 오프셋을 식별하기 위해 스크립트를 Sensitive Data Protection에 전송합니다.
    4. ffmpeg를 사용하여 식별된 개인 식별 정보에 해당하는 오디오 세그먼트를 무음 처리합니다.
  3. 출력. Cloud Run 함수는 다음을 수행합니다.

    1. 선택사항: 원본 원시 오디오를 보안 '보관' 버킷으로 이동합니다.
    2. 수정된 오디오를 원래 위치 또는 지정된 출력 버킷에 다시 써서 민감한 세그먼트를 무음 또는 톤으로 대체합니다.

시작하기

이 솔루션을 사용하려면 결제가 사용 설정된 Google Cloud 프로젝트가 필요합니다.

기본 요건

  • Google Cloud 프로젝트
  • gcloud CLI가 설치되고 인증됨
  • Dataflow, Speech-to-Text, Sensitive Data Protection Google Cloud 서비스 사용 설정 및 액세스

액세스 및 배포

전체 소스 코드와 배포 안내는 GitHub 저장소에서 확인할 수 있습니다.