다음 권장사항 가이드라인을 따라 주제 모델을 최대한 활용하세요.
주제 모델 미세 조정
주제 할당을 개선하는 가장 좋은 방법은 모델을 미세 조정하는 것입니다. 주제를 추가, 수정, 삭제할 때 다음 가이드라인에 따라 주제 모델을 최적화하세요.
주제 추가 또는 수정하기
중복되거나 유사한 주제를 추가하면 주제 추론의 품질에 부정적인 영향을 미치므로 추가하지 마세요. 주제를 만들거나 변경할 때는 다음 이름 지정 및 설명 가이드라인을 적용하세요.
이름
리모컨 문제 해결 또는 결제 정책 문의와 같이 3~6단어로 된 간결한 주제를 사용하세요.
할인과 같은 일반적이거나 추상적인 이름은 사용하지 않습니다.
선택적으로 다음 권장사항을 따르세요.
결제와 같이 쉽게 사용할 수 있는 맞춤 주제 이름을 사용합니다.
'결제 오류 및 환불'과 같이 주제 이름에 간단한 설명을 추가합니다.
원하는 결과에 따라 적합한 모델 구성을 선택합니다.
예
신용카드 지원 센터에서 보관된 지원 통화 로그에 주제 모델링을 실행합니다. 모델링은 대화 클러스터에서 주제를 만들고 한도 초과 신용카드 문의라는 이름을 지정합니다. 비즈니스에서 이름을 한도 문의로 줄입니다.
설명
일반적인 설명 다음에 몇 가지 예시를 사용합니다.
이름, 날짜, 위치와 같은 개인 정보를 포함하지 마세요.
'X 주제를 포함하지 마세요'와 같이 세부정보가 너무 많으면 주제 추론에 부정적인 영향을 미칠 수 있습니다.
예시
고객이 유선 전화 서비스에 관해 문의하고 있습니다. 취소하거나 현재 청구에 대해 상담하고 싶을 수 있습니다.
고객이 청구에 관해 문의하고 있습니다. 금액이나 기한을 알고 싶어 할 수 있습니다.
보조 주제 삭제
주제 모델을 배포하고 분석을 완료한 후 주제 모델 배포 데이터 페이지에서 주제 분포를 확인합니다. 보조 주제는 일반적이고 일치하는 항목이 더 많기 때문에 배포된 결과에서 지배적인 주제일 수 있습니다. 샘플 대화의 높은 비율 (30% 이상)과 일치하는 주제는 2차 주제일 가능성이 높습니다. 이러한 주제를 주의 깊게 살펴보고 관련이 없는 경우 삭제하세요.
관련 없는 보조 주제의 존재 여부는 입력 데이터에 따라 크게 달라집니다. 배포된 데이터 페이지의 모든 주요 주제가 비교적 균등하게 분포되어 있고 각 주제가 대화의 일부 (20% 미만)에만 일치하는 경우 삭제할 보조 주제가 없을 수 있습니다.
학습 데이터
음성 데이터의 경우 텍스트 변환 출력의 품질이 주제 모델의 성능에 매우 중요합니다. 다음 가이드라인에 따라 학습 데이터의 품질을 개선하세요.
대화
데이터 세트에서 중복된 대화를 사용하지 마세요.
각 대화에는 총 10개 이상의 턴이 포함되어야 하며, 상담사 턴 5개와 고객 턴 5개가 포함되어야 합니다.
수정된 대화를 사용하되 Cloud Data Loss Prevention 수정 품질을 확인합니다. 수정으로 인해 스크립트에서 중요한 정보가 삭제되어 학습 대화의 길이에 영향을 미칠 수 있습니다.
거의 모든 대화가 동일한 언어로 진행되어야 합니다.
스피커 역할
대화가 인제스트된 후 대화의 화자 역할이 올바르게 할당되었는지 확인합니다.
대화 턴을 고객 또는 상담사에서 시작한 것으로 정확하게 라벨링합니다. 역할이 하나만 있는 대화는 학습에 사용되지 않습니다.
사람 역할에는
AGENT을 사용하고 가상 역할에는AUTOMATED_AGENT을 사용합니다.고객 역할에는
END_USER또는CUSTOMER를 사용합니다.