Ikuti panduan praktik terbaik berikut untuk mengoptimalkan model topik Anda.
Menyesuaikan model topik
Cara terbaik untuk meningkatkan kualitas penetapan topik adalah dengan menyesuaikan model Anda. Ikuti panduan ini untuk mengoptimalkan model topik saat menambahkan, mengedit, dan menghapus topik.
Menambahkan atau mengedit topik
Hindari menambahkan topik duplikat atau serupa karena akan berdampak negatif pada kualitas inferensi topik. Saat membuat atau mengubah topik, terapkan panduan penamaan dan deskripsi berikut.
Nama
Gunakan topik singkat dan deskriptif yang terdiri dari tiga hingga enam kata, seperti memecahkan masalah remote control atau menanyakan kebijakan penagihan.
Hindari nama umum atau abstrak, seperti Penjualan.
Atau, ikuti praktik terbaik berikut:
Gunakan nama topik kustom yang tersedia, seperti Penagihan.
Tambahkan deskripsi singkat ke nama topik, seperti "Kesalahan Penagihan dan Pengembalian Dana".
Pilih konfigurasi model yang sesuai berdasarkan hasil yang Anda inginkan.
Contoh
Pusat dukungan kartu kredit menjalankan pemodelan topik pada log panggilan dukungan yang diarsipkan. Pemodelan membuat topik dari sekelompok percakapan dan menamainya Pertanyaan tentang kartu kredit yang melebihi batas. Bisnis memperpendek nama menjadi Pertanyaan batas kredit.
Deskripsi
Gunakan deskripsi umum yang diikuti dengan beberapa contoh.
Hindari menyertakan informasi pribadi seperti nama, tanggal, atau lokasi.
Terlalu banyak detail, seperti "jangan sertakan topik X", dapat berdampak negatif pada inferensi topik.
Contoh
Pelanggan bertanya tentang layanan telepon rumahnya. Mereka mungkin ingin membatalkannya atau berkonsultasi tentang penagihan saat ini.
Pelanggan menanyakan tagihannya. Mereka mungkin ingin mengetahui jumlah atau tanggal jatuh tempo.
Menghapus topik sekunder
Setelah Anda men-deploy model topik dan menyelesaikan analisis, periksa distribusi topik di halaman Data Model Topik yang Di-deploy. Topik sekunder mungkin menjadi topik dominan dalam hasil yang di-deploy karena dapat menjadi umum dan memiliki kecocokan yang lebih kuat. Topik yang cocok dengan proporsi tinggi (lebih dari 30%) dari contoh percakapan Anda kemungkinan merupakan topik sekunder. Periksa topik ini dengan cermat dan hapus jika tidak relevan.
Ada atau tidaknya topik sekunder yang tidak relevan sangat bergantung pada data input. Jika semua topik utama di halaman Data yang di-deploy memiliki distribusi yang relatif merata, dan setiap topik hanya cocok dengan sebagian kecil (kurang dari 20%) percakapan, maka mungkin tidak ada topik sekunder yang perlu dihapus.
Data pelatihan
Untuk data suara, kualitas output Speech-to-Text sangat penting untuk performa model topik. Ikuti panduan ini untuk meningkatkan kualitas data pelatihan Anda.
Percakapan
Hindari penggunaan percakapan duplikat dalam set data.
Setiap percakapan harus berisi total minimal 10 giliran, dengan 5 dari agen dan 5 dari pelanggan.
Gunakan percakapan yang disamarkan, tetapi periksa kualitas penyamaran Cloud Data Loss Prevention. Terkadang, penyensoran menghapus informasi penting dari transkrip, yang dapat memengaruhi durasi percakapan pelatihan Anda.
Pastikan hampir semua percakapan menggunakan bahasa yang sama.
Peran pembicara
Pastikan peran penutur percakapan ditetapkan dengan benar setelah percakapan diserap.
Beri label secara akurat giliran percakapan sebagai berasal dari pelanggan atau agen. Percakapan dengan hanya satu peran tidak akan digunakan dalam pelatihan.
Gunakan
AGENTuntuk peran manusia danAUTOMATED_AGENTuntuk peran virtual.Gunakan
END_USERatauCUSTOMERuntuk peran pelanggan.