Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Praktik terbaik pemodelan topik

Ikuti panduan praktik terbaik berikut untuk mengoptimalkan model topik Anda.

Menyesuaikan model topik

Cara terbaik untuk meningkatkan kualitas penetapan topik adalah dengan menyesuaikan model Anda. Ikuti panduan ini untuk mengoptimalkan model topik saat menambahkan, mengedit, dan menghapus topik.

Menambahkan atau mengedit topik

Hindari menambahkan topik duplikat atau serupa karena akan berdampak negatif pada kualitas inferensi topik. Saat membuat atau mengubah topik, terapkan panduan penamaan dan deskripsi berikut.

Nama

Gunakan topik singkat dan deskriptif yang terdiri dari tiga hingga enam kata, seperti memecahkan masalah remote control atau menanyakan kebijakan penagihan.
Hindari nama umum atau abstrak, seperti Penjualan.

Atau, ikuti praktik terbaik berikut:

Gunakan nama topik kustom yang tersedia, seperti Penagihan.
Tambahkan deskripsi singkat ke nama topik, seperti "Kesalahan Penagihan dan Pengembalian Dana".
Pilih konfigurasi model yang sesuai berdasarkan hasil yang Anda inginkan.

Contoh

Pusat dukungan kartu kredit menjalankan pemodelan topik pada log panggilan dukungan yang diarsipkan. Pemodelan membuat topik dari sekelompok percakapan dan menamainya Pertanyaan tentang kartu kredit yang melebihi batas. Bisnis memperpendek nama menjadi Pertanyaan batas kredit.

Deskripsi

Gunakan deskripsi umum yang diikuti dengan beberapa contoh.
Hindari menyertakan informasi pribadi seperti nama, tanggal, atau lokasi.
Terlalu banyak detail, seperti "jangan sertakan topik X", dapat berdampak negatif pada inferensi topik.

Contoh

Pelanggan bertanya tentang layanan telepon rumahnya. Mereka mungkin ingin membatalkannya atau berkonsultasi tentang penagihan saat ini.
Pelanggan menanyakan tagihannya. Mereka mungkin ingin mengetahui jumlah atau tanggal jatuh tempo.

Menghapus topik sekunder

Setelah Anda men-deploy model topik dan menyelesaikan analisis, periksa distribusi topik di halaman Data Model Topik yang Di-deploy. Topik sekunder mungkin menjadi topik dominan dalam hasil yang di-deploy karena dapat menjadi umum dan memiliki kecocokan yang lebih kuat. Topik yang cocok dengan proporsi tinggi (lebih dari 30%) dari contoh percakapan Anda kemungkinan merupakan topik sekunder. Periksa topik ini dengan cermat dan hapus jika tidak relevan.

Ada atau tidaknya topik sekunder yang tidak relevan sangat bergantung pada data input. Jika semua topik utama di halaman Data yang di-deploy memiliki distribusi yang relatif merata, dan setiap topik hanya cocok dengan sebagian kecil (kurang dari 20%) percakapan, maka mungkin tidak ada topik sekunder yang perlu dihapus.

Data pelatihan

Untuk data suara, kualitas output Speech-to-Text sangat penting untuk performa model topik. Ikuti panduan ini untuk meningkatkan kualitas data pelatihan Anda.

Percakapan

Hindari penggunaan percakapan duplikat dalam set data.
Setiap percakapan harus berisi total minimal 10 giliran, dengan 5 dari agen dan 5 dari pelanggan.
Gunakan percakapan yang disamarkan, tetapi periksa kualitas penyamaran Cloud Data Loss Prevention. Terkadang, penyensoran menghapus informasi penting dari transkrip, yang dapat memengaruhi durasi percakapan pelatihan Anda.
Pastikan hampir semua percakapan menggunakan bahasa yang sama.

Peran pembicara

Pastikan peran penutur percakapan ditetapkan dengan benar setelah percakapan diserap.

Beri label secara akurat giliran percakapan sebagai berasal dari pelanggan atau agen. Percakapan dengan hanya satu peran tidak akan digunakan dalam pelatihan.
Gunakan AGENT untuk peran manusia dan AUTOMATED_AGENT untuk peran virtual.
Gunakan END_USER atau CUSTOMER untuk peran pelanggan.

Praktik terbaik pemodelan topik Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

Menyesuaikan model topik

Menambahkan atau mengedit topik

Nama

Contoh

Deskripsi

Contoh

Menghapus topik sekunder

Data pelatihan

Percakapan

Peran pembicara

Praktik terbaik pemodelan topik