Data percakapan diterima sebagai transkrip (Smart Reply) dan transkrip plus data anotasi (Ringkasan). Untuk menggunakan Smart Reply dan Ringkasan selama runtime, Anda harus memberikan data percakapan Anda sendiri.
Halaman ini memandu Anda melalui langkah-langkah yang diperlukan untuk menggunakan set data publik serta memformat data Anda sendiri untuk diupload ke Cloud Storage. Anda harus memberikan data percakapan Anda sebagai file teks berformat JSON.
Format data Smart Reply
Smart Reply dapat digunakan bersama dengan fitur Agent Assist apa pun, atau sebagai fitur mandiri. Untuk menerapkan Smart Reply, Anda harus memberikan data percakapan ke Agent Assist.
Format data peringkasan
Ringkasan dapat digunakan bersama dengan fitur Bantuan Agen apa pun, atau sebagai fitur mandiri. Untuk menerapkan Ringkasan, Anda harus memberikan data percakapan yang menyertakan anotasi ke Agent Assist. Anotasi adalah ringkasan transkrip percakapan terkait. Anotasi digunakan untuk melatih model yang dapat Anda gunakan untuk membuat ringkasan bagi agen Anda di akhir setiap percakapan dengan pengguna akhir.
Memformat anotasi
Model kustom Ringkasan Agent Assist dilatih menggunakan set data percakapan. Set data percakapan berisi data transkrip dan anotasi yang Anda upload sendiri.
Sebelum dapat mulai mengupload data, Anda harus memastikan bahwa setiap transkrip percakapan dalam format JSON, memiliki anotasi terkait, dan disimpan dalam bucket Google Cloud Storage.
Untuk membuat anotasi, tambahkan string key dan value yang diharapkan ke kolom
annotation yang terkait dengan setiap percakapan dalam set data Anda. Untuk hasil terbaik, data pelatihan anotasi harus mematuhi panduan berikut:
- Jumlah minimum anotasi pelatihan yang direkomendasikan adalah 1.000. Jumlah minimum yang diterapkan adalah 100.
- Data pelatihan tidak boleh berisi PII.
- Anotasi tidak boleh menyertakan informasi apa pun tentang gender, ras, atau usia.
- Anotasi tidak boleh menggunakan bahasa yang tidak sopan atau vulgar.
- Anotasi tidak boleh berisi informasi apa pun yang tidak dapat disimpulkan dari transkrip percakapan yang sesuai.
- Setiap anotasi dapat berisi hingga 3 bagian. Anda dapat memilih nama bagian Anda sendiri.
- Anotasi harus memiliki ejaan dan tata bahasa yang benar.
Berikut adalah contoh yang menunjukkan format transkrip percakapan dengan anotasi terkait:
{
"entries": [
{
"text": "How can I help?",
"role": "AGENT"
},
{
"text": "I cannot login",
"role": "CUSTOMER"
},
{
"text": "Ok, let me confirm. Are you experiencing issues accessing your account",
"role": "AGENT"
},
{
"text": "Yes",
"role": "CUSTOMER"
},
{
"text": "Got it. Do you still have access to the registered email for the account",
"role": "AGENT"
},
{
"text": "Yes",
"role": "AGENT"
},
{
"text": "I have sent an email with reset steps. You can follow the instructions in the email to reset your login password",
"role": "AGENT"
},
{
"text": "That's nice",
"role": "CUSTOMER"
},
{
"text": "Is there anything else I can help",
"role": "AGENT"
},
{
"text": "No that's all",
"role": "CUSTOMER"
},
{
"text": "Thanks for calling. You have a nice day",
"role": "AGENT"
}
],
"conversation_info": {
"annotations": [
{
"annotation": {
"conversation_summarization_suggestion": {
"text_sections": [
{
"key": "Situation",
"value": "Customer was unable to login to account"
},
{
"key": "Action",
"value": "Agent sent an email with password reset instructions"
},
{
"key": "Outcome",
"value": "Problem was resolved"
}
]
}
}
}
]
}
}
Data transkrip percakapan
Data percakapan teks harus diberikan dalam file berformat JSON, dengan setiap file berisi data untuk satu percakapan. Berikut ini menjelaskan format JSON yang diperlukan.
Percakapan
Objek tingkat teratas untuk data percakapan.
| Kolom | Jenis | Deskripsi |
|---|---|---|
| conversation_info | ConversationInfo { } | Opsional. Metadata untuk percakapan. |
| entries | Entri [ ] | Wajib. Pesan percakapan yang diurutkan secara kronologis. |
ConversationInfo
Metadata untuk percakapan.
| Kolom | Jenis | Deskripsi |
|---|---|---|
| kategori | Kategori [ ] | Opsional. Kategori kustom untuk data percakapan. |
Kategori
Kategori data percakapan. Jika Anda memberikan kategori dengan data percakapan Anda, kategori tersebut akan digunakan untuk mengidentifikasi topik dalam percakapan Anda. Jika Anda tidak memberikan kategori, sistem akan otomatis mengategorikan percakapan berdasarkan kontennya.
| Kolom | Jenis | Deskripsi |
|---|---|---|
| display_name | string | Wajib. Nama tampilan untuk kategori. |
Entri
Data untuk satu pesan percakapan.
| Kolom | Jenis | Deskripsi |
|---|---|---|
| teks biasa | string | Wajib. Teks untuk pesan percakapan ini. Semua teks harus dikapitalisasi dengan benar. Kualitas model dapat terpengaruh secara signifikan jika semua huruf dalam teks menggunakan huruf kapital atau huruf kecil. Error akan ditampilkan jika kolom ini dibiarkan kosong. |
| user_id | bilangan bulat | Opsional. Angka yang mengidentifikasi peserta percakapan. Setiap peserta harus memiliki satu user_id, yang digunakan berulang kali jika mereka berpartisipasi dalam beberapa percakapan. |
| peran | string | Wajib. Peran peserta percakapan. Salah satu dari: "AGENT", "CUSTOMER". |
| start_timestamp_usec | bilangan bulat | Opsional jika percakapan hanya digunakan untuk bantuan FAQ, Saran dan Ringkasan Artikel, jika tidak Wajib diisi. Stempel waktu untuk awal giliran percakapan ini dalam mikrodetik. |
Contoh
Berikut ini contoh file data percakapan.
{
"conversation_info":{
"categories":[
{
"display_name":"Category 1"
}
]
},
"entries": [
{
"start_timestamp_usec": 1000000,
"text": "Hello, I'm calling in regards to ...",
"role": "CUSTOMER",
"user_id": 1
},
{
"start_timestamp_usec": 5000000,
"text": "Yes, I can answer your question ...",
"role": "AGENT",
"user_id": 2
},
...
]
}
Mengupload percakapan ke Cloud Storage
Anda harus memberikan data percakapan Anda di bucket Cloud Storage yang ada dalam project Google Cloud Platform Anda. Saat membuat bucket:
- Pastikan Anda telah memilih project Google Cloud Platform yang digunakan untuk Dialogflow.
- Gunakan kelas Standard Storage.
- Tetapkan bucket location ke lokasi terdekat dengan lokasi Anda.
Anda akan memerlukan ID lokasi (misalnya,
us-west1) saat memberikan data percakapan, jadi catat pilihan Anda. - Anda juga memerlukan nama bucket saat memberikan data percakapan.
Ikuti petunjuk Mulai cepat Cloud Storage untuk membuat bucket dan mengupload file.