Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Mengupload data percakapan

Data percakapan diterima sebagai transkrip (Smart Reply) dan transkrip plus data anotasi (Ringkasan). Untuk menggunakan Smart Reply dan Ringkasan selama runtime, Anda harus memberikan data percakapan Anda sendiri.

Halaman ini memandu Anda melalui langkah-langkah yang diperlukan untuk menggunakan set data publik serta memformat data Anda sendiri untuk diupload ke Cloud Storage. Anda harus memberikan data percakapan Anda sebagai file teks berformat JSON.

Format data Smart Reply

Smart Reply dapat digunakan bersama dengan fitur Agent Assist apa pun, atau sebagai fitur mandiri. Untuk menerapkan Smart Reply, Anda harus memberikan data percakapan ke Agent Assist.

Format data ringkasan

Ringkasan dapat digunakan bersama dengan fitur Bantuan Agen apa pun, atau sebagai fitur mandiri. Untuk menerapkan Ringkasan, Anda harus memberikan data percakapan yang menyertakan anotasi ke Agent Assist. Anotasi adalah ringkasan transkrip percakapan terkait. Anotasi digunakan untuk melatih model yang dapat Anda gunakan untuk membuat ringkasan bagi agen Anda di akhir setiap percakapan dengan pengguna akhir.

Memformat anotasi

Model kustom Ringkasan Agent Assist dilatih menggunakan set data percakapan. Set data percakapan berisi data transkrip dan anotasi yang Anda upload sendiri.

Sebelum dapat mulai mengupload data, Anda harus memastikan bahwa setiap transkrip percakapan dalam format JSON, memiliki anotasi terkait, dan disimpan dalam bucket Google Cloud Storage.

Untuk membuat anotasi, tambahkan string key dan value yang diharapkan ke kolom annotation yang terkait dengan setiap percakapan dalam set data Anda. Untuk hasil terbaik, data pelatihan anotasi harus mematuhi panduan berikut:

Jumlah minimum anotasi pelatihan yang direkomendasikan adalah 1.000. Jumlah minimum yang diterapkan adalah 100.
Data pelatihan tidak boleh berisi PII.
Anotasi tidak boleh menyertakan informasi apa pun tentang gender, ras, atau usia.
Anotasi tidak boleh menggunakan bahasa yang tidak sopan atau vulgar.
Anotasi tidak boleh berisi informasi apa pun yang tidak dapat disimpulkan dari transkrip percakapan yang sesuai.
Setiap anotasi dapat berisi hingga 3 bagian. Anda dapat memilih nama bagian Anda sendiri.
Anotasi harus memiliki ejaan dan tata bahasa yang benar.

Berikut adalah contoh yang menunjukkan format transkrip percakapan dengan anotasi terkait:

{
  "entries": [
    {
      "text": "How can I help?",
      "role": "AGENT"
    },
    {
      "text": "I cannot login",
      "role": "CUSTOMER"
    },
    {
      "text": "Ok, let me confirm. Are you experiencing issues accessing your account",
      "role": "AGENT"
    },
    {
      "text": "Yes",
      "role": "CUSTOMER"
    },
    {
      "text": "Got it. Do you still have access to the registered email for the account",
      "role": "AGENT"
    },
    {
      "text": "Yes",
      "role": "AGENT"
    },
    {
      "text": "I have sent an email with reset steps. You can follow the instructions in the email to reset your login password",
      "role": "AGENT"
    },
    {
      "text": "That's nice",
      "role": "CUSTOMER"
    },
    {
      "text": "Is there anything else I can help",
      "role": "AGENT"
    },
    {
      "text": "No that's all",
      "role": "CUSTOMER"
    },
    {
      "text": "Thanks for calling. You have a nice day",
      "role": "AGENT"
    }
  ],
  "conversation_info": {
    "annotations": [
      {
        "annotation": {
          "conversation_summarization_suggestion": {
            "text_sections": [
              {
                "key": "Situation",
                "value": "Customer was unable to login to account"
              },
              {
                "key": "Action",
                "value": "Agent sent an email with password reset instructions"
              },
              {
                "key": "Outcome",
                "value": "Problem was resolved"
              }
            ]
          }
        }
      }
    ]
  }
}

Data transkrip percakapan

Data percakapan teks harus diberikan dalam file berformat JSON, dengan setiap file berisi data untuk satu percakapan. Berikut ini menjelaskan format JSON yang diperlukan.

Percakapan

Objek tingkat teratas untuk data percakapan.

Kolom	Jenis	Deskripsi
conversation_info	ConversationInfo { }	Opsional. Metadata untuk percakapan.
entries	Entri [ ]	Wajib. Pesan percakapan yang diurutkan secara kronologis.

ConversationInfo

Metadata untuk percakapan.

Kolom	Jenis	Deskripsi
kategori	Kategori [ ]	Opsional. Kategori kustom untuk data percakapan.

Kategori

Kategori data percakapan. Jika Anda memberikan kategori dengan data percakapan Anda, kategori tersebut akan digunakan untuk mengidentifikasi topik dalam percakapan Anda. Jika Anda tidak memberikan kategori, sistem akan otomatis mengategorikan percakapan berdasarkan kontennya.

Kolom	Jenis	Deskripsi
display_name	string	Wajib. Nama tampilan untuk kategori.

Entri

Data untuk satu pesan percakapan.

Kolom	Jenis	Deskripsi
teks biasa	string	Wajib. Teks untuk pesan percakapan ini. Semua teks harus dikapitalisasi dengan benar. Kualitas model dapat terpengaruh secara signifikan jika semua huruf dalam teks menggunakan huruf kapital atau huruf kecil. Error akan ditampilkan jika kolom ini dibiarkan kosong.
user_id	integer	Opsional. Angka yang mengidentifikasi peserta percakapan. Setiap peserta harus memiliki satu `user_id`, yang digunakan berulang kali jika mereka berpartisipasi dalam beberapa percakapan.
peran	string	Wajib. Peran peserta percakapan. Salah satu dari: "AGENT", "CUSTOMER".
start_timestamp_usec	integer	Opsional jika percakapan hanya digunakan untuk bantuan FAQ, Saran dan Ringkasan Artikel, jika tidak, Wajib. Stempel waktu untuk awal giliran percakapan ini dalam mikrodetik.

Contoh

Berikut ini contoh file data percakapan.

{
  "conversation_info":{
    "categories":[
      {
        "display_name":"Category 1"
      }
    ]
  },
  "entries": [
    {
      "start_timestamp_usec": 1000000,
      "text": "Hello, I'm calling in regards to ...",
      "role": "CUSTOMER",
      "user_id": 1
    },
    {
      "start_timestamp_usec": 5000000,
      "text": "Yes, I can answer your question ...",
      "role": "AGENT",
      "user_id": 2
    },
    ...
  ]
}

Mengupload percakapan ke Cloud Storage

Anda harus memberikan data percakapan Anda dalam bucket Cloud Storage yang ada dalam project Google Cloud Platform Anda. Saat membuat bucket:

Pastikan Anda telah memilih project Google Cloud Platform yang digunakan untuk Dialogflow.
Gunakan kelas Standard Storage.
Tetapkan lokasi bucket ke lokasi terdekat dengan lokasi Anda. Anda akan memerlukan ID lokasi (misalnya, us-west1) saat memberikan data percakapan, jadi catat pilihan Anda.
Anda juga akan memerlukan nama bucket saat memberikan data percakapan.

Ikuti petunjuk Mulai cepat Cloud Storage untuk membuat bucket dan mengupload file.

Mengupload data percakapan Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.