会话数据格式

客户体验洞见会使用您上传到 Cloud Storage 存储桶的对话数据。您可以向 API 提供音频文本文件形式的对话数据。

对话转录数据

您的文本文件包含以下详细信息。

对话

对话数据的顶级对象。

字段 类型 说明
conversation_info ConversationInfo { } 可选。对话的元数据。
entries Entry [ ] 必需。按时间顺序排序的对话消息。

ConversationInfo

对话的元数据。

字段 类型 说明
类别 Category [ ] 可选。对话数据的自定义类别。

类别

对话数据类别。如果您提供包含对话数据的类别,则这些类别将用于标识对话中的主题。如果您没有提供类别,系统将根据内容自动对对话进行分类。

字段 类型 说明
display_name 字符串 必需。类别的显示名。

条目

单个对话消息的数据。

字段 类型 说明
text 字符串 必需。此对话消息的文本。
user_id 整数 必需。标识对话参与者的数字。每个参与者应该有一个 user_id,并在他们参与多个对话时重复使用。
角色 字符串 必需。对话参与者角色。“AGENT”“AUTOMATED_AGENT”“CUSTOMER”或“END_USER”之一。
start_timestamp_usec 整数 必需。此轮对话开始时的时间戳(以自 Unix 纪元以来的世界协调时间,以微秒为单位)。

示例

以下示例展示了对话数据文件。

{
  "conversation_info":{
    "categories":[
      {
        "display_name":"Category 1"
      }
    ]
  },
  "entries": [
    {
      "start_timestamp_usec": 1000000,
      "text": "Hello, I'm calling in regards to ...",
      "role": "CUSTOMER",
      "user_id": 1
    },
    {
      "start_timestamp_usec": 5000000,
      "text": "Yes, I can answer your question ...",
      "role": "AGENT",
      "user_id": 2
    }
  ]
}