Criar um conjunto de dados de conversa

Um conjunto de dados de conversa contém dados de transcrição de conversa e é usado para treinar um modelo personalizado de Resposta inteligente ou de resumo. A Resposta inteligente usa as transcrições de conversa para recomendar respostas de texto a representantes humanos que conversam com um usuário final. Os modelos personalizados de resumo são treinados em conjuntos de dados de conversa que contêm transcrições e dados de anotação. Eles usam as anotações para gerar resumos de conversa para representantes humanos após a conclusão de uma conversa.

Há duas maneiras de criar um conjunto de dados: usando os fluxos de trabalho do tutorial do console, ou criando um conjunto de dados manualmente no console usando a guia Dados -> Conjuntos de dados. Recomendamos que você use os tutoriais do console como primeira opção. Para usar os tutoriais do console, acesse o console do Agent Assist e clique no botão Começar abaixo do recurso que você quer testar.

Esta página demonstra como criar um conjunto de dados manualmente.

Antes de começar

  1. Siga as instruções de configuração do Dialogflow para ativar o Dialogflow em um projeto do Google Cloud Platform.

  2. Recomendamos que você leia a página Noções básicas do Agent Assist antes de iniciar este tutorial.

  3. Se você estiver implementando a Resposta inteligente usando seus próprios dados de transcrição, verifique se as transcrições estão em JSON no formato especificado e armazenadas em um bucket do Cloud Storage. Um conjunto de dados de conversa precisa conter pelo menos 30.000 conversas. Caso contrário, o treinamento de modelo vai falhar. Como regra geral, quanto mais conversas você tiver, melhor será a qualidade do modelo. Sugerimos que você remova todas as conversas com menos de 20 mensagens ou 3 turnos de conversa (mudanças no participante que está fazendo uma declaração). Também sugerimos que você remova todas as mensagens de bot ou mensagens geradas automaticamente por sistemas (por exemplo, "O representante entra na sala de chat"). Recomendamos que você faça o upload de pelo menos 3 meses de conversas para garantir a cobertura do maior número possível de casos de uso. O número máximo de conversas em um conjunto de dados de conversa é de 1.000.000.

  4. Se você estiver implementando o resumo usando seus próprios dados de transcrição e anotação, verifique se as transcrições estão no formato especificado e armazenadas em um bucket do Cloud Storage. O número mínimo recomendado de anotações de treinamento é 1.000. O número mínimo obrigatório é 100.

  5. Acesse o console do Agent Assist. Selecione seu projeto do Google Cloud Platform e clique na opção de menu Dados na margem esquerda da página. O menu Dados mostra todos os seus dados. Há duas guias, uma para conjuntos de dados de conversa e outra para bases de conhecimento.

  6. Clique na guia Conjuntos de dados de conversa e no botão +Criar novo no canto superior direito da página de conjuntos de dados de conversa.

Criar um conjunto de dados de conversa

  1. Insira um Nome e uma Descrição opcional para o novo conjunto de dados. No campo Dados de conversa, insira o URI do bucket de armazenamento que contém as transcrições de conversa. O Agent Assist oferece suporte ao uso do símbolo * para correspondência de caracteres curinga. O URI precisa ter o seguinte formato:

    gs://<bucket name>/<object name>
    

    Exemplo:

    gs://mydata/conversationjsons/conv0*.json
    gs://mydatabucket/test/conv.json
    
  2. Clique em Criar. O novo conjunto de dados agora aparece na lista de conjuntos de dados na página do menu Dados na guia Conjuntos de dados de conversa.

A seguir

Treine um modelo de Resposta inteligente ou de resumo em um ou mais conjuntos de dados de conversa usando o console do Agent Assist.