Avalie modelos

Use a funcionalidade de testes de referência da Cloud Speech-to-Text Console para medir a precisão de qualquer um dos modelos de transcrição usados na API Cloud Speech-to-Text V2.

A Cloud Speech-to-Text Console oferece testes de referência visuais para modelos pré-preparados e personalizados do Speech-to-Text. Pode inspecionar a qualidade do reconhecimento comparando as métricas de avaliação da taxa de erro de palavras (WER) em vários modelos de transcrição para ajudar a decidir que modelo se adapta melhor à sua aplicação.

Antes de começar

Certifique-se de que se inscreveu numa Google Cloud conta, criou um projeto, preparou um modelo de voz personalizado e implementou-o através de um ponto final.

Crie um conjunto de dados de verdade fundamental

Para criar um conjunto de dados de testes de referência personalizado, recolha amostras de áudio que reflitam com precisão o tipo de tráfego que o modelo de transcrição vai encontrar num ambiente de produção. Idealmente, a duração agregada destes ficheiros de áudio deve abranger, no mínimo, 30 minutos e não exceder 10 horas. Para reunir o conjunto de dados, tem de:

  1. Crie um diretório num contentor do Cloud Storage à sua escolha para armazenar os ficheiros de áudio e texto do conjunto de dados.
  2. Para cada ficheiro de áudio no conjunto de dados, crie transcrições razoavelmente precisas. Para cada ficheiro de áudio (como example_audio_1.wav), tem de criar um ficheiro de texto de referência (example_audio_1.txt) correspondente. Este serviço usa estes pares de áudio e texto num contentor do Cloud Storage para criar o conjunto de dados.

Teste de referência do modelo

Para usar o modelo de conversão de voz em texto personalizado e o conjunto de dados de testes de referência para avaliar a precisão do seu modelo, siga o guia de medição e melhoria da precisão.