Os dados de áudio são binários. Leia os dados binários diretamente de uma resposta gRPC. No entanto, JSON é usado ao responder a uma solicitação REST. Como JSON é um formato de texto que não aceita diretamente dados binários, a Cloud Text-to-Speech retorna uma string de resposta codificada em Base64. Você precisa converter os dados de texto codificados em base64 da resposta para binário para reproduzi-los em um dispositivo.
As respostas JSON da Cloud Text-to-Speech incluem conteúdo de áudio codificado em base64 no campo audioContent. Por exemplo:
{
"audioContent": "//NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o..."
}
Para decodificar base64 em um arquivo de áudio:
Linux
Copie apenas o conteúdo codificado em base64 para um arquivo de texto.
Decodifique o arquivo de texto de origem usando a ferramenta de linha de comando base64 usando a sinalização
-d:
$ base64 SOURCE_BASE64_TEXT_FILE -d > DESTINATION_AUDIO_FILE
Mac OSX
Copie apenas o conteúdo codificado em base64 para um arquivo de texto.
Decodifique o arquivo de texto de origem usando a ferramenta de linha de comando em base64:
$ base64 --decode -i SOURCE_BASE64_TEXT_FILE > DESTINATION_AUDIO_FILE
Windows
Copie apenas o conteúdo codificado em base64 para um arquivo de texto.
Decodifique o arquivo de texto de origem usando o comando
certutil.
certutil -decode SOURCE_BASE64_TEXT_FILE DESTINATION_AUDIO_FILE