Nesta página, descrevemos como ativar o reconhecimento de idioma para solicitações de transcrição de áudio enviadas à Cloud Speech-to-Text.
Em algumas situações, talvez você não saiba qual é o idioma da sua gravação de áudio. Por exemplo, caso seu serviço, aplicativo ou produto seja oferecido em um país com vários idiomas oficiais, você poderá receber entradas de áudio de usuários em idiomas diferentes. Isso pode dificultar muito a especificação de um único código de idioma para solicitações de transcrição.
Reconhecimento de vários idiomas
Com a Cloud Speech-to-Text, você pode especificar um conjunto de idiomas alternativos que podem estar contidos nos seus dados de áudio. Ao enviar uma solicitação de transcrição de áudio para a Cloud Speech-to-Text, é possível fornecer uma lista de idiomas adicionais que podem estar presentes nos dados. Se você incluir uma lista de idiomas na sua solicitação, a Cloud Speech-to-Text tentará transcrever o áudio com base no idioma que melhor se adequar à amostra das alternativas fornecidas. A Cloud Speech-to-Text rotula os resultados da transcrição com o código de idioma previsto.
Esse recurso é ideal para aplicativos que precisam transcrever frases curtas, como comandos de voz ou pesquisas. Você pode listar até três idiomas alternativos dentre os compatíveis com a Cloud Speech-to-Text além do idioma principal, somando quatro idiomas no total.
Mesmo que você possa especificar idiomas alternativos para sua solicitação de transcrição de fala,
você ainda deve fornecer um código de idioma principal
no campo languageCode. Além disso, é recomendável limitar o número de idiomas solicitados ao mínimo. Solicite menos códigos de idiomas alternativos para ajudar a Cloud Speech-to-Text a selecionar o idioma correto com mais precisão. Para ter resultados melhores, especifique apenas um idioma.
Ativar o reconhecimento de idioma em solicitações de transcrição de áudio
Para especificar idiomas alternativos na transcrição de áudio,
defina o campo alternativeLanguageCodes como uma lista de
códigos de idioma nos parâmetros RecognitionConfig
da solicitação. A Cloud STT é compatível com
códigos de idiomas alternativos para todos os métodos de reconhecimento de fala:
speech:recognize,
speech:longrunningrecognize
e streaming.
Usar um arquivo local
Protocolo
Consulte o endpoint de API speech:recognize
para conferir todos os detalhes.
Para realizar o reconhecimento de fala síncrono, faça uma solicitação POST e forneça o
corpo de solicitação apropriado. Confira a seguir um exemplo de uma solicitação POST que usa
curl. O exemplo usa a CLI do Google Cloud para gerar um token
de acesso. Para saber como instalar a gcloud CLI,
consulte o guia de início rápido.
Confira no exemplo a seguir como solicitar a transcrição de um arquivo de áudio que pode incluir falas em inglês, francês ou alemão.
curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ https://speech.googleapis.com/v1p1beta1/speech:recognize \ --data '{ "config": { "encoding": "LINEAR16", "languageCode": "en-US", "alternativeLanguageCodes": ["fr-FR", "de-DE"], "model": "command_and_search" }, "audio": { "uri": "gs://cloud-samples-tests/speech/commercial_mono.wav" } }' > multi-language.txt
Quando a solicitação é bem-sucedida, o servidor retorna um código de status HTTP 200 OK e a resposta no formato JSON, salvos em um arquivo chamado multi-language.txt.
{
"results": [
{
"alternatives": [
{
"transcript": "hi I'd like to buy a Chromecast I'm ..."
"confidence": 0.9466864
}
],
"languageCode": "en-us"
},
{
"alternatives": [
{
"transcript": " let's go with the black one",
"confidence": 0.9829583
}
],
"languageCode": "en-us"
},
]
}
Java
Para saber como instalar e usar a biblioteca de cliente da Cloud STT, consulte Bibliotecas de cliente da Cloud STT. Saiba mais na documentação de referência da API Cloud STT para Java.
Para se autenticar na Cloud STT, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Node.js
Para saber como instalar e usar a biblioteca de cliente da Cloud STT, consulte Bibliotecas de cliente da Cloud STT. Saiba mais na documentação de referência da API Cloud STT para Node.js.
Para se autenticar na Cloud STT, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para saber como instalar e usar a biblioteca de cliente da Cloud STT, consulte Bibliotecas de cliente da Cloud STT. Saiba mais na documentação de referência da API Cloud STT para Python.
Para se autenticar na Cloud STT, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Usar um arquivo remoto
Java
Para saber como instalar e usar a biblioteca de cliente da Cloud STT, consulte Bibliotecas de cliente da Cloud STT. Saiba mais na documentação de referência da API Cloud STT para Java.
Para se autenticar na Cloud STT, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Node.js
Para saber como instalar e usar a biblioteca de cliente da Cloud STT, consulte Bibliotecas de cliente da Cloud STT. Saiba mais na documentação de referência da API Cloud STT para Node.js.
Para se autenticar na Cloud STT, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para saber como instalar e usar a biblioteca de cliente da Cloud STT, consulte Bibliotecas de cliente da Cloud STT. Saiba mais na documentação de referência da API Cloud STT para Python.
Para se autenticar na Cloud STT, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.