Questo tutorial mostra come trascrivere l'audio registrato da un telefono utilizzando Cloud Speech-to-Text.
I file audio possono provenire da molte fonti diverse. I dati audio possono provenire da un telefono (ad esempio, la segreteria telefonica) o da una colonna sonora inclusa in un file video.
Cloud STT può utilizzare uno dei diversi modelli di machine learning per trascrivere il file audio in modo da corrispondere al meglio all'origine dell'audio. Puoi ottenere risultati migliori dalla trascrizione vocale specificando la sorgente dell'audio originale. In questo modo, Cloud STT può elaborare i file audio utilizzando un modello di machine learning addestrato per dati simili a quelli del file audio.
Obiettivi
- Invia una richiesta di trascrizione audio per l'audio registrato da un telefono (ad esempio la segreteria) a Cloud STT.
- Specifica un modello di riconoscimento vocale avanzato per una richiesta di trascrizione audio.
Costi
Questo tutorial utilizza i componenti fatturabili di Cloud Platform, tra cui:
- Cloud Speech-to-Text
Utilizza il Calcolatore prezzi per generare una stima
dei costi in base all'utilizzo previsto.
Prima di iniziare
Questo tutorial prevede diversi prerequisiti:
- Hai configurato un progetto Cloud Speech-to-Text nella console Google Cloud .
- Hai configurato il tuo ambiente utilizzando le credenziali predefinite dell'applicazione nella console Google Cloud .
- Hai configurato l'ambiente di sviluppo per il linguaggio di programmazione che hai scelto.
- Hai installato la libreria client di Google Cloud per il linguaggio di programmazione scelto.
Inviare una richiesta
Per trascrivere al meglio l'audio acquisito su uno smartphone, ad esempio una chiamata o
un messaggio vocale, puoi impostare il campo model nel payload
RecognitionConfig su
phone_call. Il campo model indica all'API Cloud Speech-to-Text quale modello di riconoscimento vocale utilizzare per la richiesta di trascrizione.
Puoi migliorare i risultati della trascrizione dell'audio telefonico utilizzando
un modello avanzato. Per utilizzare un modello
migliorato, imposta il campo useEnhanced su true nel payload
RecognitionConfig.
I seguenti esempi di codice mostrano come selezionare un modello di trascrizione specifico quando chiami Cloud STT.
Protocollo
Per informazioni dettagliate, consulta l'endpoint API speech:recognize.
Per eseguire il riconoscimento vocale sincrono, effettua una richiesta POST e fornisci il corpo della richiesta appropriato. Di seguito è riportato un esempio di richiesta POST mediante curl. L'esempio utilizza Google Cloud CLI per generare un token di accesso. Per istruzioni sull'installazione di gcloud CLI,
consulta la guida rapida.
curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ https://speech.googleapis.com/v1/speech:recognize \ --data '{ "config": { "encoding": "LINEAR16", "languageCode": "en-US", "enableWordTimeOffsets": false, "enableAutomaticPunctuation": true, "model": "phone_call", "useEnhanced": true }, "audio": { "uri": "gs://cloud-samples-tests/speech/commercial_mono.wav" } }'
Consulta la documentazione di riferimento di RecognitionConfig per saperne di più sulla configurazione del corpo della richiesta.
Se la richiesta riesce, il server restituisce un codice di stato HTTP 200 OK e la risposta in formato JSON:
{ "results": [ { "alternatives": [ { "transcript": "Hi, I'd like to buy a Chromecast. I was wondering whether you could help me with that.", "confidence": 0.8930228 } ], "resultEndTime": "5.640s" }, { "alternatives": [ { "transcript": " Certainly, which color would you like? We are blue black and red.", "confidence": 0.9101991 } ], "resultEndTime": "10.220s" }, { "alternatives": [ { "transcript": " Let's go with the black one.", "confidence": 0.8818244 } ], "resultEndTime": "13.870s" }, { "alternatives": [ { "transcript": " Would you like the new Chromecast Ultra model or the regular Chromecast?", "confidence": 0.94733626 } ], "resultEndTime": "18.460s" }, { "alternatives": [ { "transcript": " Regular Chromecast is fine. Thank you. Okay. Sure. Would you like to ship it regular or Express?", "confidence": 0.9519095 } ], "resultEndTime": "25.930s" }, { "alternatives": [ { "transcript": " Express, please.", "confidence": 0.9101229 } ], "resultEndTime": "28.260s" }, { "alternatives": [ { "transcript": " Terrific. It's on the way. Thank you. Thank you very much. Bye.", "confidence": 0.9321616 } ], "resultEndTime": "34.150s" } ] }
Go
Per scoprire come installare e utilizzare la libreria client per Cloud STT, consulta la sezione Librerie client Cloud STT. Per saperne di più, consulta la documentazione di riferimento dell'API Cloud STT Go.
Per eseguire l'autenticazione in Cloud STT, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Cloud STT, consulta la sezione Librerie client Cloud STT. Per saperne di più, consulta la documentazione di riferimento dell'API Cloud STT Java.
Per eseguire l'autenticazione in Cloud STT, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Cloud STT, consulta la sezione Librerie client Cloud STT. Per saperne di più, consulta la documentazione di riferimento dell'API Cloud STT Node.js.
Per eseguire l'autenticazione in Cloud STT, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Cloud STT, consulta la sezione Librerie client Cloud STT. Per saperne di più, consulta la documentazione di riferimento dell'API Cloud STT Python.
Per eseguire l'autenticazione in Cloud STT, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Linguaggi aggiuntivi
C#: segui le istruzioni di configurazione di C# nella pagina delle librerie client, poi consulta la documentazione di riferimento di Cloud STT per .NET.
PHP: segui le istruzioni di configurazione di PHP nella pagina delle librerie client, poi consulta la documentazione di riferimento di Cloud STT per PHP.
Ruby: segui le istruzioni di configurazione di Ruby nella pagina delle librerie client, poi consulta la documentazione di riferimento di Cloud STT per Ruby.
Esegui la pulizia
Per evitare che al tuo Account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, elimina il progetto che contiene le risorse oppure mantieni il progetto ed elimina le singole risorse.
Elimina il progetto
Il modo più semplice per eliminare la fatturazione è eliminare il progetto creato per il tutorial.
Per eliminare il progetto:
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Elimina le istanze
Per eliminare un'istanza Compute Engine:
- In the Google Cloud console, go to the VM instances page.
- Select the checkbox for the instance that you want to delete.
- To delete the instance, click More actions, click Delete, and then follow the instructions.
Elimina le regole firewall per la rete predefinita
Per eliminare una regola firewall:
- In the Google Cloud console, go to the Firewall page.
- Select the checkbox for the firewall rule that you want to delete.
- To delete the firewall rule, click Delete.