Trascrivere il parlato in testo utilizzando le librerie client
Questa pagina mostra come inviare una richiesta di riconoscimento vocale a Cloud Speech-to-Text nel tuo linguaggio di programmazione preferito utilizzando le Google Cloud librerie client.
Cloud Speech-to-Text consente di integrare facilmente le tecnologie di riconoscimento vocale di Google nelle applicazioni degli sviluppatori. Puoi inviare dati audio all'API Cloud Speech-to-Text, che restituisce una trascrizione di testo del file audio. Per ulteriori informazioni sul servizio, consulta Nozioni di base su Cloud STT.
Prima di iniziare
Prima di poter inviare una richiesta all'API Cloud Speech-to-Text, devi aver completato le seguenti azioni. Per informazioni dettagliate, consulta la pagina Prima di iniziare.
- Abilita Cloud Speech-to-Text in un Google Cloud progetto.
- Assicurati che la fatturazione sia abilitata per Cloud Speech-to-Text.
-
Installa Google Cloud CLI. Dopo l'installazione, inizializza Google Cloud CLI eseguendo il comando seguente:
gcloud initSe utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.
-
Se utilizzi una shell locale, crea le credenziali di autenticazione locali per il tuo account utente:
gcloud auth application-default login
Non devi eseguire questa operazione se utilizzi Cloud Shell.
Se viene restituito un errore di autenticazione e utilizzi un provider di identità (IdP) esterno, verifica di aver acceduto a gcloud CLI con la tua identità federata.
- Verifica di disporre delle autorizzazioni necessarie per completare questa guida. Se hai creato un nuovo progetto per questa guida, allora disponi già delle autorizzazioni necessarie.
- (Facoltativo) Crea un nuovo bucket Cloud Storage per archiviare i dati audio.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per trascrivere il parlato in testo, chiedi all'amministratore di concederti il ruolo IAM Consumer di Service Usage (roles/serviceusage.serviceUsageConsumer) nel tuo progetto.
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Installa la libreria client
Go
go get cloud.google.com/go/speech/apiv1
Java
Se utilizzi Maven, aggiungi
quanto segue al file pom.xml. Per ulteriori informazioni sulle
BOM, consulta La BOM delle librerie di Google Cloud Platform.
Se utilizzi Gradle, aggiungi quanto segue alle dipendenze:
Se utilizzi sbt, aggiungi quanto segue alle dipendenze:
Se utilizzi Visual Studio Code o IntelliJ, puoi aggiungere librerie client al tuo progetto utilizzando i seguenti plug-in IDE:
I plug-in forniscono funzionalità aggiuntive, come la gestione delle chiavi per gli account di servizio. Per informazioni dettagliate, consulta la documentazione di ogni plug-in.
Node.js
Prima di installare la libreria, assicurati di aver preparato l'ambiente per lo sviluppo Node.js.
npm install @google-cloud/speech
Python
Prima di installare la libreria, assicurati di aver preparato l'ambiente per lo sviluppo Python.
pip install --upgrade google-cloud-speech
Esecuzione di una richiesta di trascrizione audio
Ora puoi utilizzare Cloud STT per trascrivere un file audio in testo. Utilizza il seguente codice per inviare una
recognize richiesta all'API Cloud Speech-to-Text.
Go
Java
Node.js
Prima di eseguire l'esempio, assicurati di aver preparato l'ambiente per lo sviluppo Node.js.
Python
Prima di eseguire l'esempio, assicurati di aver preparato l'ambiente per lo sviluppo Python.
Complimenti! Hai inviato la tua prima richiesta a Cloud STT.
Se ricevi un errore o una risposta vuota da Cloud STT, consulta i passaggi per la risoluzione dei problemi e la mitigazione degli errori.
Libera spazio
Per evitare che al tuo Google Cloud account vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi.
- Utilizzaper eliminare il progetto se non ti serve. Google Cloud console
Passaggi successivi
- Esercitati a trascrivere file audio corti.
- Scopri come elaborare in batch file audio lunghi per il riconoscimento vocale.
- Scopri come trascrivere l'audio in streaming, ad esempio da un microfono.
- Inizia a utilizzare Cloud STT nella lingua di tua scelta utilizzando una libreria client di Cloud STT.
- Consulta le applicazioni di esempio.
- Per prestazioni, accuratezza e altri suggerimenti ottimali, consulta la documentazione sulle best practice.