La API de Cloud Speech-to-Text V2 ofrece el diseño de Google Cloud API más reciente para que los clientes cumplan con los requisitos normativos y de seguridad empresarial con las funciones integradas.
Estos requisitos se cumplen a través de lo siguiente:
Residencia de datos: Cloud STT V2 ofrece la amplia gama de nuestros modelos de transcripción existentes en Google Cloudregiones como Bélgica o Singapur. Esto permite la invocación de nuestros modelos de transcripción a través de un servicio completamente regionalizado.
Recursos de reconocimiento: Los reconocedores son parámetros de configuración de reconocimiento reutilizables, que pueden contener una combinación de modelo, lenguaje y funciones.
Registro: La creación y las transcripciones de recursos generan registros disponibles en la Google Cloud consola, lo que permite una mejor telemetría y depuración.
Encriptación: Cloud Speech-to-Text V2 admite claves de encriptación administradas por el cliente para todos los recursos y la transcripción por lotes.
Detección automática de audio: Cloud Speech-to-Text V2 puede detectar de forma automática la tasa de muestreo, el recuento de canales y el formato de tus archivos de audio, sin necesidad de proporcionar esa información en la configuración de la solicitud.
Migra de V1 a V2
La migración de la V1 a la V2 de la API no se realiza automáticamente. Se requieren cambios mínimos en la implementación para aprovechar el conjunto de atributos.
Migración en la API
Al igual que con Cloud STT V1, para transcribir audio, debes crear una RecognitionConfig seleccionando el idioma de tu audio y el modelo de
reconocimiento que elijas:
Python
Si es necesario, selecciona una región en la que desees usar la API de Cloud Speech-to-Text y verifica la disponibilidad del idioma y el modelo en esa región:
Python
De manera opcional, crea un recurso de reconocimiento si necesitas reutilizar una configuración de reconocimiento específica en muchas solicitudes de transcripción:
Python
Existen otras diferencias en las solicitudes y respuestas de la nueva API V2. Para obtener más detalles, consulta la documentación de referencia.
Migración en la IU
Para migrar a través de la consola de Speech Google Cloud , sigue estos pasos:
Ve a la consola de Speech Google Cloud .
Navega a la página Transcripciones.
Haz clic en Transcripción nueva y selecciona el audio en la pestaña Configuración de audio.
En la pestaña Opciones de transcripción, selecciona V2.