Esta página se ha traducido con Cloud Translation API.

Ejecutar una traducción por lotes con el conector de Cloud Translation

En este tutorial se muestra cómo crear un flujo de trabajo que utilice el conector de la API Cloud Translation para traducir archivos a otros idiomas en modo de lote asíncrono. De esta forma, se obtienen resultados en tiempo real a medida que se procesan las entradas.

Objetivos

En este tutorial, aprenderás a hacer lo siguiente:

Crea un segmento de Cloud Storage de entrada.
Crea dos archivos en inglés y súbelos al segmento de entrada.
Crea un flujo de trabajo que use el conector de la API Cloud Translation para traducir los dos archivos al francés y al español, y guarda los resultados en un bucket de salida.
Implementa y ejecuta el flujo de trabajo para orquestar todo el proceso.

Costes

En este documento, se utilizan los siguientes componentes facturables de Google Cloud:

Para generar una estimación de costes basada en el uso previsto, utiliza la calculadora de precios.

Los usuarios nuevos pueden disfrutar de una prueba gratuita. Google Cloud

Antes de empezar

Es posible que las restricciones de seguridad definidas por tu organización te impidan completar los pasos que se indican a continuación. Para obtener información sobre cómo solucionar problemas, consulta el artículo Desarrollar aplicaciones en un entorno limitado Google Cloud .

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

Install the Google Cloud CLI.

Si utilizas un proveedor de identidades (IdP) externo, primero debes iniciar sesión en la CLI de gcloud con tu identidad federada.

Para inicializar gcloud CLI, ejecuta el siguiente comando:

gcloud init

Create or select a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Create a Google Cloud project:
```
gcloud projects create PROJECT_ID
```
Replace PROJECT_ID with a name for the Google Cloud project you are creating.
Select the Google Cloud project that you created:
```
gcloud config set project PROJECT_ID
```
Replace PROJECT_ID with your Google Cloud project name.

Verify that billing is enabled for your Google Cloud project.

Enable the Cloud Storage, Translation, and Workflows APIs:

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

gcloud services enable storage.googleapis.com translate.googleapis.com workflows.googleapis.com

Install the Google Cloud CLI.

Si utilizas un proveedor de identidades (IdP) externo, primero debes iniciar sesión en la CLI de gcloud con tu identidad federada.

Para inicializar gcloud CLI, ejecuta el siguiente comando:

gcloud init

Create or select a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Create a Google Cloud project:
```
gcloud projects create PROJECT_ID
```
Replace PROJECT_ID with a name for the Google Cloud project you are creating.
Select the Google Cloud project that you created:
```
gcloud config set project PROJECT_ID
```
Replace PROJECT_ID with your Google Cloud project name.

Verify that billing is enabled for your Google Cloud project.

Enable the Cloud Storage, Translation, and Workflows APIs:

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

gcloud services enable storage.googleapis.com translate.googleapis.com workflows.googleapis.com

Actualiza los componentes de gcloud:
```
gcloud components update
```

Inicia sesión con tu cuenta:
```
gcloud auth login
```
Define la ubicación predeterminada que se usará en este tutorial:
```
gcloud config set workflows/location us-central1
```
Como en este tutorial se usa el modelo predeterminado de AutoML Translation, que se encuentra en us-central1, debes definir la ubicación como us-central1.

Si utilizas un modelo o una glosario de AutoML Translation que no sea el predeterminado, asegúrate de que se encuentre en la misma ubicación que la llamada al conector. De lo contrario, se devolverá un error INVALID_ARGUMENT (400). Para obtener más información, consulta el método batchTranslateText.

Crear un segmento y archivos de Cloud Storage de entrada

Puedes usar Cloud Storage para almacenar objetos. Los objetos son fragmentos de datos inmutables que constan de un archivo en cualquier formato y se almacenan en contenedores llamados cubos.

Crea un segmento de Cloud Storage para almacenar los archivos que quieras traducir:

BUCKET_INPUT=${GOOGLE_CLOUD_PROJECT}-input-files
gcloud storage buckets create gs://${BUCKET_INPUT}

Crea dos archivos en inglés y súbelos al segmento de entrada:

echo "Hello World!" > file1.txt
gcloud storage cp file1.txt gs://${BUCKET_INPUT}
echo "Workflows connectors simplify calling services." > file2.txt
gcloud storage cp file2.txt gs://${BUCKET_INPUT}

Desplegar y ejecutar el flujo de trabajo

Un flujo de trabajo se compone de una serie de pasos descritos mediante la sintaxis de Workflows, que se puede escribir en formato YAML o JSON. Esta es la definición del flujo de trabajo. Después de crear un flujo de trabajo, debes implementarlo para que esté disponible para su ejecución.

Crea un archivo de texto con el nombre workflow.yaml y el siguiente contenido:

main:
  steps:
  - init:
      assign:
      - projectId: ${sys.get_env("GOOGLE_CLOUD_PROJECT_ID")}
      - location: ${sys.get_env("GOOGLE_CLOUD_LOCATION")}
      - inputBucketName: ${projectId + "-input-files"}
      - outputBucketName: ${projectId + "-output-files-" + string(int(sys.now()))}
  - createOutputBucket:
        call: googleapis.storage.v1.buckets.insert
        args:
          project: ${projectId}
          body:
            name: ${outputBucketName}
  - batchTranslateText:
      call: googleapis.translate.v3beta1.projects.locations.batchTranslateText
      args:
          parent: ${"projects/" + projectId + "/locations/" + location}
          body:
              inputConfigs:
                gcsSource:
                  inputUri: ${"gs://" + inputBucketName + "/*"}
              outputConfig:
                  gcsDestination:
                    outputUriPrefix: ${"gs://" + outputBucketName + "/"}
              sourceLanguageCode: "en"
              targetLanguageCodes: ["es", "fr"]
      result: batchTranslateTextResult

El flujo de trabajo asigna variables, crea un segmento de salida e inicia la traducción de los archivos, guardando los resultados en el segmento de salida.

Después de crear el flujo de trabajo, despliégalo:

gcloud workflows deploy batch-translation --source=workflow.yaml

Ejecuta el flujo de trabajo:

gcloud workflows execute batch-translation

Para ver el estado del flujo de trabajo, puedes ejecutar el comando devuelto. Por ejemplo:
```
gcloud workflows executions describe eb4a6239-cffa-4672-81d8-d4caef7d8424 /
  --workflow batch-translation /
  --location us-central1
```
El flujo de trabajo debe ser ACTIVE. Al cabo de unos minutos, los archivos traducidos (en francés y español) se suben al contenedor de salida.

Lista de objetos del segmento de salida

Para confirmar que el flujo de trabajo ha funcionado correctamente, enumera los objetos de tu segmento de salida.

Recupera el nombre del segmento de salida:
```
gcloud storage ls
```
El resultado debería ser similar al siguiente:
```
gs://PROJECT_ID-input-files/
gs://PROJECT_ID-output-files-TIMESTAMP/
```
Lista los objetos del segmento de salida:
```
gcloud storage ls gs://PROJECT_ID-output-files-TIMESTAMP/** --recursive
```
Al cabo de unos minutos, se mostrarán los archivos traducidos (dos de cada uno en francés y español).

Limpieza

Si has creado un proyecto para este tutorial, elimínalo. Si has usado un proyecto y quieres conservarlo sin los cambios que has añadido en este tutorial, elimina los recursos creados para el tutorial.

Eliminar el proyecto

La forma más fácil de evitar que te cobren es eliminar el proyecto que has creado para el tutorial.

Para ello, sigue las instrucciones que aparecen a continuación:

Precaución: Eliminar un proyecto tiene los siguientes efectos:

Se elimina todo el contenido del proyecto. Si has usado un proyecto que ya existía para las tareas de este documento, cuando lo elimines, también se eliminará cualquier otro trabajo que hayas realizado en él.
Se pierden los IDs de proyecto personalizados. Cuando creaste este proyecto, es posible que hayas creado un ID de proyecto personalizado que quieras usar en el futuro. Para conservar las URLs que usan el ID del proyecto, como una URL appspot.com, elimina los recursos seleccionados dentro del proyecto en lugar de eliminar todo el proyecto.

Si tienes previsto consultar varias arquitecturas, tutoriales o guías de inicio rápido, reutilizar los proyectos puede ayudarte a no superar los límites de cuota de proyectos.

In the Google Cloud console, go to the Manage resources page.
Go to Manage resources
In the project list, select the project that you want to delete, and then click Delete.
In the dialog, type the project ID, and then click Shut down to delete the project.

Eliminar recursos del tutorial

Elimina la configuración predeterminada de gcloud que has añadido durante la configuración del tutorial:
```
gcloud config unset workflows/location
```
Elimina el flujo de trabajo que has creado en este tutorial:
```
gcloud workflows delete WORKFLOW_NAME
```
Elimina un segmento y los objetos que hayas creado en este tutorial:
```
gcloud storage rm gs://BUCKET_NAME --recursive
```
Donde BUCKET_NAME es el nombre del segmento que quieres eliminar. Por ejemplo, my-bucket.

La respuesta es similar a la siguiente:
```
Removing gs://my-bucket/...
```
Nota: Si tienes que eliminar un gran número de objetos de tus cubos, no utilices la CLI de gcloud, ya que la operación tarda mucho en completarse. En su lugar, usa la consola Google Cloud o la gestión del ciclo de vida de los objetos.

Siguientes pasos

Para obtener más información sobre Workflows, consulta el artículo Conoce Workflows.
Para obtener más información sobre la sintaxis de Workflows, consulta la referencia de sintaxis de Workflows.
Para obtener más información sobre los conectores de Workflows, consulta Información sobre los conectores.

Ejecutar una traducción por lotes con el conector de Cloud Translation Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.

Objetivos

Costes

Antes de empezar

Crear un segmento y archivos de Cloud Storage de entrada

Desplegar y ejecutar el flujo de trabajo

Lista de objetos del segmento de salida

Limpieza

Eliminar el proyecto

Eliminar recursos del tutorial

Siguientes pasos

Ejecutar una traducción por lotes con el conector de Cloud Translation