Modelo de tradução automática neural (NMT)

A tradução automática neural (TAN) padrão da Google evoluiu a partir do sistema de tradução de redes neurais que a Google introduziu em novembro de 2016, com muitas melhorias. Pode traduzir para e a partir de muitos idiomas em tempo real.

O ID do modelo é general/nmt.

Pode aceder ao modelo NMT sem modificação através da API Cloud Translation - Basic ou da API Cloud Translation - Advanced. Com a API Cloud Translation – Advanced, também pode personalizá-la.

Em qualquer dos casos, tem de ter um Google Cloud projeto com a API Cloud Translation ativada e credenciais para fazer chamadas autenticadas. Para aceder ao modelo através do Python ou de outra linguagem de programação, instale a biblioteca cliente v2 ou v3 adequada.

Nos exemplos apresentados aqui, PROJECT_ID representa o ID do seu projeto e REGION_NAME representa o nome técnico da região Google Cloud onde quer executar a operação de tradução (como us-central1). Use códigos ISO-639 para identificar os idiomas de origem e de destino, quando necessário.

Exemplo de REST da API Cloud Translation - Basic

Pode fazer uma chamada REST com a API Cloud Translation - Basic para TranslateText através do modelo NMT. Pode colocar os campos de pedido num ficheiro JSON com um nome como request.json, da seguinte forma:

{
  "q": ["Hello world", "My name is Jeff"],
  "target": "de"
}

A API Cloud Translation - Basic só suporta o modelo NMT, por isso, não precisa de especificar o modelo no pedido.

Em seguida, pode usar um comando curl para enviar o pedido:

!curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "x-goog-user-project: cloud-ml-translate-e2e-testing" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://translate.googleapis.com/language/translate/v2"

A resposta é um documento JSON com o seguinte aspeto:

{
  "data": {
    "translations": [
      {
        "translatedText": "Hallo Welt",
        "detectedSourceLanguage": "en"
      },
      {
        "translatedText": "Mein Name ist Jeff",
        "detectedSourceLanguage": "en"
      }
    ]
  }
}

Exemplo do Python da API Cloud Translation - Basic

Segue-se um exemplo de código Python para chamar TranslateText no modelo NMT através da API Cloud Translation - Basic. Como não é especificado nenhum idioma de origem, a API tenta detetá-lo automaticamente.

def translate_text(
  text: str | bytes | list[str] = "¡Hola amigos y amigas!",
  target_language: str = "en",
  source_language: str | None = None,
) -> dict:

  translate_client = translate_v2.Client()

  if isinstance(text, bytes):
    text = [text.decode("utf-8")]

  if isinstance(text, str):
    text = [text]

  results = translate_client.translate(
    values=text,
    target_language=target_language,
    source_language=source_language
  )

  for result in results:
    if "detectedSourceLanguage" in result:
      print(f"Detected source language: {result['detectedSourceLanguage']}")
    print(f"Input text: {result['input']}")
    print(f"Translated text: {result['translatedText']}")
    print()

  return results

translate_text()

O resultado é o seguinte:

Detected source language: es
Input text: ¡Hola amigos y amigas!
Translated text: Hello friends!

[{'translatedText': 'Hello friends!',
  'detectedSourceLanguage': 'es',
  'input': '¡Hola amigos y amigas!'}]

Cloud Translation - Advanced API REST example

Pode fazer uma chamada REST com a Cloud Translation - Advanced API para TranslateText usando o modelo NMT predefinido, não especificando um modelo ou pedindo explicitamente o modelo NMT. Coloque os campos de pedido num ficheiro JSON com um nome como request.json, da seguinte forma:

{
  "sourceLanguageCode": "en",
  "targetLanguageCode": "ru",
  "contents": ["Dr. Watson, come here!", "Bring me some coffee!"],
  "model": "projects/PROJECT_ID/locations/REGION_NAME/models/general/nmt"
}

Em seguida, pode usar um comando curl para enviar o pedido:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "x-goog-user-project: PROJECT_ID" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://translation.googleapis.com/v3/projects/PROJECT_ID/locations/REGION_NAME:translateText"

A resposta é um documento JSON com o seguinte aspeto:

{
  "translations": [
    {
      "translatedText": "Доктор Ватсон, иди сюда!",
    },
    {
      "translatedText": "Принеси мне кофе!",
    }
  ]
}

Exemplo de Python da API Cloud Translation – Advanced

def translate():

  response = translate_v3.TranslationServiceClient().translate_text(
      contents=["Life is short.",
                "Art is long."],
      target_language_code='fr',
      source_language_code='en',
      parent=f"projects/{project_id}/locations/us-central1",
      model=f"{parent}/models/general/nmt"
  )

  print(response)

  return response

translate()

O resultado é um documento JSON com o seguinte aspeto:

translations {
  translated_text: "La vie est courte."
  model: "projects/261347268520/locations/us-central1/models/general/nmt"
}
translations {
  translated_text: "L'art est long."
  model: "projects/261347268520/locations/us-central1/models/general/nmt"
}