神经机器翻译 (NMT) 模型

Google 的标准神经机器翻译 (NMT) 系统是在 2016 年 11 月推出的神经网络翻译系统的基础上发展而来,并进行了多项改进。它可以实时翻译多种语言。

其模型 ID 为 general/nmt

您可以通过 Cloud Translation - 基本版 API 或 Cloud Translation - 高级版 API 访问 NMT 模型,而无需进行修改。借助 Cloud Translation - 高级版 API,您还可以自定义

无论哪种情况,您都需要有一个Google Cloud 项目,该项目已启用 Cloud Translation API,并具有能进行身份验证调用的凭据。如需使用 Python 或其他编程语言访问模型,请安装相应的 v2v3 客户端库。

在此处显示的示例中,PROJECT_ID 表示您的项目 ID,REGION_NAME 表示您要运行翻译操作的 Google Cloud 区域的技术区域名称(例如 us-central1)。请使用 ISO-639 代码来标识源语言和目标语言(如果需要)。

Cloud Translation - Basic API REST 示例

您可以使用 Cloud Translation 基本版 API 通过 REST 调用来使用 NMT 模型TranslateText。您可以将请求字段放入名为 request.json 的 JSON 文件中,如下所示:

{
  "q": ["Hello world", "My name is Jeff"],
  "target": "de"
}

Cloud Translation - Basic API 仅支持 NMT 模型,因此您无需在请求中指定模型。

然后,您可以使用 curl 命令提交请求:

!curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "x-goog-user-project: cloud-ml-translate-e2e-testing" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://translate.googleapis.com/language/translate/v2"

响应是一个 JSON 文档,如下所示:

{
  "data": {
    "translations": [
      {
        "translatedText": "Hallo Welt",
        "detectedSourceLanguage": "en"
      },
      {
        "translatedText": "Mein Name ist Jeff",
        "detectedSourceLanguage": "en"
      }
    ]
  }
}

Cloud Translation - Basic API Python 示例

以下是使用 Cloud Translation - Basic API 在 NMT 模型上调用 TranslateText 的 Python 代码示例。 由于未指定源语言,API 会尝试自动检测。

def translate_text(
  text: str | bytes | list[str] = "¡Hola amigos y amigas!",
  target_language: str = "en",
  source_language: str | None = None,
) -> dict:

  translate_client = translate_v2.Client()

  if isinstance(text, bytes):
    text = [text.decode("utf-8")]

  if isinstance(text, str):
    text = [text]

  results = translate_client.translate(
    values=text,
    target_language=target_language,
    source_language=source_language
  )

  for result in results:
    if "detectedSourceLanguage" in result:
      print(f"Detected source language: {result['detectedSourceLanguage']}")
    print(f"Input text: {result['input']}")
    print(f"Translated text: {result['translatedText']}")
    print()

  return results

translate_text()

输出如下所示:

Detected source language: es
Input text: ¡Hola amigos y amigas!
Translated text: Hello friends!

[{'translatedText': 'Hello friends!',
  'detectedSourceLanguage': 'es',
  'input': '¡Hola amigos y amigas!'}]

Cloud Translation - 高级版 API REST 示例

您可以使用 Cloud Translation 高级版 API 发出 REST 调用,以使用默认 NMT 模型TranslateText,方法是不指定模型或明确请求使用 NMT 模型。将请求字段放入名为 request.json 的 JSON 文件中,如下所示:

{
  "sourceLanguageCode": "en",
  "targetLanguageCode": "ru",
  "contents": ["Dr. Watson, come here!", "Bring me some coffee!"],
  "model": "projects/PROJECT_ID/locations/REGION_NAME/models/general/nmt"
}

然后,您可以使用 curl 命令提交请求:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "x-goog-user-project: PROJECT_ID" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://translation.googleapis.com/v3/projects/PROJECT_ID/locations/REGION_NAME:translateText"

响应是一个 JSON 文档,如下所示:

{
  "translations": [
    {
      "translatedText": "Доктор Ватсон, иди сюда!",
    },
    {
      "translatedText": "Принеси мне кофе!",
    }
  ]
}

Cloud Translation - 高级版 API Python 示例

def translate():

  response = translate_v3.TranslationServiceClient().translate_text(
      contents=["Life is short.",
                "Art is long."],
      target_language_code='fr',
      source_language_code='en',
      parent=f"projects/{project_id}/locations/us-central1",
      model=f"{parent}/models/general/nmt"
  )

  print(response)

  return response

translate()

输出是一个 JSON 文档,如下所示:

translations {
  translated_text: "La vie est courte."
  model: "projects/261347268520/locations/us-central1/models/general/nmt"
}
translations {
  translated_text: "L'art est long."
  model: "projects/261347268520/locations/us-central1/models/general/nmt"
}