神经机器翻译 (NMT) 模型
Google 的标准神经机器翻译 (NMT) 系统是在 2016 年 11 月推出的神经网络翻译系统的基础上发展而来,并进行了多项改进。它可以实时翻译多种语言。
其模型 ID 为 general/nmt。
您可以通过 Cloud Translation - 基本版 API 或 Cloud Translation - 高级版 API 访问 NMT 模型,而无需进行修改。借助 Cloud Translation - 高级版 API,您还可以自定义。
无论哪种情况,您都需要有一个Google Cloud 项目,该项目已启用 Cloud Translation API,并具有能进行身份验证调用的凭据。如需使用 Python 或其他编程语言访问模型,请安装相应的 v2 或 v3 客户端库。
在此处显示的示例中,PROJECT_ID 表示您的项目 ID,REGION_NAME 表示您要运行翻译操作的 Google Cloud 区域的技术区域名称(例如 us-central1)。请使用 ISO-639 代码来标识源语言和目标语言(如果需要)。
Cloud Translation - Basic API REST 示例
您可以使用 Cloud Translation 基本版 API 通过 REST 调用来使用 NMT 模型TranslateText。您可以将请求字段放入名为 request.json 的 JSON 文件中,如下所示:
{
"q": ["Hello world", "My name is Jeff"],
"target": "de"
}
Cloud Translation - Basic API 仅支持 NMT 模型,因此您无需在请求中指定模型。
然后,您可以使用 curl 命令提交请求:
!curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "x-goog-user-project: cloud-ml-translate-e2e-testing" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://translate.googleapis.com/language/translate/v2"
响应是一个 JSON 文档,如下所示:
{
"data": {
"translations": [
{
"translatedText": "Hallo Welt",
"detectedSourceLanguage": "en"
},
{
"translatedText": "Mein Name ist Jeff",
"detectedSourceLanguage": "en"
}
]
}
}
Cloud Translation - Basic API Python 示例
以下是使用 Cloud Translation - Basic API 在 NMT 模型上调用 TranslateText 的 Python 代码示例。
由于未指定源语言,API 会尝试自动检测。
def translate_text(
text: str | bytes | list[str] = "¡Hola amigos y amigas!",
target_language: str = "en",
source_language: str | None = None,
) -> dict:
translate_client = translate_v2.Client()
if isinstance(text, bytes):
text = [text.decode("utf-8")]
if isinstance(text, str):
text = [text]
results = translate_client.translate(
values=text,
target_language=target_language,
source_language=source_language
)
for result in results:
if "detectedSourceLanguage" in result:
print(f"Detected source language: {result['detectedSourceLanguage']}")
print(f"Input text: {result['input']}")
print(f"Translated text: {result['translatedText']}")
print()
return results
translate_text()
输出如下所示:
Detected source language: es
Input text: ¡Hola amigos y amigas!
Translated text: Hello friends!
[{'translatedText': 'Hello friends!',
'detectedSourceLanguage': 'es',
'input': '¡Hola amigos y amigas!'}]
Cloud Translation - 高级版 API REST 示例
您可以使用 Cloud Translation 高级版 API 发出 REST 调用,以使用默认 NMT 模型TranslateText,方法是不指定模型或明确请求使用 NMT 模型。将请求字段放入名为 request.json 的 JSON 文件中,如下所示:
{
"sourceLanguageCode": "en",
"targetLanguageCode": "ru",
"contents": ["Dr. Watson, come here!", "Bring me some coffee!"],
"model": "projects/PROJECT_ID/locations/REGION_NAME/models/general/nmt"
}
然后,您可以使用 curl 命令提交请求:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "x-goog-user-project: PROJECT_ID" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://translation.googleapis.com/v3/projects/PROJECT_ID/locations/REGION_NAME:translateText"
响应是一个 JSON 文档,如下所示:
{
"translations": [
{
"translatedText": "Доктор Ватсон, иди сюда!",
},
{
"translatedText": "Принеси мне кофе!",
}
]
}
Cloud Translation - 高级版 API Python 示例
def translate():
response = translate_v3.TranslationServiceClient().translate_text(
contents=["Life is short.",
"Art is long."],
target_language_code='fr',
source_language_code='en',
parent=f"projects/{project_id}/locations/us-central1",
model=f"{parent}/models/general/nmt"
)
print(response)
return response
translate()
输出是一个 JSON 文档,如下所示:
translations {
translated_text: "La vie est courte."
model: "projects/261347268520/locations/us-central1/models/general/nmt"
}
translations {
translated_text: "L'art est long."
model: "projects/261347268520/locations/us-central1/models/general/nmt"
}