Translation LLM (TLLM)

Das aktuelle hochmoderne Übersetzungsmodell von Google, TLLM, ist ein LoRA-optimiertes LLM, das die höchste verfügbare Übersetzungsqualität bietet. Das Modell erzielt bei schwierigen Arbeitslasten deutlich bessere MetricX- und COMET-Werte als andere Übersetzungsmodelle. Es unterstützt sowohl die Anpassung als auch die einfachere Adaptive Translation.

Die Modell-ID lautet general/translation-llm.

Für den Zugriff auf das TLLM-Modell benötigen Sie ein Google Cloud -Projekt, für das die Cloud Translation Advanced API aktiviert ist, sowie Anmeldedaten für authentifizierte Aufrufe. Wenn Sie mit Python oder einer anderen Programmiersprache auf das Modell zugreifen möchten, installieren Sie die entsprechende Clientbibliothek der Version 3 .

In den hier gezeigten Beispielen steht PROJECT_ID für Ihre Projekt-ID und REGION_NAME für den technischen Namen der Google Cloud Region, in der Sie den Übersetzungsvorgang ausführen möchten (z. B. us-central1). Verwenden Sie bei Bedarf ISO-639-Codes, um die Quell- und Zielsprachen anzugeben.

REST-Beispiel für die Textübersetzung

Sie können die REST API verwenden, um TranslateText für das TLLM-Modell aufzurufen. Sie können Anfragefelder in eine JSON-Datei einfügen, z. B. request.json:

{
  "contents": ["This is text that I would like to have translated.",
               "It can include up to 1024 strings."],
  "mimeType": "text/plain",
  "sourceLanguageCode": "en"
  "targetLanguageCode": "it",
  "model": "projects/PROJECT_ID/locations/REGION_NAME/models/general/translation-llm"
}

Anschließend können Sie die Anfrage mit einem curl-Befehl senden:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "x-goog-user-project: PROJECT_ID" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://translation.googleapis.com/v3/projects/PROJECT_ID:translateText"

Die Antwort ist ein JSON-Dokument, das so aussieht:

{
  "translations": [
    {
      "translatedText": "Este es el texto que me gustaría traducir.",
      "model": "projects/PROJECT_ID/locations/REGION_NAME/models/general/translation-llm"
    },
    {
      "translatedText": "Puede incluir hasta 1024 cadenas.",
      "model": "projects/PROJECT_ID/locations/REGION_NAME/models/general/translation-llm"
    }
  ]
}

Python-Beispiel für die Textübersetzung

Hier ist ein Beispiel für Python-Code zum Aufrufen von TranslateText mit dem TLLM-Modell:

from google.cloud import translate_v3

def translate():

  response = translate_v3.TranslationServiceClient().translate_text(
      contents=["Life is short.",
                  "Art is long."],
      target_language_code='fr',
      source_language_code='en',
      parent=f"projects/PROJECT_ID/locations/REGION_NAME",
      model=f"projects/PROJECT_ID/locations/REGION_NAME/models/general/translation-llm"
  )

  print(response)

  return response

translate()

Die Antwort erfolgt in Form von JSON-Objekten:

translations {
  translated_text: "La vie est courte."
  model: "projects/261347268520/locations/us-central1/models/general/translation-llm"
}
translations {
  translated_text: "L'art est long."
  model: "projects/261347268520/locations/us-central1/models/general/translation-llm"
}

translations {
  translated_text: "La vie est courte."
  model: "projects/261347268520/locations/us-central1/models/general/translation-llm"
}
translations {
  translated_text: "L'art est long."
  model: "projects/261347268520/locations/us-central1/models/general/translation-llm"