Modèle LLM de traduction (TLLM)

Le dernier modèle de traduction de pointe de Google, TLLM, est un LLM optimisé par LoRA qui offre la meilleure qualité de traduction disponible. Il obtient des scores MetricX et COMET nettement meilleurs sur les charges de travail difficiles que les autres modèles de traduction. Il est compatible avec la personnalisation et la traduction adaptative, qui est plus légère.

Son ID de modèle est general/translation-llm.

Pour accéder au modèle TLLM, vous devez disposer d'un Google Cloud projet pour lequel l'API Cloud Translation – Advanced est activée, avec des identifiants permettant d'effectuer des appels authentifiés. Pour accéder au modèle à l'aide de Python ou d'un autre langage de programmation, installez la bibliothèque cliente v3 appropriée .

Dans les exemples présentés ici, PROJECT_ID représente l'ID de votre projet et REGION_NAME représente le nom technique de la région Google Cloud dans laquelle vous souhaitez exécuter l'opération de traduction (par exemple, us-central1). Utilisez les codes ISO-639 pour identifier les langues source et cible, le cas échéant.

Exemple REST de traduction de texte

Vous pouvez utiliser l'API REST pour appeler TranslateText sur le modèle TLLM. Vous pouvez placer les champs de requête dans un fichier JSON nommé, par exemple, request.json :

{
  "contents": ["This is text that I would like to have translated.",
               "It can include up to 1024 strings."],
  "mimeType": "text/plain",
  "sourceLanguageCode": "en"
  "targetLanguageCode": "it",
  "model": "projects/PROJECT_ID/locations/REGION_NAME/models/general/translation-llm"
}

Vous pouvez ensuite utiliser une commande curl pour envoyer la requête :

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "x-goog-user-project: PROJECT_ID" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://translation.googleapis.com/v3/projects/PROJECT_ID:translateText"

La réponse est un document JSON qui ressemble à ceci :

{
  "translations": [
    {
      "translatedText": "Este es el texto que me gustaría traducir.",
      "model": "projects/PROJECT_ID/locations/REGION_NAME/models/general/translation-llm"
    },
    {
      "translatedText": "Puede incluir hasta 1024 cadenas.",
      "model": "projects/PROJECT_ID/locations/REGION_NAME/models/general/translation-llm"
    }
  ]
}

Exemple Python de traduction de texte

Voici un exemple de code Python pour appeler TranslateText avec le modèle TLLM :

from google.cloud import translate_v3

def translate():

  response = translate_v3.TranslationServiceClient().translate_text(
      contents=["Life is short.",
                  "Art is long."],
      target_language_code='fr',
      source_language_code='en',
      parent=f"projects/PROJECT_ID/locations/REGION_NAME",
      model=f"projects/PROJECT_ID/locations/REGION_NAME/models/general/translation-llm"
  )

  print(response)

  return response

translate()

La réponse se présente sous la forme d'objets JSON :

translations {
  translated_text: "La vie est courte."
  model: "projects/261347268520/locations/us-central1/models/general/translation-llm"
}
translations {
  translated_text: "L'art est long."
  model: "projects/261347268520/locations/us-central1/models/general/translation-llm"
}

translations {
  translated_text: "La vie est courte."
  model: "projects/261347268520/locations/us-central1/models/general/translation-llm"
}
translations {
  translated_text: "L'art est long."
  model: "projects/261347268520/locations/us-central1/models/general/translation-llm"