Modèles Google

Les modèles Google sur Vertex AI offrent des modèles sans serveur et entièrement gérés en tant qu'API. Pour utiliser un modèle Google sur Vertex AI, envoyez une requête directement au point de terminaison de l'API Vertex AI. Étant donné que les modèles Google utilisent une API gérée, il n'est pas nécessaire de provisionner ni de gérer l'infrastructure.

Vous pouvez diffuser vos réponses en flux continu pour réduire la perception de la latence côté utilisateur. Une réponse en flux continu utilise des événements envoyés par le serveur (SSE) pour diffuser la réponse de manière incrémentielle.

Gemma 4 26B A4B IT

Gemma 4 26B A4B IT est un modèle multimodal de Google qui traite les entrées de texte et d'image, et génère des sorties de texte.

Accéder à la fiche de modèle Gemma 4 26B A4B IT

Utiliser des modèles Google

Pour les modèles gérés, vous pouvez utiliser des commandes curl pour envoyer des requêtes au point de terminaison Vertex AI à l'aide des noms de modèles suivants :

  • Pour Gemma 4 26B A4B IT, utilisez gemma-4-26b-a4b-it-maas.

Pour savoir comment effectuer des appels en streaming et non en streaming aux modèles Google, consultez Appeler des API de modèles ouverts.

Pour utiliser un modèle Vertex AI auto-déployé :

  1. Accédez à la console Model Garden.
  2. Trouvez le modèle Vertex AI approprié.
  3. Cliquez sur Activer et remplissez le formulaire fourni pour obtenir les licences d'utilisation commerciale nécessaires.

Pour en savoir plus sur le déploiement et l'utilisation des modèles partenaires, consultez Déployer un modèle partenaire et envoyer des requêtes de prédiction .

Disponibilité des modèles Google par région

Les modèles Google sont disponibles dans les régions suivantes :

Modèle Régions
Gemma 4 26B A4B IT
  • global
    • Sortie maximale : 128 000
    • Longueur du contexte : 262 144

Étapes suivantes

Découvrez comment appeler des API de modèles ouverts.