Optimiser les requêtes

Ce document explique comment utiliser l'optimiseur de requêtes Vertex AI pour maximiser automatiquement les performances d'un ensemble de requêtes en améliorant les instructions système.

L'optimiseur de requêtes Vertex AI peut vous aider à améliorer rapidement vos requêtes à grande échelle, sans avoir à réécrire manuellement les instructions système ni les requêtes individuelles. Cela est utile lorsque vous passez d'un modèle à un autre et que vous souhaitez réutiliser les instructions système et les requêtes.

Les approches suivantes sont disponibles pour optimiser les requêtes :

  • L'optimiseur zero-shot est un optimiseur à faible latence en temps réel qui améliore un seul modèle de prompt ou d'instruction système. Il est rapide et ne nécessite aucune configuration supplémentaire, si ce n'est de fournir votre requête ou instruction système d'origine. L'optimiseur zero-shot est indépendant du modèle et peut améliorer les requêtes pour n'importe quel modèleGoogle . Il fournit également un mode gemini_nano pour optimiser spécifiquement les requêtes pour les modèles plus petits, tels que Gemini Nano et Gemma 3n E4B.
  • L'optimiseur few-shot est un optimiseur en temps réel à faible latence qui affine les instructions système en analysant les exemples où la réponse d'un modèle n'a pas répondu aux attentes. En fournissant des exemples spécifiques de requêtes, de réponses du modèle et de commentaires sur ces réponses, vous pouvez améliorer systématiquement les performances des requêtes.
  • L'optimiseur basé sur les données est un optimiseur itératif au niveau des tâches par lot qui améliore les requêtes en évaluant la réponse du modèle à des exemples de requêtes libellées par rapport à des métriques d'évaluation spécifiées pour le modèle cible sélectionné. Il s'agit d'une optimisation plus avancée qui vous permet de configurer les paramètres d'optimisation et de fournir quelques exemples étiquetés. L'optimiseur basé sur les données est également compatible avec l'optimisation des modèles Gemini disponibles dans le commerce, tels que Gemini Nano et Gemma 3n E4B, ainsi qu'avec les modèles personnalisés déployés localement ou à partir de Vertex AI Model Garden.

Ces méthodes sont disponibles pour les utilisateurs via la console Google Cloud ou le SDK Vertex AI.

Étapes suivantes