Optimiser les requêtes

Ce document explique comment utiliser l'optimiseur de requêtes Vertex AI pour maximiser automatiquement les performances d'un ensemble de requêtes en améliorant les instructions système.

L'optimiseur de requêtes Vertex AI peut vous aider à améliorer rapidement vos requêtes à grande échelle, sans avoir à réécrire manuellement les instructions système ni les requêtes individuelles. Cela est particulièrement utile lorsque vous souhaitez réutiliser dans un modèle les instructions système et les requêtes que vous avez écrites pour un autre modèle.

Nous proposons deux approches pour optimiser les requêtes :

  • L'optimiseur zero-shot est un optimiseur à faible latence en temps réel qui améliore un seul modèle de prompt ou d'instruction système. Il est rapide et ne nécessite aucune configuration supplémentaire, si ce n'est de fournir votre requête ou instruction système d'origine. L'optimiseur zero-shot est indépendant du modèle et peut améliorer les requêtes pour n'importe quel modèleGoogle . Il fournit également un mode gemini_nano pour optimiser spécifiquement les requêtes pour les modèles sur l'appareil, tels que Gemini Nano et Gemma 3n E4B.
  • L'optimiseur basé sur les données est un optimiseur itératif au niveau des tâches par lot qui améliore les requêtes en évaluant la réponse du modèle à des exemples de requêtes libellées par rapport à des métriques d'évaluation spécifiées pour le modèle cible sélectionné. Il s'agit d'une optimisation plus avancée qui vous permet de configurer les paramètres d'optimisation et de fournir quelques exemples étiquetés. De plus, l'optimiseur basé sur les données est compatible avec l'optimisation des modèles Gemini généralement disponibles et des modèles personnalisés déployés localement ou depuis Vertex AI Model Garden.

Ces méthodes sont disponibles pour les utilisateurs dans l'interface utilisateur (UI) ou le SDK Vertex AI.

Étapes suivantes