Vous pouvez configurer votre file d'attente Cloud Tasks à sa création ou à tout moment ultérieur. La configuration s'applique à toutes les tâches de cette file d'attente.
La configuration des files d'attente comporte trois aspects fondamentaux :
Configurer le routage au niveau de la file d'attente
La configuration du routage au niveau de la file d'attente remplace le routage défini au niveau de la tâche. Cela est utile si vous souhaitez utiliser Cloud Tasks comme tampon devant votre service cible ou si vous devez modifier le routage de toutes les tâches d'une file d'attente.
Le routage au niveau de la file d'attente s'applique aux éléments suivants :
- Tâches présentes dans la file d'attente
- Tâches ajoutées à la file d'attente après la configuration du routage au niveau de la file d'attente
Limites
Le routage au niveau de la file d'attente n'est pas compatible avec les clés de chiffrement gérées par le client (CMEK) de Cloud Key Management Service (Cloud KMS). Si CMEK est activé, vous ne pouvez pas effectuer les opérations suivantes :
- Créer des tâches dans une file d'attente avec un routage au niveau de la file d'attente
- Appliquer un routage au niveau de la file d'attente
Configurer le routage au niveau de la file d'attente pour les tâches HTTP
Vous pouvez configurer une file d'attente pour remplacer le routage au niveau de la tâche lors de la création ou de la mise à jour de la file d'attente. Pour configurer le routage au niveau de la file d'attente, définissez le
paramètre
uriOverride
de la file d'attente sur la route de votre choix.
Si vous appliquez le routage au niveau de la file d'attente en tant que mise à jour d'une file d'attente existante, mettez la file d'attente en pause avant d'appliquer les modifications et attendez une minute après avoir appliqué les modifications pour reprendre la file d'attente.
Mettez la file d'attente en pause en exécutant la commande suivante :
gcloud tasks queues pause QUEUE_ID
Remplacez
QUEUE_IDpar l'ID de votre file d'attente.Mettez à jour ou supprimez le routage au niveau de la file d'attente.
Pour mettre à jour le routage au niveau de la file d'attente, définissez le
uriOverrideparamètre sur votre route mise à jour.Pour supprimer le routage au niveau de la file d'attente à l'aide de l'API REST ou RPC :
API REST : envoyez une
patchrequête pour la file d'attente avec une charge utile vide et le paramètreupdateMaskdéfini surhttpTarget.API RPC : envoyez une requête
updateQueueRequestpour la file d'attente avec une charge utile vide et le paramètreupdate_maskdéfini surhttp_target.
L'exemple suivant utilise l'API REST pour mettre à jour l'hôte vers lequel les tâches sont routées :
curl -X PATCH -d @- -i \ -H "Authorization: Bearer ACCESS_TOKEN" \ -H "Content-Type: application/json" \ "https://cloudtasks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/queues/QUEUE_ID?updateMask=httpTarget.uriOverride" << EOF { "httpTarget": {"uriOverride":{"host":"NEW_HOST"}} } EOFRemplacez les éléments suivants :
ACCESS_TOKEN: votre jeton d'accès. Pour l'obtenir, exécutez la commande suivante dans votre terminal :gcloud auth application-default login gcloud auth application-default print-access-token
PROJECT_ID: ID de votre Google Cloud projet. Pour l'obtenir, exécutez la commande suivante dans votre terminal :gcloud config get-value project
LOCATION: emplacement de votre file d'attente.NEW_HOST: nouvel hôte vers lequel vous souhaitez que votre file d'attente soit routée.
Attendez une minute.
L'application de la nouvelle configuration peut prendre jusqu'à une minute. Attendre avant de reprendre la file d'attente permet d'éviter que les tâches ne soient distribuées avec l'ancienne configuration.
Reprenez la file d'attente en exécutant la commande suivante :
gcloud tasks queues resume QUEUE_ID
Configurer le routage au niveau de la file d'attente pour les tâches App Engine
Pour configurer le routage au niveau de la file d'attente pour les tâches App Engine, définissez le paramètre
appEngineRoutingOverride
de la file d'attente sur le service et la version App Engine de votre choix.
Configurez le routage au niveau de la file d'attente et remplacez tout routage au niveau de la tâche :
gcloud tasks queues update QUEUE_ID \ --routing-override=service:SERVICE,version:VERSION
Remplacez les éléments suivants :
QUEUE_ID: ID de la file d'attente (son nom court).SERVICE: service de nœud de calcul App Engine responsable de la gestion des tâches.VERSION: version de l'application.
Par exemple, si vous configurez un service de nœud de calcul pour gérer toutes les tâches d'une file d'attente, vous pouvez diriger le routage vers ce service et la version par défaut :
gcloud tasks queues update QUEUE_ID \ --routing-override=service:SERVICE
Vérifiez que la file d'attente a bien été configurée en exécutant la commande suivante :
gcloud tasks queues describe QUEUE_ID --location=LOCATION
Remplacez
LOCATIONpar l'emplacement de la file d'attente.La sortie devrait ressembler à ce qui suit :
appEngineRoutingOverride: host: SERVICE.PROJECT_ID.appspot.com service: SERVICE name: projects/PROJECT_ID/locations/LOCATION_ID/queues/QUEUE_ID rateLimits: maxBurstSize: 100 maxConcurrentDispatches: 1000 maxDispatchesPerSecond: 500.0 retryConfig: maxAttempts: 100 maxBackoff: 3600s maxDoublings: 16 minBackoff: 0.100s state: RUNNING
Pour supprimer le routage au niveau de la file d'attente, exécutez la commande suivante :
gcloud tasks queues update QUEUE_ID \ --clear-routing-override
Lorsque le routage au niveau de la file d'attente est supprimé, le routage au niveau de la tâche est appliqué aux tâches de la file d'attente et aux tâches ajoutées à la file d'attente à l'avenir.
Définir des limites de débit
La limite de débit détermine le taux maximal auquel les tâches peuvent être distribuées par une file d'attente, qu'il s'agisse d'une première tentative ou d'une nouvelle tentative.
Définissez le débit maximal et le nombre de tâches simultanées pouvant être distribuées par une file d'attente en exécutant la commande suivante :
gcloud tasks queues update QUEUE_ID \ --max-dispatches-per-second=DISPATCH_RATE \ --max-concurrent-dispatches=MAX_CONCURRENT_DISPATCHES
Remplacez les éléments suivants :
QUEUE_ID: ID de la file d'attente (son nom court).DISPATCH_RATE: taux de distribution. Il s'agit du taux auquel les jetons du bucket sont actualisés. Dans les conditions où le flux de tâches est relativement stable, il s'agit de la vitesse à laquelle les tâches sont envoyées.MAX_CONCURRENT_DISPATCHES: nombre maximal de tâches de la file d'attente pouvant s'exécuter simultanément.
Par exemple, si vous avez créé une file d'attente sans définir de paramètres, vous pouvez mettre à jour le nombre maximal de tâches simultanées en exécutant la commande suivante :
gcloud tasks queues update QUEUE_ID \ --max-concurrent-dispatches=MAX_CONCURRENT_DISPATCHES
Vérifiez que la file d'attente a bien été configurée en exécutant la commande suivante :
gcloud tasks queues describe QUEUE_ID --location=LOCATION
Remplacez
LOCATIONpar l'emplacement de la file d'attente.La sortie devrait ressembler à ce qui suit :
name: projects/PROJECT_ID/locations/LOCATION_ID/queues/QUEUE_ID rateLimits: maxBurstSize: 100 maxConcurrentDispatches: MAX_CONCURRENT_DISPATCHES maxDispatchesPerSecond: 500.0 retryConfig: maxAttempts: 100 maxBackoff: 3600s maxDoublings: 16 minBackoff: 0.100s state: RUNNING
Méthodes pour définir les taux de traitement des files d'attente
Vous pouvez définir les taux de traitement des files d'attente à l'aide de l'API Cloud Tasks ou en important un fichier queue.yaml. Les deux méthodes aboutissent à des files d'attente utilisant le même mécanisme sous-jacent.
Dans les deux cas, la file d'attente utilise l'algorithme de token bucket (seau à jetons) pour contrôler le taux d'exécution des tâches. Chaque file d'attente nommée possède un bucket contenant ses jetons.
Chaque fois que l'application exécute une tâche, un jeton est supprimé du bucket.
La file d'attente continue de traiter les tâches jusqu'à ce que le bucket n'ait plus de jetons. Le système remplit le bucket avec de nouveaux jetons en continu, en fonction du taux max_dispatches_per_second que vous spécifiez pour la file d'attente. Si votre file d'attente contient des tâches à traiter et que le bucket contient des jetons, le système traite simultanément autant de tâches que de jetons jusqu'à la valeur max_concurrent_dispatches que vous avez définie.
Une charge inégale peut augmenter considérablement le nombre de jetons dans le bucket, ce qui peut entraîner des utilisations intensives du traitement lorsqu'une vague de requêtes arrive. Dans ce cas, votre file d'attente peut présenter un taux de distribution réel supérieur à votre taux max_dispatches_per_second, consommant des ressources système et entrant en concurrence avec les requêtes servant les utilisateurs. Si vous utilisez des files d'attente pour gérer des taux de distribution basés sur des contrats de niveau de service relativement lents pour des services en aval, vous pouvez obtenir des erreurs telles que HTTP 429 (Trop de demandes) ou HTTP 503 (Service non disponible).
Lorsque vous utilisez une méthode impliquant l'API Cloud Tasks, vous disposez de deux champs pour définir le taux de distribution de la file d'attente :
max_dispatches_per_secondmax_concurrent_dispatches
Un troisième champ,
max_burst_size, est calculé par le système en fonction de la valeur que vous avez définie pourmax_dispatches_per_second. Pour en savoir plus, consultez les messagesRateLimits.Lorsque vous utilisez la
queue.yamlméthode, vous pouvez définir les trois éléments :max_concurrent_requests, qui équivaut àmax_concurrent_dispatchesrate, qui équivaut àmax_dispatches_per_secondbucket_size, qui équivaut àmax_burst_size
Dans la plupart des cas, l'utilisation de la méthode API Cloud Tasks et la définition de max_burst_size par le système permettent d'obtenir un taux très efficace de gestion des vagues de requêtes. Toutefois, dans certains cas, en particulier lorsque le taux souhaité est relativement lent, utilisez la méthode queue.yaml pour définir manuellement bucket_size sur une petite valeur ou définir max_concurrent_dispatches sur une petite valeur à l'aide de l'API Cloud Tasks peut vous donner plus de contrôle.
Définir les paramètres de nouvelle tentative
Si une tâche ne s'effectue pas correctement, Cloud Tasks la relance avec un intervalle exponentiel entre les tentatives en fonction des paramètres que vous avez définis. Une fois qu'une tâche a été exécutée correctement, elle est supprimée de la file d'attente. Dans tous les cas, la limite maximale de conservation des tâches s'applique également.
Spécifiez le nombre maximal de nouvelles tentatives liées aux tâches ayant échoué dans la file d'attente, définissez une limite de temps pour les nouvelles tentatives et contrôlez l'intervalle entre les tentatives en exécutant la commande suivante :
gcloud tasks queues update QUEUE_ID \ --max-attempts=MAX_ATTEMPTS \ --max-retry-duration=MAX_RETRY_DURATION \ --min-backoff=MIN_INTERVAL \ --max-backoff=MAX_INTERVAL \ --max-doublings=MAX_DOUBLINGS
Remplacez les éléments suivants :
QUEUE_ID: ID de la file d'attente (son nom court).MAX_ATTEMPTS: nombre maximal de tentatives pour une tâche, y compris la première tentative. Vous pouvez autoriser des tentatives illimitées en définissant cette option sur-1. SiMAX_ATTEMPTSest satisfait ou défini sur-1,MAX_RETRY_DURATIONest toujours appliqué.MAX_RETRY_DURATION: durée maximale de la nouvelle tentative d'une tâche ayant échoué, mesurée à partir de la première tentative. La valeur doit être une chaîne qui se termine par "s", telle que5s. Vous pouvez spécifier une durée illimitée en définissant cette option sur0. SiMAX_RETRY_DURATIONest satisfait ou défini sur0,MAX_ATTEMPTSest toujours appliqué.
MIN_INTERVAL: délai minimal d'attente entre les tentatives. La valeur doit être une chaîne qui se termine par "s", telle que5s.MAX_INTERVAL: délai maximal d'attente entre les tentatives. La valeur doit être une chaîne qui se termine par "s", telle que5s.MAX_DOUBLINGS: nombre maximal de fois où l'intervalle entre les tentatives ayant échoué est doublé avant que l'augmentation ne devienne constante. L'intervalle de nouvelle tentative d'une tâche commence àMIN_INTERVAL, puis doubleMAX_DOUBLINGSfois, augmente ensuite de manière linéaire et de nouvelles tentatives sont effectuées à l'intervalleMAX_INTERVALjusqu'à ce que le nombre maximal de tentativesMAX_ATTEMPTSsoit atteint.Par exemple, si
MIN_INTERVALest10s,MAX_INTERVALest300s, etMAX_DOUBLINGSest3, l'intervalle de nouvelle tentative double3fois, augmente de manière linéaire de 2^3 * 10s, puis de nouvelles tentatives sont effectuées à l' intervalleMAX_INTERVALjusqu'à ce que la tâche ait été tentéeMAX_ATTEMPTSfois : 10s, 20s, 40s, 80s, 160s, 240s, 300s, 300s, etc.
Pour en savoir plus sur les paramètres, consultez les
RetryConfigparamètres de la ressourceQueue.Vérifiez que la file d'attente a bien été configurée en exécutant la commande suivante :
gcloud tasks queues describe QUEUE_ID --location=LOCATION
Remplacez
LOCATIONpar l'emplacement de la file d'attente.La sortie doit contenir les paramètres de nouvelle tentative que vous avez définis.
Étape suivante
- Découvrez comment créer des tâches HTTP Target.
- Découvrez comment créer des tâches App Engine.
- Pour en savoir plus sur la gestion des files d'attente, consultez la documentation de référence de l'API RPC.
- Pour en savoir plus sur la gestion des files d'attente, consultez la documentation de référence de l'API REST dans le référence de l'API REST.