Vous pouvez effectuer une mise à jour à l'expiration d'un cache de contexte. Le délai d'expiration par défaut d'un cache de contexte est de 60 minutes après sa création. Un cache de contexte expiré est supprimé lors d'un processus de récupération de mémoire et ne peut pas être utilisé ni mis à jour. Pour modifier la date d'expiration d'un cache de contexte non expiré, modifiez l'une des propriétés suivantes :
ttl
: nombre de secondes et de nanosecondes pendant lequel le cache est actif après sa création ou après la mise à jour dettl
avant son expiration. Lorsque vous définissezttl
, le paramètreexpireTime
du cache est mis à jour.expire_time
:Timestamp
qui spécifie la date et l'heure absolues d'expiration du cache de contexte.
Mettre à jour le cache de contexte à l'aide de son paramètre ttl
Voici un exemple de commande curl qui met à jour son délai d'expiration de 3 600 secondes.
Python
Installer
pip install --upgrade google-genai
Pour en savoir plus, consultez la documentation de référence du SDK.
Définissez des variables d'environnement pour utiliser le SDK Gen AI avec Vertex AI :
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Go
Découvrez comment installer ou mettre à jour le Go.
Pour en savoir plus, lisez la documentation de référence du SDK.
Définissez des variables d'environnement pour utiliser le SDK Gen AI avec Vertex AI :
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Java
Découvrez comment installer ou mettre à jour le Java.
Pour en savoir plus, lisez la documentation de référence du SDK.
Définissez des variables d'environnement pour utiliser le SDK Gen AI avec Vertex AI :
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Node.js
Installer
npm install @google/genai
Pour en savoir plus, consultez la documentation de référence du SDK.
Définissez des variables d'environnement pour utiliser le SDK Gen AI avec Vertex AI :
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
REST
Vous pouvez utiliser REST pour créer une mise à jour du cache de contexte à l'aide de l'API Vertex AI pour envoyer une requête PATCH au point de terminaison du modèle d'éditeur. L'exemple suivant montre comment mettre à jour la date d'expiration à l'aide du paramètre ttl
.
Avant d'utiliser les données de requête ci-dessous, effectuez les remplacements suivants :
- PROJECT_ID : ID de votre projet.
- LOCATION : région dans laquelle la requête de création de cache de contexte a été traitée.
- CACHE_ID : ID du cache de contexte. L'ID du cache de contexte est renvoyé lorsque vous créez le cache de contexte. Vous pouvez également trouver les ID de cache de contexte en listant les caches de contexte d'un projet Google Cloud . Pour en savoir plus, consultez les sections Créer un cache de contexte et Répertorier les caches de contexte.
- SECONDS :
float
qui spécifie le composant en secondes de la durée avant l'expiration du cache. - NANOSECONDS :
float
qui spécifie le composant en nanosecondes de la durée avant l'expiration du cache.
Méthode HTTP et URL :
PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID
Corps JSON de la requête :
{ "seconds":"SECONDS", "nanos":"NANOSECONDS" }
Pour envoyer votre requête, choisissez l'une des options suivantes :
curl
Enregistrez le corps de la requête dans un fichier nommé request.json
, puis exécutez la commande suivante :
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID"
PowerShell
Enregistrez le corps de la requête dans un fichier nommé request.json
, puis exécutez la commande suivante :
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID" | Select-Object -Expand Content
Vous devriez recevoir une réponse JSON de ce type :
Exemple de commande curl
PROJECT_ID="PROJECT_ID"
LOCATION="us-central1"
CACHE_ID="CACHE_ID"
curl \
-X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json"\
"https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/cachedContents/${CACHE_ID}" -d \
'{
"ttl": {"seconds":"3600","nanos":"0"}
}'
Mettre à jour le cache de contexte à l'aide de son paramètre expire_time
Voici un exemple de commande curl qui utilise le paramètre expire_time
pour mettre à jour son heure d'expiration au 30 juin 2024 à 9h.
REST
Vous pouvez utiliser REST pour créer une mise à jour du cache de contexte à l'aide de l'API Vertex AI pour envoyer une requête PATCH au point de terminaison du modèle d'éditeur. L'exemple suivant montre comment mettre à jour la date d'expiration à l'aide du paramètre expire_time
.
Avant d'utiliser les données de requête, effectuez les remplacements suivants :
- PROJECT_ID : .
- LOCATION : région dans laquelle la requête de création de cache de contexte a été traitée.
- CACHE_ID : ID du cache de contexte. L'ID se trouve dans la réponse lorsque vous créez le cache de contexte.
- EXPIRE_TIME :
Timestamp
qui spécifie l'heure d'expiration du cache de contexte.
Méthode HTTP et URL :
PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID
Corps JSON de la requête :
{ "expire_time":"EXPIRE_TIME" }
Pour envoyer votre requête, choisissez l'une des options suivantes :
curl
Enregistrez le corps de la requête dans un fichier nommé request.json
, puis exécutez la commande suivante :
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID"
PowerShell
Enregistrez le corps de la requête dans un fichier nommé request.json
, puis exécutez la commande suivante :
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID" | Select-Object -Expand Content
Vous devriez recevoir une réponse JSON de ce type :
Exemple de commande curl
PROJECT_ID="PROJECT_ID"
LOCATION="us-central1"
CACHE_ID="CACHE_ID"
curl \
-X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json"\
"https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/cachedContents/${CACHE_ID}" -d \
'{
"expire_time":"2024-06-30T09:00:00.000000Z"
}'
Étape suivante
- Découvrez comment utiliser un cache de contexte.
- Découvrez comment obtenir des informations sur tous les caches de contexte associés à un projet Google Cloud .