אפשר לעדכן את התוקף של מטמון ההקשר. זמן התפוגה שמוגדר כברירת מחדל למטמון הקשר הוא 60 דקות אחרי זמן היצירה שלו. מטמון הקשר שפג תוקפו נמחק במהלך תהליך garbage collection, ואי אפשר להשתמש בו או לעדכן אותו. כדי לעדכן את הזמן שבו מטמון הקשר שתוקפו לא פג יפוג, צריך לעדכן את אחד מהמאפיינים הבאים שלו:
ttl– מספר השניות והננו-שניות שבהן המטמון פעיל אחרי שהוא נוצר או אחרי שהערךttlמתעדכן, לפני שתוקפו פג. כשמגדירים אתttl, ה-expireTimeשל המטמון מתעדכן.
expire_time–Timestampשמציין את התאריך והשעה המוחלטים שבהם יפוג התוקף של מטמון ההקשר.
עדכון של מטמון ההקשר באמצעות הפרמטר ttl שלו
בדוגמה הבאה מוצגת פקודת curl שמעדכנת את זמן התפוגה שלה ב-3,600 שניות.
Python
התקנה
pip install --upgrade google-genai
מידע נוסף מופיע ב מאמרי העזרה בנושא SDK.
מגדירים משתני סביבה כדי להשתמש ב-Gen AI SDK עם Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Go
מידע נוסף מופיע ב מאמרי העזרה בנושא SDK.
מגדירים משתני סביבה כדי להשתמש ב-Gen AI SDK עם Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Java
כך מתקינים או מעדכנים את Java.
מידע נוסף מופיע ב מאמרי העזרה בנושא SDK.
מגדירים משתני סביבה כדי להשתמש ב-Gen AI SDK עם Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Node.js
התקנה
npm install @google/genai
מידע נוסף מופיע ב מאמרי העזרה בנושא SDK.
מגדירים משתני סביבה כדי להשתמש ב-Gen AI SDK עם Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
REST
אפשר להשתמש ב-REST כדי ליצור או לעדכן את מטמון ההקשר באמצעות Vertex AI API לשליחת בקשת PATCH לנקודת הקצה של מודל המוציא לאור. בדוגמה הבאה מוצג אופן העדכון של תאריך התפוגה באמצעות הפרמטר ttl.
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- PROJECT_ID: מזהה הפרויקט.
- LOCATION: האזור שבו הבקשה ליצירת מטמון ההקשר עובדה.
- CACHE_ID: המזהה של מטמון ההקשר. מזהה מטמון ההקשר מוחזר כשיוצרים את מטמון ההקשר. אפשר גם למצוא מזהים של מטמון הקשר על ידי הצגת רשימת מטמון ההקשר של פרויקט Google Cloud . מידע נוסף זמין במאמרים בנושא יצירת מטמון הקשר ורשימת מטמוני הקשר.
- SECONDS:
floatשמציין את רכיב השניות של משך הזמן עד שתוקף המטמון יפוג. - NANOSECONDS:
floatשמציין את רכיב הננו-שניות של משך הזמן לפני שהמטמון יפוג.
ה-method של ה-HTTP וכתובת ה-URL:
PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID
גוף בקשת JSON:
{
"seconds":"SECONDS",
"nanos":"NANOSECONDS"
}
כדי לשלוח את הבקשה עליכם לבחור אחת מהאפשרויות הבאות:
curl
שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID"
PowerShell
שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID" | Select-Object -Expand Content
אתם אמורים לקבל תגובת JSON שדומה לזו:
דוגמה לפקודת curl
PROJECT_ID="PROJECT_ID"
LOCATION="us-central1"
CACHE_ID="CACHE_ID"
curl \
-X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json"\
"https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/cachedContents/${CACHE_ID}" -d \
'{
"ttl": {"seconds":"3600","nanos":"0"}
}'
עדכון של מטמון ההקשר באמצעות הפרמטר expire_time שלו
בדוגמה הבאה מוצגת פקודת curl שמשתמשת בפרמטר expire_time כדי לעדכן את זמן התפוגה ל-9:00 בבוקר ב-30 ביוני 2024.
REST
אפשר להשתמש ב-REST כדי ליצור או לעדכן את מטמון ההקשר באמצעות Vertex AI API לשליחת בקשת PATCH לנקודת הקצה של מודל המוציא לאור. בדוגמה הבאה מוצג אופן העדכון של תאריך התפוגה באמצעות הפרמטר expire_time.
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- PROJECT_ID: .
- LOCATION: האזור שבו הבקשה ליצירת מטמון ההקשר עובדה.
- CACHE_ID: המזהה של מטמון ההקשר. המזהה מופיע בתגובה כשיוצרים את מטמון ההקשר.
- EXPIRE_TIME:
Timestampשמציין את הזמן שבו יפוג תוקף מטמון ההקשר.
ה-method של ה-HTTP וכתובת ה-URL:
PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID
גוף בקשת JSON:
{
"expire_time":"EXPIRE_TIME"
}
כדי לשלוח את הבקשה עליכם לבחור אחת מהאפשרויות הבאות:
curl
שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID"
PowerShell
שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID" | Select-Object -Expand Content
אתם אמורים לקבל תגובת JSON שדומה לזו:
דוגמה לפקודת curl
PROJECT_ID="PROJECT_ID"
LOCATION="us-central1"
CACHE_ID="CACHE_ID"
curl \
-X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json"\
"https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/cachedContents/${CACHE_ID}" -d \
'{
"expire_time":"2024-06-30T09:00:00.000000Z"
}'