ניתן לעדכן מתי פג תוקף של מטמון הקשר. זמן התפוגה המוגדר כברירת מחדל של מטמון הקשר הוא 60 דקות לאחר זמן יצירתו. מטמון הקשר שפג תוקפו נמחק במהלך תהליך איסוף אשפה ולא ניתן להשתמש בו או לעדכן אותו. כדי לעדכן את הזמן שבו מטמון הקשר שטרם פג תוקפו, עדכן אחת מהתכונות הבאות שלו:
ttl– מספר השניות והננו-שניות שהמטמון פעיל אחרי שהוא נוצר או אחרי שהערךttlמתעדכן, לפני שהוא פג. כשמגדירים אתttl, ה-expireTimeשל המטמון מתעדכן.
expire_time–Timestampשמציין את התאריך והשעה המוחלטים שבהם יפוג התוקף של מטמון ההקשר.
עדכון מטמון ההקשר באמצעות הפרמטר ttl שלו
בדוגמה הבאה מוצגת פקודת curl שמעדכנת את זמן התפוגה שלה ב-3,600 שניות.
Python
התקנה
pip install --upgrade google-genai
מידע נוסף מופיע ב מאמרי העזרה בנושא SDK.
מגדירים משתני סביבה כדי להשתמש ב-Gen AI SDK עם Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_ENTERPRISE=True
Go
מידע נוסף מופיע ב מאמרי העזרה בנושא SDK.
מגדירים משתני סביבה כדי להשתמש ב-Gen AI SDK עם Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_ENTERPRISE=True
Java
כך מתקינים או מעדכנים את Java.
מידע נוסף מופיע ב מאמרי העזרה בנושא SDK.
מגדירים משתני סביבה כדי להשתמש ב-Gen AI SDK עם Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_ENTERPRISE=True
Node.js
התקנה
npm install @google/genai
מידע נוסף מופיע ב מאמרי העזרה בנושא SDK.
מגדירים משתני סביבה כדי להשתמש ב-Gen AI SDK עם Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_ENTERPRISE=True
REST
אפשר להשתמש ב-REST כדי לעדכן את מטמון ההקשר באמצעות Agent Platform API, כדי לשלוח בקשת PATCH לנקודת הקצה של מודל המוציא לאור. בדוגמה הבאה מוצג אופן העדכון של תאריך התפוגה באמצעות הפרמטר ttl.
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- PROJECT_ID: [מזהה הפרויקט](/resource-manager/docs/creating-managing-projects#identifiers). .
- LOCATION: האזור שבו הבקשה ליצירת מטמון ההקשר עובדה.
- CACHE_ID: המזהה של מטמון ההקשר. מזהה מטמון ההקשר מוחזר כשיוצרים את מטמון ההקשר. אפשר גם למצוא מזהים של מטמון הקשר על ידי הצגת רשימת מטמון ההקשר של פרויקט Google Cloud . מידע נוסף זמין במאמרים בנושא יצירת מטמון הקשר ורשימת מטמוני הקשר.
- SECONDS:
floatשמציין את רכיב השניות של משך הזמן עד שתוקף המטמון יפוג. - NANOSECONDS:
floatשמציין את רכיב הננו-שניות של משך הזמן לפני שהמטמון יפוג.
ה-method של ה-HTTP וכתובת ה-URL:
PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID
גוף בקשת JSON:
{
"seconds":"SECONDS",
"nanos":"NANOSECONDS"
}
כדי לשלוח את הבקשה עליכם לבחור אחת מהאפשרויות הבאות:
curl
שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID"
PowerShell
שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID" | Select-Object -Expand Content
אתם אמורים לקבל תגובת JSON שדומה לזו:
פקודת curl לדוגמה
PROJECT_ID="PROJECT_ID"
LOCATION="us-central1"
CACHE_ID="CACHE_ID"
curl \
-X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json"\
"https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/cachedContents/${CACHE_ID}" -d \
'{
"ttl": {"seconds":"3600","nanos":"0"}
}'
עדכון מטמון ההקשר באמצעות הפרמטר expire_time שלו
בדוגמה הבאה מוצגת פקודת curl שמשתמשת בפרמטר expire_time כדי לעדכן את זמן התפוגה שלה לשעה 9:00 בבוקר ב-30 ביוני 2024.
REST
אפשר להשתמש ב-REST כדי לעדכן את מטמון ההקשר באמצעות Agent Platform API, כדי לשלוח בקשת PATCH לנקודת הקצה של מודל המוציא לאור. בדוגמה הבאה מוצג אופן העדכון של תאריך התפוגה באמצעות הפרמטר expire_time.
לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- PROJECT_ID: .
- LOCATION: האזור שבו הבקשה ליצירת מטמון ההקשר עובדה.
- CACHE_ID: המזהה של מטמון ההקשר. המזהה מופיע בתגובה כשיוצרים את מטמון ההקשר.
- EXPIRE_TIME:
Timestampשמציין את הזמן שבו יפוג תוקף המטמון של ההקשר.
ה-method של ה-HTTP וכתובת ה-URL:
PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID
גוף בקשת JSON:
{
"expire_time":"EXPIRE_TIME"
}
כדי לשלוח את הבקשה עליכם לבחור אחת מהאפשרויות הבאות:
curl
שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID"
PowerShell
שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID" | Select-Object -Expand Content
אתם אמורים לקבל תגובת JSON שדומה לזו:
פקודת curl לדוגמה
PROJECT_ID="PROJECT_ID"
LOCATION="us-central1"
CACHE_ID="CACHE_ID"
curl \
-X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json"\
"https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/cachedContents/${CACHE_ID}" -d \
'{
"expire_time":"2024-06-30T09:00:00.000000Z"
}'