Agent Runtime אוסף ומעבד באופן אוטומטי מדדים תפעוליים של סוכנים שנפרסו. אתם יכולים להשתמש במדדים האלה כדי להבין את הביצועים והתקינות של הנציגים בלי שתצטרכו לבצע הגדרה ידנית.
במאמר הזה מוסבר איך לעקוב אחרי סוכנים ב-Agent Runtime באמצעות צפייה במדדים מובנים, יצירת מדדים מותאמים אישית והגדרת התראות במסוףGoogle Cloud . לצורך מעקב מתקדם, אפשר גם לשלוח שאילתות על מדדים באמצעות PromQL או Cloud Monitoring API.
סקירה כללית
אתם יכולים להשתמש ב-Agent Runtime באמצעות Cloud Monitoring בלי לבצע הגדרה נוספת. מדדי הסוכן המובנים נאספים באופן אוטומטי ומוצגים בדפים של Cloud Monitoring במסוףGoogle Cloud .
מדדים מובנים נתמכים
המדדים הבאים של הסוכן נתמכים ומשויכים למשאב המנוטר של Agent Runtime aiplatform.googleapis.com/ReasoningEngine:
- מספר הבקשות
- זמני האחזור של הבקשות
- זמן הקצאת מעבד (CPU) לקונטיינר
- זמן הקצאת הזיכרון של הקונטיינר
מידע נוסף על סוגי מדדים, יחידות, תוויות, זמן אחזור ותקופת דגימה זמין ברשימה המלאה של מדדי AI Platform.
הצגת מדדים של סוכן
אפשר לראות את המדדים המובנים של הסוכן במסוף Google Cloud באמצעות Metrics Explorer:
כדי לקבל הרשאה לצפייה במדדים ב-Metrics Explorer, צריך לבקש מהאדמין להקצות לכם את התפקיד Monitoring Viewer (
roles/monitoring.viewer) בפרויקט.נכנסים אל Metrics Explorer במסוף Google Cloud :
בוחרים את הפרויקט Google Cloud .
לוחצים על בחירת מדד כדי לפתוח את סרגל החיפוש.
בסרגל החיפוש, מזינים Gemini Enterprise Agent Platform Reasoning Engine ולוחצים על Gemini Enterprise Agent Platform Reasoning Engine.
לוחצים על קטגוריית המדדים Reasoning_engine ואז על מדד, כמו Request count.
אופציונלי: מגדירים מסנני תוויות נוספים, רכיב צבירה ומשנים את טווח הזמן.
כברירת מחדל, התרשימים ב-Metrics Explorer עבור המדד Request count מתאימים את נקודות הנתונים למרווח זמן שמוגדר כברירת מחדל, ומשרטטים את נקודות הנתונים כבקשות לשנייה (מדד קצב).
בסוכנים שמבוססים על הערכה לפיתוח סוכנים (ADK), אפשר גם לראות מדדים של הסוכן ב Google Cloud מסוף באמצעות מרכז הבקרה של זמן הריצה של הסוכן.
מדדי שאילתות של סוכן
אפשר גם לשלוח שאילתות למדדים באמצעות Prometheus Query Language (PromQL) או Cloud Monitoring v3 API. PromQL מציע יותר אפשרויות לסינון, לצבירה ולשינוי של מדדים, ואילו Cloud Monitoring API מאפשר לכם להציג ולשאול שאילתות לגבי כל נקודות הנתונים הגולמיות באופן פרוגרמטי.
שליחת שאילתות על מדדים באמצעות PromQL
אפשר להשתמש ב-PromQL כדי ליישר ולצבור נקודות נתונים עם מרווח זמן מותאם אישית, ולשרטט נקודות נתונים שעברו טרנספורמציה כמספר הבקשות המוחלט (במקום בקשות לשנייה). בדוגמה הבאה מסננים את הנתונים לפי מזהה מופע של Agent
Engine (RESOURCE_ID) וקוד תגובה (RESPONSE_CODE):
sum_over_time(
increase(
aiplatform_googleapis_com:reasoning_engine_request_count{
monitored_resource='aiplatform.googleapis.com/ReasoningEngine',
reasoning_engine_id='RESOURCE_ID',
response_code='RESPONSE_CODE'
}
[10m]
)
[10m:10m]
)
אפשר לחשב את שיעור השגיאות על ידי חישוב היחס בין הבקשות שמסומנות עם קודי תגובה מסוימים של שגיאות (כמו 500) לבין המספר הכולל של הבקשות (אחוז הבקשות שנכשלו):
sum_over_time(
sum(
rate(
aiplatform_googleapis_com:reasoning_engine_request_count{
monitored_resource='aiplatform.googleapis.com/ReasoningEngine',
reasoning_engine_id='RESOURCE_ID',
response_code='500'
}
[10m]
)
)
[10m:10m]
)
/
sum_over_time(
sum(
rate(
aiplatform_googleapis_com:reasoning_engine_request_count{
monitored_resource='aiplatform.googleapis.com/ReasoningEngine',
reasoning_engine_id='RESOURCE_ID',
}
[10m]
)
)
[10m:10m]
)
מידע על שיטות מומלצות והגבלות לגבי מדדי יחס זמין במאמר מידע על יחסי מדדים. דוגמה להגדרת התראה למדד שיעור השגיאות מופיעה במאמר דוגמאות למדיניות ב-JSON.
שליחת שאילתות על מדדים באמצעות Cloud Monitoring API
אפשר להשתמש ב-Cloud Monitoring API כדי:
קבלת ההגדרה של המשאב המפוקח Agent Runtime
רשימת ההגדרות הזמינות של מדדי סוכנים
שאילתת נתונים של פעולות על ציר הזמן עבור
request_count
כל המדדים של Agent Platform משויכים למשאב במעקב של Agent Platform
aiplatform.googleapis.com/ReasoningEngine.
אפשר להפעיל את ממשקי ה-API האלה באמצעות APIs Explorer, ספריות לקוח ספציפיות לשפה או שורת פקודה. במסמכי התיעוד מוסבר איך לקרוא מדדים באמצעות הכלי APIs Explorer וספריות לקוח. בדוגמאות הבאות מוצג שימוש בשורת הפקודה, ובאופן ספציפי בכלי curl.
קבלת ההגדרה של המשאב במעקב של Agent Platform
הפקודה הבאה מאחזרת את ההגדרה של המשאב במעקב באמצעות projects.monitoredResourceDescriptors, וגם את כל התוויות הזמינות שאפשר להשתמש בהן לסינון:
gcurl https://monitoring.googleapis.com/v3/projects/PROJECT_ID/monitoredResourceDescriptors/aiplatform.googleapis.com/ReasoningEngine
התוויות צריכות לכלול את resource_container, location ו-reasoning_engine_id.
רשימת ההגדרות הזמינות של מדדי סוכנים
הפקודה הבאה משתמשת ב-projects.metricDescriptors כדי לאחזר את כל המדדים ומסנני התוויות של Agent Platform:
gcurl https://monitoring.googleapis.com/v3/projects/PROJECT_ID/metricDescriptors?filter='metric.type=starts_with("aiplatform.googleapis.com/reasoning_engine")'התוצאה צריכה לכלול את ההגדרה של המדדים הבאים, וגם את התוויות הספציפיות שלהם:
aiplatform.googleapis.com/reasoning_engine/request_countaiplatform.googleapis.com/reasoning_engine/request_latenciesaiplatform.googleapis.com/reasoning_engine/cpu/allocation_timeaiplatform.googleapis.com/reasoning_engine/memory/allocation_time
שאילתת נתונים של פעולות על ציר הזמן עבור request_count
אפשר להשתמש ב-projects.timeSeries.list יחד עם פרמטרים כמו interval, filter ו-aggregation כדי לשלוח שאילתות לגבי נתונים של סדרות זמן.
בדוגמה הבאה מוצגת שאילתה של נקודות נתונים גולמיות של מדד request_count עבור מופע ספציפי של סוכן במהלך חלון זמן ספציפי:
gcurl https://monitoring.googleapis.com/v3/projects/PROJECT_ID/timeSeries?filter='metric.type="aiplatform.googleapis.com/reasoning_engine/request_count"%20AND%20resource.labels.reasoning_engine_id="RESOURCE_ID"&interval.endTime=2025-03-26T11:00:0.0-08:00&interval.startTime=2025-03-26T10:00:0.0-08:00'
מחליפים את מה שכתוב בשדות הבאים:
- PROJECT_ID: מזהה הפרויקט ב- Google Cloud .
- RESOURCE_ID: מזהה המופע של Agent Platform. זה לא תמיד נדרש. אתם יכולים להריץ שאילתות בכמה מופעים של Agent Platform באותו פרויקט.
-
interval.startTimeו-interval.endTime: ההתחלה (כולל) והסוף (לא כולל) של פרק הזמן, בפורמט RFC 3339. לדוגמה,"2025-03-26T11:22:33Z"לזמן אוניברסלי מתואם (UTC) ו-"2025-03-26T11:22:33-08:00"לשעון החוף המערבי של ארה"ב (PST). הגדרה מלאה ודוגמאות נוספות זמינות ב-RFC 3339.
אמורים לקבל תגובה שדומה לזו:
{
"timeSeries": [
{
"metric": {
"labels": {
"response_code": "200",
"response_code_class": "2xx"
},
"type": "aiplatform.googleapis.com/reasoning_engine/request_count"
},
"resource": {
"type": "aiplatform.googleapis.com/ReasoningEngine",
"labels": {
"reasoning_engine_id": "RESOURCE_ID",
"location": "LOCATION",
"project_id": "PROJECT_ID"
}
},
"metricKind": "DELTA",
"valueType": "INT64",
"points": [
{
"interval": {
"startTime": "2025-03-26T18:55:27.001Z",
"endTime": "2025-03-26T18:56:27Z"
},
"value": {
"int64Value": "25"
}
},
{
"interval": {
"startTime": "2025-03-26T18:54:27.001Z",
"endTime": "2025-03-26T18:55:27Z"
},
"value": {
"int64Value": "36"
}
}
// ... more data points ...
]
}
// ... potentially more time series with other response codes ...
],
"unit": "1"
}
לפרטים נוספים על פורמט התגובה, ראו projects.timeSeries.list.
יצירת מדדים מותאמים אישית לסוכן
אם מדדי הסוכן המובנים לא מתאימים לתרחיש השימוש הספציפי שלכם, אתם יכולים להגדיר מדדים מותאמים אישית. אפשר ליצור מדדים מותאמים אישית בדרכים הבאות:
מדדים מבוססי-יומן: אפשר לעקוב אחרי מגמות ודפוסים בכמות גדולה של רשומות ביומן.
מדדים שהוגדרו על ידי המשתמש: מדדים שלא הוגדרו על ידי Google Cloud, כמו נתונים ספציפיים לאפליקציה או נתוני מערכת בצד הלקוח.
מדדים מבוססי-יומנים
השלבים הבאים מדגימים איך ליצור מדד מבוסס-יומן (tool_calling_count) ולהשתמש בו בתהליך עבודה לדוגמה, שבו כמה סוכנים מפעילים כמה כלים, ואתם רוצים לספור את הפעלות הכלים:
מציינים את הכלי כדי שתירשם רשומה ביומן בכל פעם שמפעילים אותו. לדוגמה,
"tool-\<tool-id\> invoked by agent-\<agent-id\>".כדי ליצור מדד חדש מבוסס-יומן מסוג מונה דרך מסוף Google Cloud :
נכנסים לדף Log-based Metrics במסוף Google Cloud :
בקטע מדדים בהגדרת המשתמש, לוחצים על יצירת מדד. החלונית Create log-based metric מופיעה.
בקטע סוג המדד, בוחרים באפשרות מונה.
בקטע פרטים, מזינים את שם המדד מבוסס היומן. לדוגמה,
tool_calling_count. אפשר גם להזין תיאור ויחידות.בקטע Filter selection (בחירת מסנן), מבצעים את הפעולות הבאות:
בתפריט הנפתח Select project or log bucket, בוחרים באפשרות Project logs.
בשדה Build filter, מזינים את מסנן היומן באמצעות שפת השאילתות של רישום ביומן. לדוגמה:
resource.type="aiplatform.googleapis.com/ReasoningEngine" resource.labels.reasoning_engine_id="RESOURCE_ID" textPayload =~ "tool-\d+ invoked by agent-\d+" -- assuming both tool and agent IDs are numeric
בקטע Labels (תוויות), מוסיפים שתי תוויות חדשות בלחיצה על הלחצן Add label (הוספת תווית).
כדי להוסיף את התווית הראשונה, מבצעים את הפעולות הבאות:
בשדה שם התווית, מזינים
tool.בשדה שם השדה מזינים
textPayload.בשדה Regular expression (ביטוי רגולרי), מזינים
(tool-\d+) invoked by agent-\d+.
לתווית השנייה, מבצעים את הפעולות הבאות:
בשדה שם התווית, מזינים
agent.בשדה שם השדה מזינים
textPayload.בשדה Regular expression (ביטוי רגולרי), מזינים
tool-\d+ invoked by (agent-\d+).
- לוחצים על סיום.
לוחצים על יצירת מדד.
כדי לראות את המדד
tool_calling_countואת היומנים שמשויכים אליו, מבצעים את הפעולות הבאות במסוף Google Cloud :נכנסים לדף Metrics Explorer במסוף Google Cloud :
לוחצים על בחירת מדד כדי לפתוח את סרגל החיפוש.
בסרגל החיפוש, מזינים Gemini Enterprise Agent Platform Reasoning Engine ולוחצים על Gemini Enterprise Agent Platform Reasoning Engine.
לוחצים על קטגוריית המדדים מדדים שמבוססים על יומנים, ואז על Logging/user/tool_calling_count. אם צריך, משנים את טווח הזמן.
(אופציונלי) מסננים לפי התוויות
toolו-agent.כדי לקבל את המספר הכולל של הקריאות לפונקציה של כלי ספציפי לכל הסוכנים, מגדירים את תווית המסנן
toolעם הערך של מזהה הכלי הזה.כדי לקבל את המספר הכולל של הפעלות של סוכן ספציפי לכל הכלים, צריך להגדיר את תווית המסנן
agentעם הערך של מזהה הסוכן הזה.
אפשר גם להגדיר את Sum By ל-
toolאו ל-agentכדי לקבל את הספירה הכוללת לפי כלים או סוכנים שונים.
הוראות לכתיבת יומנים של סוכנים מופיעות במאמר רישום ביומן של סוכן. פרטים נוספים על מדדים מבוססי-יומן מופיעים במאמר סקירה כללית של מדדים מבוססי-יומן.
מדדים שהמשתמש מגדיר
השלבים הבאים מדגימים איך ליצור מדד מוגדר על ידי המשתמש (token_count) ולהשתמש בו בתהליך עבודה לדוגמה, שבו כמה סוכנים קוראים לכמה מודלים, ואתם רוצים לחשב את המספר הכולל של הטוקנים שנצרכו (בהנחה שאתם עוקבים אחרי מספר הטוקנים מאז הפעלת האפליקציה עבור כל סוכן שמפעיל את המודל ואת מודל היעד):
מגדירים את סוג המדד המותאם אישית על ידי קריאה ל-
projects.metricDescriptors.createעם הפרמטרים הבאים:
name: מחרוזת של כתובת URL, כמוprojects/PROJECT_ID
Request body: אובייקט מסוגMetricDescriptor:{ "name": "token_count", "description": "Token Consumed by models.", "displayName": "Token Count", "type": "custom.googleapis.com/token_count", "metricKind": "CUMULATIVE", "valueType": "INT64", "unit": "1", "labels": [ { "key": "model", "valueType": "STRING", "description": "Model." }, { "key": "agent", "valueType": "STRING", "description": "Agent." } ], "monitoredResourceTypes": [ "generic_node" ] }המדד החדש
token_countנוצר עם הסוגCumulative, שמייצג את המספר הכולל של הטוקנים מאז הפעלת האפליקציה. לפרטים נוספים על מדדיCumulative, אפשר לעיין במאמר סוגים של מדדים. התוויותmodelו-agentמייצגות את השם של מודל השפה הגדול (LLM) ואת הסוכן שמפעיל אותו.
אפשר למצוא את המדד
token_countבMetrics Explorer:- נכנסים לדף Metrics Explorer במסוף Google Cloud :
לוחצים על בחירת מדד כדי לפתוח את סרגל החיפוש.
מזינים Generic node בסרגל החיפוש ולוחצים על Custom metrics (מדדים מותאמים אישית).
לוחצים על ספירת טוקנים.
כותבים נקודות נתונים למדד החדש על ידי קריאה ל-
projects.timeSeries.createעם הפרמטרים הבאים:
name: מחרוזת של כתובת URL, כמוprojects/PROJECT_ID
Request body: רשימה של אובייקטים מסוגTimeSeries:{ "timeSeries": [ { "metric": { "type": "custom.googleapis.com/token_count", "labels": { "model": "model-1", "agent": "agent-1" } }, "resource": { "type": "generic_node", "labels": { "project_id": "PROJECT_ID", "node_id": "RESOURCE_ID", "namespace": "", "location": "us-central1" } }, "points": [ { "interval": { "startTime": "2025-03-26T10:00:00-08:00", "endTime": "2025-03-26T10:01:00-08:00" }, "value": { "int64Value": 15 } } ] }, { "metric": { "type": "custom.googleapis.com/token_count", "labels": { "model": "model-1", "agent": "agent-2" } }, "resource": { "type": "generic_node", "labels": { "project_id": "PROJECT_ID", "node_id": "RESOURCE_ID", "namespace": "", "location": "us-central1" } }, "points": [ { "interval": { "startTime": "2025-03-26T10:00:00-08:00", "endTime": "2025-03-26T10:01:00-08:00" }, "value": { "int64Value": 20 } } ] } // ... more time series ... ] }
אחרי שמעלים את נקודות הנתונים באמצעות Cloud Monitoring API, אפשר לראות את המדד החדש
token_countדרך מסוף Google Cloud :נכנסים לדף Metrics Explorer במסוף Google Cloud :
לוחצים על בחירת מדד כדי לפתוח את סרגל החיפוש.
מזינים Generic node בסרגל החיפוש ולוחצים על Custom metrics (מדדים מותאמים אישית).
לוחצים על ספירת טוקנים. אם צריך, משנים את טווח הזמן ומגדירים ערכי תווית ל-
modelאו ל-agent.
יצירת התראות לסוכן
אפשר להשתמש במדדים בשילוב עם התראות. פרטים נוספים מופיעים במאמר בנושא סקירה כללית על התראות.
בדוגמה הבאה מוסבר איך ליצור התראה על חריגה מערך סף למדד request_latencies, כדי לקבל התראות כשההשהיה חורגת מערך מוגדר מראש למשך זמן מסוים:
נכנסים לדף Alerting במסוף Google Cloud :
לוחצים על יצירת מדיניות. ייפתח הדף יצירת מדיניות התראות.
בקטע Policy configuration mode (מצב הגדרת המדיניות), בוחרים באפשרות Builder (כלי בנייה).
בתפריט הנפתח בחירת מדד, בוחרים באפשרות
Agent Platform Reasoning Engine->reasoning_engine->Request Latency.בקטע Add filters (הוספת מסננים), אפשר להגדיר מסננים (כמו
reasoning_engine_id,response_code).בקטע Transform data (שינוי נתונים), מעבירים את המתגים Rolling window (חלון נע) ו-Rolling window function (פונקציית חלון נע) לערכים כמו
5minו-99th percentile(מעקב אחרי האחוזון ה-99 של זמן האחזור של הבקשה במהלך תקופת ההתאמה של 5 דקות).לוחצים על הבא.
בקטע Configure alert trigger, מבצעים את הפעולות הבאות:
בוחרים באפשרות Threshold (סף) בשדה Condition Types (סוגי תנאים).
בוחרים טריגר להתראה, כמו כל סדרת זמן חורגת.
בוחרים מיקום סף, למשל מעל הסף.
מזינים ערך סף, כמו
5000ms.לוחצים על הבא.
בקטע Configure notifications and finalize alert (הגדרת התראות וסיום ההתראה), מבצעים את הפעולות הבאות:
בוחרים ערוץ התראות אחד או יותר. פרטים נוספים זמינים במאמר בנושא ניהול ערוצי התראות.
(אופציונלי) אפשר להגדיר את נושא ההתראה, את משך הזמן עד לסגירה אוטומטית של האירוע, את תוויות האפליקציה, את תוויות המדיניות, את רמת החומרה ואת התיעוד הנוסף.
מגדירים את שם המדיניות בקטע Name the alert policy, למשל
latency-99p-alert.לוחצים על יצירת מדיניות.
במקרה של אירוע, אפשר לעיין במאמר אירועים במדיניות התראות שמבוססת על מדדים כדי לקבל מידע נוסף על אישור האירוע, בדיקתו והשתקת ההתראה.
דוגמאות נוספות להתראות זמינות במאמר דוגמאות למדיניות ב-JSON.
מעקב אחרי מדדים של סוכן
אתם יכולים להשתמש בלוח הבקרה Agent Runtime Overview כדי לעקוב אחרי התקינות התפעולית והביצועים של הסוכנים.
הצגת מרכז הבקרה שמוגדר כברירת מחדל
נכנסים לדף Dashboards במסוף Google Cloud :
בוחרים את הפרויקט Google Cloud .
בחלונית My Dashboards, מוסיפים את המסנן
Name:Agent Runtime Overview.לוחצים על Agent Runtime Overview (סקירה כללית של זמן הריצה של הסוכן) כדי להציג את לוח הבקרה של הסוכן שמוגדר כברירת מחדל.
התאמה אישית של לוח הבקרה שמוגדר כברירת מחדל
לוח הבקרה שמוגדר כברירת מחדל מכיל רק את המדדים המובנים של הסוכן. כדי להוסיף מדדים מותאמים אישית משלכם למרכז הבקרה, צריך להעתיק את מרכז הבקרה שמוגדר כברירת מחדל ולהתאים אותו אישית:
לוחצים על העתקת לוח הבקרה. בתיבת הדו-שיח העתקת לוח הבקרה, לוחצים על העתקה. עותק של מרכז הבקרה ייפתח. עותק של מרכז הבקרה יופיע גם בחלונית מרכזי הבקרה שלי בקטגוריה בהתאמה אישית.
כדי להוסיף מדד לעותק של מרכז הבקרה:
לוחצים על הוספת ווידג'ט. מופיעה החלונית הצדדית הוספת ווידג'ט.
בקטע נתונים, בוחרים באפשרות מדד. מופיעה חלונית צדדית Configure widget.
לוחצים על בחירת מדד כדי לפתוח את סרגל החיפוש.
אם המדד המותאם אישית שלכם נוצר באמצעות מדדים מבוססי-יומן:
בסרגל החיפוש, מזינים Gemini Enterprise Agent Platform Reasoning Engine ולוחצים על Gemini Enterprise Agent Platform Reasoning Engine.
לוחצים על קטגוריית המדדים מדדים מבוססי-יומן, ואז לוחצים על מדד, כמו Logging/user/tool_calling_count.
לוחצים על אישור.
אם המדד המותאם אישית נוצר באמצעות מדדים שהוגדרו על ידי המשתמש:
מזינים Generic Node בסרגל החיפוש ולוחצים על Generic Node.
לוחצים על קטגוריית המדדים מדדים מותאמים אישית, ואז לוחצים על מדד, כמו Token Count (מספר הטוקנים).
לוחצים על אישור.
תרשים חדש שבו מוצג המדד המותאם אישית יופיע בלוח הבקרה.
אפשר גם לשנות את הפריסה של מרכז הבקרה, למשל:
כדי להזיז את הווידג'ט, לוחצים לחיצה ארוכה על הכותרת שלו וגוררים אותו למיקום אחר באותה לוח בקרה.
כדי לשנות את הגודל של הווידג'ט, לוחצים לחיצה ארוכה על הפינה השמאלית התחתונה של הווידג'ט ומשנים את הגודל שלו.
במאמר הוספת תרשימים וטבלאות למרכז בקרה בהתאמה אישית יש פרטים נוספים על הוספת תרשימי מדדים באמצעות שפת השאילתות של Prometheus (PromQL), וגם על הצגת המדדים בטבלה.
אם הגדרתם התראות בהתאמה אישית, תוכלו לעיין במאמר הצגת מדיניות התראות והתראות בלוח בקרה כדי להוסיף התראות כאלה ללוח הבקרה.