במאמר הזה מוסבר איך להגדיר את הפריסה של Google Kubernetes Engine כדי שתוכלו להשתמש בשירות המנוהל של Google Cloud ל-Prometheus כדי לאסוף מדדים מ-GKE Inference Gateway. במאמר הזה מוסבר איך:
- הגדרת GKE Inference Gateway לדיווח על מדדים.
- אפשר לגשת למרכז בקרה מוגדר מראש ב-Cloud Monitoring כדי לראות את המדדים.
ההוראות האלה רלוונטיות רק אם אתם משתמשים ב אוסף מנוהל עם השירות המנוהל ל-Prometheus. אם אתם משתמשים באיסוף שמוטמע באופן עצמאי, תוכלו לקרוא את המסמכים בנושא GKE Inference Gateway כדי לקבל מידע על התקנה.
ההוראות האלה הן דוגמה, והן אמורות לפעול ברוב סביבות Kubernetes. אם נתקלתם בבעיה בהתקנת אפליקציה או כלי לייצוא בגלל מדיניות אבטחה או מדיניות ארגונית מגבילה, מומלץ לעיין במסמכי קוד פתוח לקבלת תמיכה.
מידע על GKE Inference Gateway זמין במאמר GKE Inference Gateway.
דרישות מוקדמות
כדי לאסוף מדדים מהכלי GKE Inference Gateway exporter באמצעות שירות מנוהל ל-Prometheus ואיסוף מנוהל, הפריסה צריכה לעמוד בדרישות הבאות:
- האשכול צריך להריץ את Google Kubernetes Engine בגרסה 1.28.15-gke.2475000 ואילך.
- צריך להפעיל את השירות המנוהל ל-Prometheus עם איסוף מנוהל. מידע נוסף זמין במאמר תחילת השימוש באוסף מנוהל.
כדי לוודא שהכלי לייצוא של GKE Inference Gateway שולח מדדים לנקודות הקצה הצפויות, מבצעים את הפעולות הבאות:
מוסיפים סוד, ServiceAccount, ClusterRole ו-ClusterBinding. נקודות הקצה של GKE Inference Gateway exporter observability מוגנות על ידי אסימון האימות. כדי לקבל אישורים, הלקוח צריך סוד שמופה לחשבון שירות עם ClusterRole מקושר, עבור כלל
nonResourceURLs: "/metrics", verbs: get. מידע נוסף מופיע במאמר יצירת סוד לחשבון שירות.מגדירים העברה ליציאה אחרת באמצעות הפקודה הבאה:
kubectl -n NAMESPACE_NAME port-forward POD_NAME 9090
בחלון אחר, מבצעים את הפעולות הבאות:
מריצים את הפקודה הבאה כדי לאחזר את האסימון:
TOKEN=$(kubectl -n default get secret inference-gateway-sa-metrics-reader-secret -o jsonpath='{.secrets[0].name}' -o jsonpath='{.data.token}' | base64 --decode)ניגשים לנקודת הקצה
localhost:9090/metricsבאמצעות כלי השירותcurl:curl -H "Authorization: Bearer $TOKEN" localhost:9090/metrics
יצירת סוד לחשבון שירות
כדי להגן על נקודת הקצה של GKE Inference Gateway exporter, שירות מנוהל ל-Prometheus Operator צריך סוד לאיסוף מורשה של מדדים במרחב השמות gmp-system.
אם האשכול שלכם משתמש במצב Autopilot, צריך להחליף את gmp-system ב-gke-gmp-system.
אפשר להשתמש בהגדרות הבאות של Secret, ServiceAccount, ClusterRole ו-ClusterRoleBinding:
למידע נוסף אפשר לעיין במדריך למדדים ולניטור של הכלי לייצוא.
כדי להחיל שינויים בתצורה מקובץ מקומי, מריצים את הפקודה הבאה:
kubectl apply -n NAMESPACE_NAME -f FILE_NAME
אפשר גם להשתמש ב-Terraform כדי לנהל את ההגדרות.
הגדרת משאב ClusterPodMonitoring
לצורך גילוי יעדים, ל-שירות מנוהל ל-Prometheus Operator נדרש משאב ClusterPodMonitoring שתואם ל-GKE Inference Gateway exporter באותו מרחב שמות.
אפשר להשתמש בהגדרה הבאה של ClusterPodMonitoring:
GKE Inference Gateway משתמש במשאב ClusterPodMonitoring במקום במשאב PodMonitoring כי הוא צריך לגשת לסוד ממרחב שמות אחר.
בבורר matchLabels של הגדרת ClusterPodMonitoring, אפשר להחליף את הערך app של inference-gateway-ext-proc בתוויות מהפריסה של GKE Inference Gateway.
מוודאים שהערכים בשדות port ו-matchLabels תואמים לאלה של הפודים של GKE Inference Gateway שרוצים לעקוב אחריהם.
כדי להחיל שינויים בתצורה מקובץ מקומי, מריצים את הפקודה הבאה:
kubectl apply -n NAMESPACE_NAME -f FILE_NAME
אפשר גם להשתמש ב-Terraform כדי לנהל את ההגדרות.
אימות ההגדרה
אתם יכולים להשתמש ב-Metrics Explorer כדי לוודא שהגדרתם נכון את כלי הייצוא של GKE Inference Gateway. יכול להיות שיחלפו דקה או שתיים עד שמערכת Cloud Monitoring תעבד את המדדים.
כדי לוודא שהמדדים נאספים, מבצעים את הפעולות הבאות:
-
במסוף Google Cloud , עוברים לדף leaderboard Metrics explorer:
אם משתמשים בסרגל החיפוש כדי למצוא את הדף הזה, בוחרים בתוצאה שכותרת המשנה שלה היא Monitoring.
- בסרגל הכלים של חלונית הכלי ליצירת שאילתות, לוחצים על הלחצן ששמו הוא code MQL או code PromQL.
- מוודאים שהאפשרות PromQL נבחרה במתג שפה. המתג לשפה נמצא באותו סרגל כלים שבו אפשר לעצב את השאילתה.
- מזינים ומריצים את השאילתה הבאה:
inference_model_request_total{cluster="CLUSTER_NAME", namespace="NAMESPACE_NAME"}
הצגת מרכזי בקרה
השילוב עם Cloud Monitoring כולל את לוח הבקרה GKE Inference Gateway Prometheus Overview. לוחות הבקרה מותקנים באופן אוטומטי כשמגדירים את השילוב. אפשר גם לראות תצוגות מקדימות סטטיות של מרכזי בקרה בלי להתקין את האינטגרציה.
כדי לראות מרכז בקרה שהותקן:
-
במסוף Google Cloud , עוברים לדף Dashboards:
אם משתמשים בסרגל החיפוש כדי למצוא את הדף הזה, בוחרים בתוצאה שכותרת המשנה שלה היא Monitoring.
- לוחצים על הכרטיסייה רשימת מרכזי בקרה.
- בוחרים בקטגוריה שילובים.
- לוחצים על השם של מרכז הבקרה, למשל GKE Inference Gateway Prometheus Overview.
כדי לראות תצוגה מקדימה סטטית של מרכז הבקרה:
-
נכנסים לדף
Integrations במסוף Google Cloud :
אם משתמשים בסרגל החיפוש כדי למצוא את הדף הזה, בוחרים בתוצאה שכותרת המשנה שלה היא Monitoring.
- לוחצים על המסנן Kubernetes Engine של פלטפורמת הפריסה.
- מאתרים את השילוב GKE Inference Gateway ולוחצים על הצגת פרטים.
- לוחצים על הכרטיסייה מרכזי בקרה.
פתרון בעיות
מידע על פתרון בעיות בהוספת מדדים זמין במאמר פתרון בעיות שקשורות להוספה, בקטע בעיות באיסוף נתונים ממייצאים.