Cloud Monitoring מספק רישום חזק ביומן וניתוח ביצועים. השילוב של Dataflow עם Monitoring מאפשר לכם לגשת למדדים של משימות Dataflow, כמו סטטוס המשימה, מספר הרכיבים, השהיית המערכת (במשימות סטרימינג) ומונים של משתמשים, מלוחות הבקרה של Monitoring. אפשר גם להשתמש בהתראות של Monitoring כדי לקבל הודעות על תנאים שונים, כמו השהיה ארוכה במערכת הסטרימינג או משימות שנכשלו.
לפני שמתחילים
כדי להגדיר את פרויקט Dataflow, פועלים לפי המדריך ל-Java, המדריך ל-Python או המדריך ל-Go. לאחר מכן, בונה ומריץ את צינור עיבוד הנתונים.
כדי לראות יומנים ב-Metrics Explorer, לחשבון השירות של העובד חייב להיות roles/monitoring.metricWriter התפקיד.
מדדים מותאמים אישית
כל מדד שמגדירים בצינור Apache Beam מדווח על ידי Dataflow ל-Monitoring כמדד מותאם אישית.
ל-Apache Beam יש שלושה סוגים של מדדי צינורות: Counter, Distribution ו-Gauge.
- מדדי
Counterו-Distributionשל Dataflow אל Monitoring. - המדד
Distributionמדווח כמדד משנה עם ארבע סיומות:_MAX,_MIN,_MEANו-_COUNT. - ב-Dataflow אין תמיכה ביצירת היסטוגרמה ממדדים של
Distribution. - דוחות של Dataflow מעדכנים את המעקב כל 30 שניות בערך.
- כדי למנוע התנגשויות, כל המדדים המותאמים אישית של Dataflow מיוצאים כסוג נתונים
double. כדי לפשט את התהליך, כל המדדים המותאמים אישית של Dataflow מיוצאים כ
GAUGEסוג מדד. אפשר לעקוב אחרי הדלתא בחלון זמן עבור מדדGAUGE, כמו בדוגמה הבאה של Prometheus Query Language (PromQL):sum by (ptransform, metric_name) ( delta({ "__name__"="dataflow.googleapis.com/job/user_counter", "monitored_resource"="dataflow_job", "job_id"="[JobID]" }[${__interval}]) )המדדים המותאמים אישית של Dataflow מופיעים ב-Monitoring כ-
dataflow.googleapis.com/job/user_counterעם התוויותmetric_name: metric-nameו-ptransform: ptransform-name.לצורך תאימות לאחור, Dataflow מדווח גם על מדדים מותאמים אישית ל-Monitoring בתור
custom.googleapis.com/dataflow/metric-name.המדדים המותאמים אישית של Dataflow כפופים למגבלת הקרדינליות ב-Monitoring.
בכל פרויקט יש מגבלה של 100 מדדים מותאמים אישית של Dataflow. המדדים האלה מתפרסמים כ-
custom.googleapis.com/dataflow/metric-name.
החיוב על מדדים מותאמים אישית שמדווחים ל-Monitoring מבוסס על התמחור של Cloud Monitoring.
שימוש ב-Metrics Explorer
אפשר להשתמש ב-Monitoring כדי לנתח מדדים של Dataflow. כדי לראות את המדדים הרגילים שמוצגים לכל אחד מצינורות Apache Beam, פועלים לפי השלבים שמפורטים בקטע הזה. מידע נוסף על שימוש ב-Metrics Explorer זמין במאמר יצירת תרשימים באמצעות Metrics Explorer.
במסוף Google Cloud , בוחרים באפשרות Monitoring:
בחלונית הניווט, בוחרים באפשרות כלי לבחירת מדדים.
בחלונית Select a metric (בחירת מדד), כותבים
Dataflow Jobבמסנן.מהרשימה שמופיעה, בוחרים מדד למעקב עבור אחת מהמשימות.
כשמריצים משימות Dataflow, כדאי גם לעקוב אחרי מדדים של מקורות ויעדים. לדוגמה, יכול להיות שתרצו לעקוב אחרי מדדים של BigQuery Storage API. מידע נוסף זמין במאמרים בנושא יצירת לוחות בקרה, תרשימים והתראות ורשימה מלאה של מדדים משירות העברת הנתונים ל-BigQuery.
יצירת כללי מדיניות התראות ומרכזי בקרה
באמצעות Monitoring אפשר לגשת למדדים שקשורים ל-Dataflow. ליצור לוחות בקרה כדי לשרטט את סדרת הזמן של המדדים, וליצור כללי מדיניות התראות שיודיעו לכם כשהמדדים יגיעו לערכים שצוינו.
יצירת קבוצות של משאבים
כדי להקל על הגדרת התראות ויצירת לוחות בקרה, כדאי ליצור קבוצות משאבים שכוללות כמה צינורות עיבוד נתונים של Apache Beam.
במסוף Google Cloud , בוחרים באפשרות Monitoring:
בחלונית הניווט, בוחרים באפשרות קבוצות.
לוחצים על יצירת קבוצה.
מזינים שם לקבוצה.
מוסיפים קריטריוני סינון שמגדירים את משאבי Dataflow שנכללים בקבוצה. לדוגמה, אחד מקריטריוני הסינון יכול להיות קידומת השם של צינורות הנתונים.

אחרי שיוצרים את הקבוצה, אפשר לראות את המדדים הבסיסיים שקשורים למשאבים בקבוצה.
יצירת כללי מדיניות התראות למדדים של Dataflow
בעזרת Cloud Monitoring אפשר ליצור התראות ולקבל התראות כשמדד מסוים חוצה סף שצוין. לדוגמה, אפשר לקבל התראה כשהשהיית המערכת של צינור הנתונים של הסטרימינג עולה מעל ערך מוגדר מראש.
במסוף Google Cloud , בוחרים באפשרות Monitoring:
בחלונית הניווט, בוחרים באפשרות התראות.
לוחצים על יצירת מדיניות.
בדף Create new alerting policy (יצירת מדיניות התראות חדשה), מגדירים את תנאי ההתראה ואת ערוצי ההתראות.
לדוגמה, כדי להגדיר התראה על השהיית המערכת לקבוצת צינורות Apache Beam, פועלים לפי השלבים הבאים:WindowedWordCount- לוחצים על בחירת מדד.
- בשדה Select a metric (בחירת מדד), מזינים
Dataflow Job. - בקטע קטגוריות מדדים, בוחרים באפשרות משרה.
- בקטע מדדים, בוחרים באפשרות השהיית המערכת.
בכל פעם שהתראה מופעלת, נוצר אירוע ואירוע תואם. אם ציינתם מנגנון התראה, כמו אימייל או SMS, תקבלו גם התראה.
יצירת מרכזי בקרה מותאמים אישית למעקב
אתם יכולים ליצור לוחות בקרה של Monitoring עם התרשימים הרלוונטיים ביותר שקשורים ל-Dataflow. כדי להוסיף תרשים ללוח בקרה, פועלים לפי השלבים הבאים:
במסוף Google Cloud , בוחרים באפשרות Monitoring:
בחלונית הניווט, בוחרים באפשרות מרכזי בקרה.
לוחצים על יצירת מרכז בקרה.
לוחצים על הוספת ווידג'ט.
בחלון Add widget (הוספת ווידג'ט), בקטע Data (נתונים), בוחרים באפשרות Metric (מדד).
בחלונית Select a metric, בשדה Metric, מזינים
Dataflow Job.בוחרים קטגוריית מדדים ומדד.
אפשר להוסיף ללוח הבקרה כמה תרשימים שרוצים.
קבלת מדדים של worker VM מסוכן הניטור
אתם יכולים להשתמש ב-Monitoring כדי לעקוב אחרי מדדים של דיסקים לאחסון מתמיד, מעבד (CPU), רשת ועיבוד. כשמריצים את צינור הנתונים, צריך להפעיל את סוכן Monitoring ממכונות ה-VM של העובדים ב-Dataflow. כאן מפורטת רשימת המדדים הזמינים של סוכן Monitoring.
כדי להפעיל את סוכן הניטור, משתמשים באפשרות --experiments=enable_stackdriver_agent_metrics
כשמריצים את צינור הנתונים. לחשבון השירות של העובד צריך להיות התפקיד roles/monitoring.metricWriter.
כדי להשבית את סוכן המעקב בלי להפסיק את צינור הנתונים, צריך להפעיל משימת החלפה בלי הפרמטר --experiments=enable_stackdriver_agent_metrics.
אחסון ושימור
מידע על משימות Dataflow שהושלמו או בוטלו נשמר למשך 30 יום.
יומנים תפעוליים מאוחסנים ב_Default קטגוריה ביומן.
שם השירות של Logging API הוא dataflow.googleapis.com. מידע נוסף על סוגי המשאבים במעקב ועל השירותים של Google Cloud Platform שמשמשים ב-Cloud Logging זמין במאמר משאבים ושירותים במעקב.
לפרטים על משך הזמן לשמירת רשומות ביומן על ידי Logging, ראו את המידע על השמירה במאמר מכסות ומגבלות: תקופות שמירה של יומנים.
מידע על צפייה ביומנים תפעוליים מופיע במאמר מעקב אחרי יומנים של צינורות נתונים וצפייה בהם.
המאמרים הבאים
מידע נוסף זמין במקורות המידע הבאים: