Elasticsearch הוא שרת חיפוש בקוד פתוח, שמבוסס על ספריית החיפוש Lucene. הוא פועל במכונה וירטואלית של Java על גבי מספר מערכות הפעלה. elasticsearch המקלט אוסף טלמטריה ברמת הצומת והאשכול ממופעי Elasticsearch.
מידע נוסף על Elasticsearch זמין במסמכי התיעוד של Elasticsearch 8.0 ואילך ו-9.0 ואילך.
דרישות מוקדמות
כדי לאסוף טלמטריה של Elasticsearch, צריך להתקין את סוכן התפעול:
- כדי להשתמש במדדים, צריך להתקין את גרסה 2.60.0 ואילך.
- כדי לראות את היומנים, צריך להתקין את גרסה 2.60.0 ומעלה.
השילוב הזה תומך ב-Elasticsearch בגרסאות 8.0 ומעלה ובגרסאות 9.0 ומעלה.
הגדרת מופע Elasticsearch
אם מפעילים את תכונות האבטחה של Elasticsearch, צריך להגדיר משתמש עם הרשאת אשכול monitor או manage.
הגדרת סוכן תפעול ל-Elasticsearch
פועלים לפי ההוראות במדריך הגדרת Ops Agent, מוסיפים את הרכיבים הנדרשים לאיסוף נתוני טלמטריה ממופעי Elasticsearch ומפעילים מחדש את הסוכן.
הגדרה לדוגמה
הפקודות הבאות יוצרות את ההגדרה לאיסוף ולעיבוד של נתוני טלמטריה עבור Elasticsearch:
כדי שהשינויים האלה ייכנסו לתוקף, צריך להפעיל מחדש את Ops Agent:
Linux
- כדי להפעיל מחדש את הסוכן, מריצים את הפקודה הבאה במופע:
sudo systemctl restart google-cloud-ops-agent
- כדי לוודא שהסוכן הופעל מחדש, מריצים את הפקודה הבאה ומוודאים שהרכיבים Metrics Agent ו-Logging Agent הופעלו:
sudo systemctl status "google-cloud-ops-agent*"
Windows
- מתחברים למופע באמצעות RDP או כלי דומה ומתחברים ל-Windows.
- פותחים טרמינל ב-PowerShell עם הרשאות אדמין על ידי לחיצה ימנית על סמל PowerShell ובחירה באפשרות הפעלה כמנהל מערכת.
- כדי להפעיל מחדש את הסוכן, מריצים את פקודת PowerShell הבאה:
Restart-Service google-cloud-ops-agent -Force
- כדי לוודא שהסוכן הופעל מחדש, מריצים את הפקודה הבאה ומוודאים שהרכיבים Metrics Agent ו-Logging Agent הופעלו:
Get-Service google-cloud-ops-agent*
הגדרת איסוף יומנים
כדי להטמיע יומנים מ-Elasticsearch, צריך ליצור מקלט ליומנים ש-Elasticsearch מייצר, ואז ליצור צינור למקלט החדש.
כדי להגדיר מקלט ליומני elasticsearch_json, מציינים את השדות הבאים:
| שדה | ברירת מחדל | תיאור |
|---|---|---|
exclude_paths |
רשימה של תבניות נתיבים במערכת הקבצים שצריך להחריג מהקבוצה שתואמת ל-include_paths. |
|
include_paths |
[/var/log/elasticsearch/*_server.json, /var/log/elasticsearch/*_deprecation.json, /var/log/elasticsearch/*_index_search_slowlog.json, /var/log/elasticsearch/*_index_indexing_slowlog.json, /var/log/elasticsearch/*_audit.json] |
רשימה של נתיבי מערכת קבצים לקריאה על ידי מעקב אחרי כל קובץ. אפשר להשתמש בתו כללי לחיפוש (*) בנתיבים. |
record_log_file_path |
false |
אם הערך הוא true, הנתיב לקובץ הספציפי שממנו נלקחה רשומת היומן מופיע ברשומת היומן של הפלט כערך של התווית agent.googleapis.com/log_file_path. כשמשתמשים בתו כללי, רק הנתיב של הקובץ שממנו התקבל הרשומה מתועד. |
type |
הערך חייב להיות elasticsearch_json. |
|
wildcard_refresh_interval |
60s |
המרווח שבו נתיבי קבצים עם תו כללי ב-include_paths מתעדכנים. הערך מוצג כמשך זמן, לדוגמה 30s או 2m. הנכס הזה יכול להיות שימושי כשקצב העברת הנתונים של הרישום גבוה, וקובצי היומן מתחלפים מהר יותר מהמרווח שמוגדר כברירת מחדל. |
כדי להגדיר מקלט ליומני elasticsearch_gc, מציינים את השדות הבאים:
| שדה | ברירת מחדל | תיאור |
|---|---|---|
exclude_paths |
רשימה של תבניות נתיבים במערכת הקבצים שצריך להחריג מהקבוצה שתואמת ל-include_paths. |
|
include_paths |
[/var/log/elasticsearch/gc.log] |
רשימה של נתיבי מערכת קבצים לקריאה על ידי מעקב אחרי כל קובץ. אפשר להשתמש בתו כללי לחיפוש (*) בנתיבים. |
record_log_file_path |
false |
אם הערך הוא true, הנתיב לקובץ הספציפי שממנו נלקחה רשומת היומן מופיע ברשומת היומן של הפלט כערך של התווית agent.googleapis.com/log_file_path. כשמשתמשים בתו כללי, רק הנתיב של הקובץ שממנו התקבל הרשומה מתועד. |
type |
הערך חייב להיות elasticsearch_gc. |
|
wildcard_refresh_interval |
60s |
המרווח שבו נתיבי קבצים עם תו כללי ב-include_paths מתעדכנים. הערך מוצג כמשך זמן, לדוגמה 30s או 2m. הנכס הזה יכול להיות שימושי כשקצב העברת הנתונים של הרישום גבוה, וקובצי היומן מתחלפים מהר יותר מהמרווח שמוגדר כברירת מחדל. |
מה נרשם ביומן
הערך של logName נגזר ממזהי המקלט שצוינו בהגדרה. אלה השדות המפורטים שבתוך LogEntry:
יומני elasticsearch_json מכילים את השדות הבאים ב-LogEntry:
| שדה | סוג | תיאור |
|---|---|---|
jsonPayload.ecs.version |
מחרוזת | גרסת ECS |
jsonPayload.elasticsearch.cluster.name |
מחרוזת | השם של האשכול שפולט את רשומת היומן בפורמט ECS |
jsonPayload.elasticsearch.cluster.uuid |
מחרוזת | ה-UUID של האשכול שפולט את רשומת היומן בפורמט ECS |
jsonPayload.elasticsearch.node.name |
מחרוזת | השם של הצומת שפולט את רשומת היומן בפורמט ECS |
jsonPayload.event |
מחרוזת | פרטי האירוע בפורמט ECS |
jsonPayload.log |
מחרוזת | פרטי היומן בפורמט ECS |
jsonPayload.log.level |
מחרוזת | רמת רשומה ביומן בפורמט ECS |
jsonPayload.log.logger |
מחרוזת | רכיב היומן שפלט את היומן בפורמט ECS |
jsonPayload.message |
מחרוזת | הודעה ביומן |
jsonPayload.process.thread.name |
מחרוזת | השם של השרשור שפלט את היומן בפורמט ECS |
jsonPayload.service.name |
מחרוזת | שם השירות שיוצר את היומן בפורמט ECS |
severity |
מחרוזת (LogSeverity) |
רמת החומרה של רשומת היומן |
יומני elasticsearch_gc מכילים את השדות הבאים ב-LogEntry:
| שדה | סוג | תיאור |
|---|---|---|
jsonPayload.gc_run |
מספר | הפעלה של מנגנון איסוף הזבל |
jsonPayload.message |
מחרוזת | הודעה ביומן |
jsonPayload.type |
מחרוזת | סוג רשומת היומן |
severity |
מחרוזת (LogSeverity) |
רמת רשומת היומן (מתורגמת). |
הגדרת איסוף מדדים
כדי להטמיע מדדים מ-Elasticsearch, צריך ליצור מקלט למדדים ש-Elasticsearch מייצר, ואז ליצור צינור למקלט החדש.
המקלט הזה לא תומך בשימוש בכמה מופעים בהגדרה, למשל כדי לעקוב אחרי כמה נקודות קצה. כל המקרים האלה נרשמים באותה סדרת זמן, ול-Cloud Monitoring אין דרך להבחין ביניהם.
כדי להגדיר נמען למדדים של elasticsearch, צריך לציין את השדות הבאים:
| שדה | ברירת מחדל | תיאור |
|---|---|---|
ca_file |
הנתיב לאישור CA. בתור לקוח, הוא מאמת את אישור השרת. אם העמודה ריקה, המקבל משתמש ב-CA הבסיסי של המערכת. | |
cert_file |
נתיב לאישור TLS לשימוש בחיבורים שנדרש בהם mTLS. | |
collection_interval |
60s |
ערך של משך זמן, כמו 30s או 5m. |
endpoint |
https://localhost:9200 |
כתובת ה-URL הבסיסית של Elasticsearch API בארכיטקטורת REST. ב-Elasticsearch מגרסה 9.0 ואילך נעשה שימוש ב-HTTPS כברירת מחדל. |
insecure |
false |
הגדרה שקובעת אם להשתמש בחיבור TLS מאובטח. ב-Elasticsearch מגרסה 9.0 ואילך נעשה שימוש ב-HTTPS כברירת מחדל. |
insecure_skip_verify |
true |
ההגדרה קובעת אם לדלג על אימות האישור או לא. מגדירים את הערך true לאישורים בחתימה עצמית (נפוץ בסביבות בדיקה). |
key_file |
הנתיב למפתח ה-TLS שבו יש להשתמש לחיבורים שנדרש בהם mTLS. | |
password |
הסיסמה לאימות ב-Elasticsearch. חובה ל-Elasticsearch מגרסה 9.0 ואילך. | |
type |
הערך חייב להיות elasticsearch. |
|
username |
elastic |
שם המשתמש לאימות ב-Elasticsearch. חובה ל-Elasticsearch מגרסה 9.0 ואילך. |
מה נבדק
בטבלה הבאה מפורטים המדדים שסוכן התפעול אוסף ממופע Elasticsearch.
| סוג המדד | |
|---|---|
| סוג, סוג משאבים במעקב |
תוויות |
workload.googleapis.com/elasticsearch.breaker.memory.estimated
|
|
GAUGE, INT64gce_instance |
instrumentation_sourcename
|
workload.googleapis.com/elasticsearch.breaker.memory.limit
|
|
GAUGE, INT64gce_instance |
instrumentation_sourcename
|
workload.googleapis.com/elasticsearch.breaker.tripped
|
|
CUMULATIVE, INT64gce_instance |
instrumentation_sourcename
|
workload.googleapis.com/elasticsearch.cluster.data_nodes
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.cluster.health
|
|
GAUGE, INT64gce_instance |
instrumentation_sourcestatus
|
workload.googleapis.com/elasticsearch.cluster.in_flight_fetch
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.cluster.nodes
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.cluster.pending_tasks
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.cluster.published_states.differences
|
|
GAUGE, INT64gce_instance |
instrumentation_sourcestate
|
workload.googleapis.com/elasticsearch.cluster.published_states.full
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.cluster.shards
|
|
GAUGE, INT64gce_instance |
instrumentation_sourcestate
|
workload.googleapis.com/elasticsearch.cluster.state_queue
|
|
GAUGE, INT64gce_instance |
instrumentation_sourcestate
|
workload.googleapis.com/elasticsearch.cluster.state_update.count
|
|
CUMULATIVE, INT64gce_instance |
instrumentation_sourcestate
|
workload.googleapis.com/elasticsearch.cluster.state_update.time
|
|
CUMULATIVE, INT64gce_instance |
instrumentation_sourcestatetype
|
workload.googleapis.com/elasticsearch.indexing_pressure.memory.limit
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.indexing_pressure.memory.total.primary_rejections
|
|
CUMULATIVE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.indexing_pressure.memory.total.replica_rejections
|
|
CUMULATIVE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.memory.indexing_pressure
|
|
GAUGE, INT64gce_instance |
instrumentation_sourcestage
|
workload.googleapis.com/elasticsearch.node.cache.count
|
|
GAUGE, INT64gce_instance |
instrumentation_sourcetype
|
workload.googleapis.com/elasticsearch.node.cache.evictions
|
|
CUMULATIVE, INT64gce_instance |
cache_nameinstrumentation_source
|
workload.googleapis.com/elasticsearch.node.cache.memory.usage
|
|
GAUGE, INT64gce_instance |
cache_nameinstrumentation_source
|
workload.googleapis.com/elasticsearch.node.cluster.connections
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.node.cluster.io
|
|
CUMULATIVE, INT64gce_instance |
directioninstrumentation_source
|
workload.googleapis.com/elasticsearch.node.disk.io.read
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.node.disk.io.write
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.node.documents
|
|
GAUGE, INT64gce_instance |
instrumentation_sourcestate
|
workload.googleapis.com/elasticsearch.node.fs.disk.available
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.node.fs.disk.free
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.node.fs.disk.total
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.node.http.connections
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.node.ingest.documents
|
|
CUMULATIVE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.node.ingest.documents.current
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.node.ingest.operations.failed
|
|
CUMULATIVE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.node.open_files
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.node.operations.completed
|
|
CUMULATIVE, INT64gce_instance |
instrumentation_sourceoperation
|
workload.googleapis.com/elasticsearch.node.operations.time
|
|
CUMULATIVE, INT64gce_instance |
instrumentation_sourceoperation
|
workload.googleapis.com/elasticsearch.node.pipeline.ingest.documents.current
|
|
GAUGE, INT64gce_instance |
instrumentation_sourcename
|
workload.googleapis.com/elasticsearch.node.pipeline.ingest.documents.preprocessed
|
|
GAUGE, INT64gce_instance |
instrumentation_sourcename
|
workload.googleapis.com/elasticsearch.node.pipeline.ingest.operations.failed
|
|
CUMULATIVE, INT64gce_instance |
instrumentation_sourcename
|
workload.googleapis.com/elasticsearch.node.script.cache_evictions
|
|
CUMULATIVE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.node.script.compilation_limit_triggered
|
|
CUMULATIVE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.node.script.compilations
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.node.shards.data_set.size
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.node.shards.reserved.size
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.node.shards.size
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.node.thread_pool.tasks.finished
|
|
CUMULATIVE, INT64gce_instance |
instrumentation_sourcestatethread_pool_name
|
workload.googleapis.com/elasticsearch.node.thread_pool.tasks.queued
|
|
GAUGE, INT64gce_instance |
instrumentation_sourcethread_pool_name
|
workload.googleapis.com/elasticsearch.node.thread_pool.threads
|
|
GAUGE, INT64gce_instance |
instrumentation_sourcestatethread_pool_name
|
workload.googleapis.com/elasticsearch.node.translog.operations
|
|
CUMULATIVE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.node.translog.size
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.node.translog.uncommitted.size
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.os.cpu.load_avg.15m
|
|
GAUGE, DOUBLEgce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.os.cpu.load_avg.1m
|
|
GAUGE, DOUBLEgce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.os.cpu.load_avg.5m
|
|
GAUGE, DOUBLEgce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.os.cpu.usage
|
|
GAUGE, INT64gce_instance |
instrumentation_source
|
workload.googleapis.com/elasticsearch.os.memory
|
|
GAUGE, INT64gce_instance |
instrumentation_sourcestate
|
אימות ההגדרה
בקטע הזה מוסבר איך לוודא שהגדרתם נכון את מקלט Elasticsearch. יכול להיות שיעברו דקה או שתיים עד שהסוכן של Ops יתחיל לאסוף נתוני טלמטריה.
כדי לוודא שיומני Elasticsearch נשלחים אל Cloud Logging:
-
במסוף Google Cloud , נכנסים לדף Logs Explorer:
אם משתמשים בסרגל החיפוש כדי למצוא את הדף הזה, בוחרים בתוצאה שכותרת המשנה שלה היא Logging.
- מזינים את השאילתה הבאה בעורך ולוחצים על Run query:
resource.type="gce_instance" (log_id("elasticsearch_json") OR log_id("elasticsearch_gc"))
כדי לוודא שהמדדים של Elasticsearch נשלחים ל-Cloud Monitoring:
-
נכנסים לדף leaderboard Metrics explorer במסוף Google Cloud :
אם משתמשים בסרגל החיפוש כדי למצוא את הדף הזה, בוחרים בתוצאה שבה הכותרת המשנית היא Monitoring.
- בסרגל הכלים של החלונית ליצירת שאילתות, לוחצים על הלחצן ששמו code PromQL.
- מזינים את השאילתה הבאה בעורך ולוחצים על Run query:
{"workload.googleapis.com/elasticsearch.node.open_files", monitored_resource="gce_instance"}
צפייה בלוח הבקרה
כדי לראות את המדדים של Elasticsearch, צריך להגדיר תרשים או לוח בקרה. השילוב של Elasticsearch כולל לוח בקרה אחד או יותר. כל מרכזי הבקרה מותקנים אוטומטית אחרי שמגדירים את השילוב וסוכן Ops מתחיל לאסוף נתונים של מדדים.
אפשר גם לראות תצוגות מקדימות סטטיות של מרכזי בקרה בלי להתקין את השילוב.
כדי לראות מרכז בקרה שהותקן:
-
במסוף Google Cloud , עוברים לדף Dashboards:
אם משתמשים בסרגל החיפוש כדי למצוא את הדף הזה, בוחרים בתוצאה שבה הכותרת המשנית היא Monitoring.
- לוחצים על הכרטיסייה רשימת לוחות הבקרה ואז בוחרים בקטגוריה שילובים.
- לוחצים על השם של מרכז הבקרה שרוצים להציג.
אם הגדרתם שילוב אבל לוח הבקרה לא הותקן, צריך לבדוק שסוכן תפעול פועל. אם אין נתוני מדדים לתרשים במרכז הבקרה, ההתקנה של מרכז הבקרה נכשלת. אחרי שסוכן התפעול מתחיל לאסוף מדדים, לוח הבקרה מותקן בשבילכם.
כדי לראות תצוגה מקדימה סטטית של מרכז הבקרה:
-
נכנסים לדף
Integrations במסוף Google Cloud :
אם משתמשים בסרגל החיפוש כדי למצוא את הדף הזה, בוחרים בתוצאה שבה הכותרת המשנית היא Monitoring.
- לוחצים על המסנן Compute Engine של פלטפורמת הפריסה.
- מאתרים את הערך של Elasticsearch ולוחצים על הצגת פרטים.
- לוחצים על הכרטיסייה מרכזי בקרה כדי לראות תצוגה מקדימה סטטית. אם מרכז הבקרה מותקן, אפשר לעבור אליו בלחיצה על View dashboard (הצגת מרכז הבקרה).
מידע נוסף על לוחות בקרה ב-Cloud Monitoring זמין במאמר בנושא לוחות בקרה וטבלאות.
מידע נוסף על השימוש בדף Integrations (שילובים) זמין במאמר ניהול שילובים.
התקנה של כללי מדיניות התראות
מדיניות התראות מורה ל-Cloud Monitoring לשלוח לכם התראה כשמתרחשים תנאים מסוימים. השילוב של Elasticsearch כולל מדיניות התראות אחת או יותר שתוכלו להשתמש בהן. אפשר לראות ולהתקין את מדיניות ההתראות הזו בדף שילובים ב-Monitoring.
כדי לראות את התיאורים של כללי מדיניות ההתראות הזמינים ולהתקין אותם:
-
נכנסים לדף
Integrations במסוף Google Cloud :
אם משתמשים בסרגל החיפוש כדי למצוא את הדף הזה, בוחרים בתוצאה שבה הכותרת המשנית היא Monitoring.
- מאתרים את הערך של Elasticsearch ולוחצים על הצגת פרטים.
- לוחצים על הכרטיסייה התראות. בכרטיסייה הזו מופיעים תיאורים של מדיניות ההתראות הזמינה וממשק להתקנתן.
- התקנה של כללי מדיניות התראות. כדי שמדיניות ההתראות תדע לאן לשלוח התראות על הפעלה של התראה, היא צריכה לקבל מכם מידע להתקנה.
כדי להתקין מדיניות התראות:
- ברשימת מדיניות ההתראות הזמינה, בוחרים את אלה שרוצים להתקין.
בקטע הגדרת התראות, בוחרים ערוץ התראות אחד או יותר. יש לכם אפשרות להשבית את השימוש בערוצי התראות, אבל אם תעשו את זה, מדיניות ההתראות שלכם תופעל בשקט. אפשר לבדוק את הסטטוס שלהם בדף 'מעקב', אבל לא תקבלו התראות.
מידע נוסף על ערוצי התראות זמין במאמר בנושא ניהול ערוצי התראות.
- לוחצים על יצירת מדיניות.
למידע נוסף על מדיניות התראות ב-Cloud Monitoring, אפשר לעיין במאמר מבוא להתראות.
מידע נוסף על השימוש בדף Integrations (שילובים) זמין במאמר ניהול שילובים.
המאמרים הבאים
בסרטון Install the Ops Agent to troubleshoot third-party applications מוסבר איך להשתמש ב-Ansible כדי להתקין את סוכן תפעול, להגדיר אפליקציית צד שלישי ולהתקין לוח בקרה לדוגמה.