השבתת איסוף המדדים

במאמר הזה מוסבר איך להשבית את Cloud Monitoring API עבורGoogle Cloud פרויקט, ואיך למנוע מסוכן התפעול ומסוכן Monitoring מדור קודם לאסוף מדדי תהליכים. לדוגמה, יכול להיות שתרצו להשבית את Cloud Monitoring API כדי למנוע את ההטמעה של מדדים שניתנים לחיוב בפרויקט ב- Google Cloud .

השבתת האיסוף של כל המדדים

כדי למנוע את איסוף כל המדדים, משביתים את Cloud Monitoring API:

המסוף

  1. במסוף Google Cloud , בוחרים את הפרויקט Google Cloud ועוברים לדף APIs & Services:

    כניסה אל APIs & Services

  2. בוחרים באפשרות Cloud Monitoring API.

  3. לוחצים על השבתת ה-API.

gcloud

כדי להשבית את Cloud Monitoring API בפרויקט הנוכחי, מריצים את הפקודה הבאה:

gcloud services disable monitoring.googleapis.com

מידע על השבתת API באמצעות Google Cloud CLI מופיע במאמר הפעלה והשבתה של שירותים.

השבתת האיסוף של מדדי תהליכים

יש כמה דרכים להשבית את איסוף המדדים האלה על ידי סוכן תפעול (גרסה 2.0.0 ואילך) ועל ידי סוכן המעקב מדור קודם ב-Linux.

הסוכנים פועלים רק במכונות וירטואליות של Compute Engine, וההליכים האלה רלוונטיים רק לפלטפורמה הזו.

אי אפשר להשבית את האיסוף באמצעות Ops Agent אם אתם מריצים גרסאות שקטנות מ-2.0.0 או את סוכן המעקב מדור קודם ב-Windows. אם רוצים להשבית את איסוף המדדים האלה ב-Windows, מומלץ לשדרג לגרסה 2.0.0 של סוכן תפעול או לגרסה מתקדמת יותר. מידע נוסף מופיע במאמר בנושא התקנת סוכן תפעול.

התהליך הכללי נראה כך:

  1. מתחברים ל-VM.

  2. יוצרים עותק של קובץ התצורה הקיים כגיבוי. מאחסנים את עותק הגיבוי מחוץ לספריית ההגדרות של הסוכן, כדי שהסוכן לא ינסה לטעון את שני הקבצים. לדוגמה, הפקודה הבאה יוצרת עותק של קובץ התצורה של סוכן המעקב ב-Linux:

    cp /etc/stackdriver/collectd.conf BACKUP_DIR/collectd.conf.bak
    
  3. משנים את ההגדרה באמצעות אחת מהאפשרויות שמתוארות במאמרים הבאים:

  4. מפעילים מחדש את הסוכן כדי להחיל את ההגדרה החדשה:

    • סוכן מעקב: sudo service stackdriver-agent restart
    • סוכן תפעול: sudo service google-cloud-ops-agent restart
  5. מוודאים שהמדדים של התהליך לא נאספים יותר עבור המכונה הווירטואלית הזו:

    1. במסוף Google Cloud , עוברים לדף  Metrics explorer:

      כניסה אל Metrics Explorer

      אם משתמשים בסרגל החיפוש כדי למצוא את הדף הזה, בוחרים בתוצאה שכותרת המשנה שלה היא Monitoring.

    2. בסרגל הכלים של חלונית הכלי ליצירת שאילתות, לוחצים על הלחצן ששמו הוא  MQL או  PromQL.

    3. מוודאים שהאפשרות PromQL נבחרה במתג שפה. המתג לשפה נמצא באותו סרגל כלים שבו אפשר לעצב את השאילתה.

    4. כדי להריץ שאילתה על משאב gce_instance, מזינים את השאילתה הבאה ומחליפים את VM_NAME בשם של המכונה הווירטואלית:

      rate({"agent.googleapis.com/processes/cpu_time", monitored_resource="gce_instance", metadata_system_name="VM_NAME"}[1m])
      
    5. לוחצים על הרצת שאילתה.

‫סוכן תפעול ב-Linux או ב-Windows

המיקום של קובץ התצורה של סוכן תפעול תלוי במערכת ההפעלה:

  • ב-Linux: /etc/google-cloud-ops-agent/config.yaml
  • ב-Windows: ‏ C:\Program Files\Google\Cloud Operations\Ops Agent\config\config.yaml

כדי להשבית את איסוף כל מדדי התהליך על ידי סוכן תפעול, מוסיפים את השורות הבאות לקובץ config.yaml:

metrics:
  processors:
    metrics_filter:
      type: exclude_metrics
      metrics_pattern:
      - agent.googleapis.com/processes/*

המדדים האלה לא נכללים באוסף המדדים של התהליך בmetrics_filter מעבד שחל על צינור ברירת המחדל בשירות metrics.

מידע נוסף על אפשרויות ההגדרה של סוכן תפעול זמין במאמר הגדרת סוכן תפעול.

סוכן מעקב ב-Linux

יש לכם את האפשרויות הבאות להשבתת האיסוף של מדדי תהליכים באמצעות סוכן המעקב מדור קודם:

בקטעים הבאים מתוארת כל אפשרות ומפורטים היתרונות והסיכונים שקשורים אליה.

שינוי קובץ התצורה של הסוכן

באפשרות הזו, אתם עורכים ישירות את קובץ התצורה הראשי של הסוכן, /etc/stackdriver/collectd.conf, כדי להסיר את הקטעים שמאפשרים את איסוף מדדי התהליך.

התהליך

יש שלושה סוגים של מחיקות שצריך לבצע בקובץ collectd.conf:

  1. צריך למחוק את ההנחיה LoadPlugin ואת הגדרות הפלאגין הבאות:

    LoadPlugin processes
    
    <Plugin "processes">
      ProcessMatch "all" ".*"
      Detail "ps_cputime"
      Detail "ps_disk_octets"
      Detail "ps_rss"
      Detail "ps_vm"
    </Plugin>
    
  2. צריך למחוק את ההנחיה PostCacheChain ואת ההגדרה של שרשרת PostCache:

    PostCacheChain "PostCache"
    
    <Chain "PostCache">
      <Rule "processes">
        <Match "regex">
          Plugin "^processes$"
          Type "^(ps_cputime|disk_octets|ps_rss|ps_vm)$"
        </Match>
        <Target "jump">
          Chain "MaybeThrottleProcesses"
        </Target>
        Target "stop"
      </Rule>
    
      <Rule "otherwise">
        <Match "throttle_metadata_keys">
          OKToThrottle false
          HighWaterMark 5700000000  # 950M * 6
          LowWaterMark 4800000000  # 800M * 6
        </Match>
        <Target "write">
           Plugin "write_gcm"
        </Target>
      </Rule>
    </Chain>
    
  3. מוחקים את שרשרת MaybeThrottleProcesses שמשמשת את שרשרת PostCache:

    <Chain "MaybeThrottleProcesses">
      <Rule "default">
        <Match "throttle_metadata_keys">
          OKToThrottle true
          TrackedMetadata "processes:pid"
          TrackedMetadata "processes:command"
          TrackedMetadata "processes:command_line"
          TrackedMetadata "processes:owner"
        </Match>
        <Target "write">
           Plugin "write_gcm"
        </Target>
      </Rule>
    </Chain>
    
יתרונות וסיכונים
  • הטבות
    • הסוכן צורך פחות משאבים, כי המדדים לא נאספים אף פעם.
    • אם ביצעתם שינויים אחרים בקובץ collectd.conf, יכול להיות שתוכלו לשמור אותם בקלות.
  • סיכונים
    • כדי לערוך את קובץ התצורה הזה, צריך להשתמש בחשבון root.
    • יש סיכון להוספת שגיאות הקלדה לקובץ.

החלפת קובץ התצורה של הסוכן

באמצעות האפשרות הזו, מחליפים את קובץ התצורה הראשי של הסוכן בגרסה שעברה עריכה מראש, שבה הוסרו הקטעים הרלוונטיים.

התהליך
  1. מורידים את הקובץ collectd-no-process-metrics.conf שערכנו מראש ממאגר GitHub לספרייה /tmp, ואז מבצעים את הפעולות הבאות:

    cd /tmp && curl -sSO https://raw.githubusercontent.com/Stackdriver/agent-packaging/master/collectd-no-process-metrics.conf
    
  2. מחליפים את הקובץ הקיים collectd.conf בקובץ שעבר עריכה מראש:

    cp /tmp/collectd-no-process-metrics.conf /etc/stackdriver/collectd.conf
    
יתרונות וסיכונים
  • הטבות
    • הסוכן צורך פחות משאבים כי המדדים אף פעם לא נאספים.
    • לא צריך לערוך את הקובץ באופן ידני כמו root.
    • אפשר להשתמש בקלות בכלים לניהול תצורה כדי להחליף קובץ.
  • סיכונים
    • אם ביצעתם שינויים אחרים בקובץ collectd.conf, תצטרכו למזג את השינויים האלה עם הקובץ החדש.

פתרון בעיות

הפעולות שמתוארות במאמר הזה הן שינויים בהגדרות של הסוכן, ולכן הבעיות הבאות הן הסבירות ביותר:

  • אין הרשאה מספקת לערוך את קובצי ההגדרות. צריך לערוך את קובצי ההגדרה מחשבון root.
  • הוספה של שגיאות הקלדה לקובץ התצורה, אם עורכים אותו ישירות.

מידע על פתרון בעיות אחרות זמין במאמר פתרון בעיות בסוכן המעקב.

סוכן מעקב ב-Windows

אי אפשר להשבית את איסוף מדדי התהליך על ידי סוכן Monitoring מדור קודם שפועל במכונות וירטואליות של Windows. אי אפשר להגדיר את הסוכן הזה. אם רוצים להשבית את איסוף המדדים האלה ב-Windows, מומלץ לשדרג לגרסה 2.0.0 של סוכן תפעול או לגרסה מתקדמת יותר. מידע נוסף מופיע במאמר בנושא התקנת סוכן תפעול.

אם אתם מריצים את Ops Agent, כדאי לעיין במאמר בנושא Ops Agent ב-Linux או ב-Windows.