נתונים סטטיסטיים של טבלה

‫Bigtable מספק נתונים סטטיסטיים על טבלה – מטא-נתונים על טבלה – שכוללים מידע סיכומי על הטבלה, כמו מספר השורות או מספר התאים הממוצע בכל עמודה.

במאמר הזה מוסבר על נתוני סטטיסטיקה של טבלאות ואיך מקבלים אותם באמצעות Google Cloud CLI. לפני שאתם קוראים דף זה, עליכם להבין את מודל האחסון Bigtable ולהיות בקיאים ב שיטות עבודה מומלצות לעיצוב סכמות ואת איסוף אשפה .

נתונים סטטיסטיים של טבלה מספקים יכולת מעקב אחרי טבלת Bigtable. הם יכולים להיות שימושיים כשמנסים לפתור בעיות שקשורות לביצועים או לאחסון, או כשרוצים לזהות את המקור של עלויות האחסון. הם גם יכולים לעזור לכם להבין אם אתם מאחסנים יותר נתונים ממה שאתם צריכים.

רמת הדיוק הצפויה

כשמאחזרים נתונים סטטיסטיים של טבלה, הנתונים שמתקבלים הם משוערים – הנתונים הסטטיסטיים של הטבלה משקפים את המצב של הטבלה באחד מהאשכולות של המופע, נכון לזמן הדחיסה האחרון.

סט מלא של נתונים סטטיסטיים של הטבלה יהיה זמין רק אחרי דחיסה ראשונית, שבדרך כלל מתרחשת כשבוע אחרי יצירת הטבלה. הנתונים הסטטיסטיים בטבלה מדויקים החל מהדחיסה האחרונה, שיכול להיות שהתרחשה לפני שבוע.

שדות של נתונים סטטיסטיים בטבלה

בקשה לנתונים סטטיסטיים של טבלה מחזירה את השדות הבאים. פרטים ודוגמאות מופיעים בקטע הבא.

שדה נתונים סטטיסטיים של טבלה שם ה-API תיאור
מספר השורות row_count מספר השורות בטבלה. לפרטים נוספים, ראו מספר השורות.
המספר הממוצע של עמודות בכל שורה average_columns_per_row המספר הממוצע של עמודות בכל שורה בטבלה כולה. לפרטים נוספים ולדוגמה, ראו מספר העמודות הממוצע בכל שורה .
המספר הממוצע של תאים לכל עמודה average_cells_per_column המספר הממוצע של התאים שמאוחסנים בכל העמודות ובכל השורות. פרטים נוספים מופיעים במאמר מספר התאים הממוצע לכל עמודה.
נתונים לוגיים בבייטים logical_data_bytes כמות המקום שהטבלה תופסת. פרטים נוספים מופיעים במאמר בנושא נתונים לוגיים בבייט.

הנתונים הסטטיסטיים של הטבלה כוללים גם את השדות הבאים לכל קבוצת עמודות בטבלה.

שדה של נתונים סטטיסטיים של קבוצת עמודות שם ה-API תיאור
המספר הממוצע של עמודות בכל שורה average_columns_per_row המספר הממוצע של עמודות לכל שורה במשפחת העמודות. פרטים ודוגמה זמינים במאמר מספר העמודות הממוצע בכל שורה.
המספר הממוצע של תאים לכל עמודה average_cells_per_column מספר התאים בכל עמודה, כממוצע של כל השורות שיש בהן עמודות במשפחת העמודות. פרטים ודוגמה מופיעים במאמר מספר התאים הממוצע בכל עמודה.
נתונים לוגיים בבייטים logical_data_bytes כמות המקום שתופסת קבוצת העמודות. פרטים נוספים מופיעים במאמר בנושא נתונים לוגיים בבייט.

פרטים על שדות של נתונים סטטיסטיים בטבלה

מספר השורות

מספר השורות הוא מספר השורות בטבלה. כל שורה מזוהה באמצעות מפתח השורה שלה.

המספר הממוצע של עמודות בכל שורה

כדי לחשב את מספר העמודות הממוצע בכל שורה בטבלה, Bigtable סופר את מספר העמודות בכל הטבלה ומחלק את הערך הזה במספר השורות בטבלה.

לדוגמה, נניח שיש לכם את הטבלה הבאה. בשורה הראשונה יש שלוש עמודות, ובשורה השנייה יש שתי עמודות.

מפתח שורה קבוצת העמודות family-A קבוצת העמודות family-B
מפתח שורה 1 family-A:qualifier-W family-A:qualifier-X family-B:qualifier-Y
מפתח שורה 2 family-A:qualifier-W family-B:qualifier-Z

בטבלה יש חמש עמודות ושתי שורות, ולכן מספר העמודות הממוצע לכל שורה הוא 2.5.

הנתון הסטטיסטי הזה בטבלה נותן לכם מושג כללי לגבי המבנה של הטבלה: האם היא גבוהה וצרה (מעט עמודות בכל שורה) או נמוכה ורחבה (הרבה עמודות בכל שורה).

המספר הממוצע של תאים לכל עמודה

כדי לקבל את המספר הממוצע של תאים לכל עמודה בטבלה, Bigtable מחשב את המספר הכולל של התאים שמאוחסנים בטבלה ומחלק אותו במספר העמודות בטבלה.

בהתאם לעיצוב הסכימה ולמדיניות איסוף האשפה שלך, הטבלה שלך עשויה להכיל מספר תאים בעמודה, או שהיא עשויה להכיל רק אחד. מספר התאים שאפשר לאחסן מוגבל על ידי מגבלות גודל הנתונים שמפורטות בדף 'מכסות ומגבלות' בקטע גודל הנתונים בטבלאות.

אם המספר הזה גבוה מהצפוי, כדאי לבדוק את הכללים של איסוף האשפה כדי לראות אם אתם שומרים יותר תאים ממה שאתם צריכים. אפשר גם לשאול אם צריך לשנות את הסכימה ואת דפוסי הכתיבה.

נתונים לוגיים בבייטים (טבלה)

הערך הזה מייצג את המספר המשוער של בייטים שיידרשו כדי לקרוא את כל הטבלה. הנתון הסטטיסטי הזה בטבלה נותן מושג לגבי מספר הבייטים שמאוחסנים בטבלה. הידיעה מהו גודל הנתונים הלוגיים בבייט יכולה לעזור לכם להבין את ההשפעה של הדחיסה על הטבלה. לדוגמה, אם גודל הטבלה שדווח ב-Cloud Monitoring זהה לנתונים הלוגיים בבייטים של הטבלה או גדול מהם, יכול להיות שאתם מאחסנים את הנתונים בפורמט שלא ניתן לדחיסה בקלות.

פרטים על שדה הנתונים הסטטיסטיים של קבוצת העמודות

הנתונים הסטטיסטיים של טבלה כוללים את השדות הבאים לכל קבוצת עמודות בטבלה.

המספר הממוצע של עמודות בכל שורה

המספר הזה מחושב על ידי חילוק של מספר העמודות במשפחת העמודות במספר השורות בטבלה.

לדוגמה, נניח שיש לכם את הטבלה הבאה. בטבלה יש שלוש שורות עם עמודות במשפחות העמודות family-A ו-family-B.

מפתח שורה קבוצת העמודות family-A קבוצת העמודות family-B
מפתח שורה 1 family-A:qualifier-W family-A:qualifier-X family-B:qualifier-Y
מפתח שורה 2 family-A:qualifier-W
מפתח שורה 3 family-A:qualifier-W family-A:qualifier-X family-B:qualifier-Y family-B:qualifier-Z

במשפחת העמודות family-A יש חמש עמודות בטבלה. אם מחלקים את המספר הזה בשלוש שורות, מקבלים שמספר התאים הממוצע לכל עמודה ב-family-A הוא 1.67 (מעוגל כאן לשתי ספרות אחרי הנקודה העשרונית).

במשפחת העמודות family-B יש סך של שלוש עמודות בטבלה. אם מחלקים את זה בשלוש שורות, המספר הממוצע של עמודות לכל שורה עבור family-A הוא 1.

המספר הממוצע של תאים לכל עמודה

כדי לקבוע את המספר הממוצע של התאים בעמודה של משפחת עמודות, Bigtable סופר את כל התאים במשפחת העמודות בכל השורות בטבלה ומחלק את המספר הזה במספר השורות בטבלה.

לדוגמה, נניח שיש לכם את השורות הבאות במשפחת העמודות family-D.

מפתח שורה קבוצת העמודות family-D
מפתח שורה 1 family-D:qualifier-W (3 cells) ‫family-D:qualifier-X (תא אחד)
מפתח שורה 2 ‫family-D:qualifier-X (10 cells)
מפתח שורה 3 family-D:qualifier-W (7 cells) ‫family-D:qualifier-Y (6 תאים)

מספר התאים במשפחת העמודות הוא 3 + 1 + 10 + 7 + 6 = 27. הערך הזה חלקי 3 (מספר השורות) אומר שלקבוצת העמודות family-D יש ממוצע של 9 תאים לכל עמודה.

נתונים לוגיים בבייטים (קבוצת עמודות)

הנתונים הלוגיים בבייט משקפים את הנפח שתופסת קבוצת העמודות. הערך הזה הוא בערך מספר הבייטים שצריך לקרוא כדי לקבל את כל הנתונים בעמודה בזמן שהוחזרו נתוני הטבלה.

דוגמה לשימוש ב-CLI של gcloud

כדי לקבל נתונים סטטיסטיים של טבלה בשם sample-table, משתמשים בפקודה bigtable instances table describe:

gcloud bigtable instances tables describe TABLE_ID \
    --instance=INSTANCE_ID --view stats

מחליפים את מה שכתוב בשדות הבאים:

  • TABLE_ID: המזהה הקבוע של הטבלה
  • INSTANCE_ID: המזהה הקבוע של המכונה

הפלט אמור להיראות כך:

  columnFamilies:
    my-family:
     stats:
       averageCellsPerColumn: 12.34
       averageColumnsPerRow: 56.78
       logicalDataBytes: 314159
  name: projects/my-project/instances/INSTANCE_ID/tables/TABLE_ID
  stats:
    averageCellsPerColumn: 12.34
    averageColumnsPerRow: 56.78
    logicalDataBytes: 314159
    rowCount: 271828

המאמרים הבאים