התאמה נכונה

התכונה התאמה נכונה משתמשת ברמזים למשאבים של Apache Beam כדי להתאים אישית את משאבי העובדים לצינור עיבוד נתונים. האפשרות לטרגט כמה משאבים שונים לשלבים ספציפיים בצינור עיבוד הנתונים מספקת גמישות ויכולת נוספות לצינור עיבוד הנתונים, וגם פוטנציאל לחיסכון בעלויות. אפשר להקצות משאבים יקרים יותר לשלבים בצינור עיבוד הנתונים שדורשים אותם, ומשאבים זולים יותר לשלבים אחרים בצינור עיבוד הנתונים. אפשר להשתמש בהתאמה הנכונה כדי לציין דרישות משאבים לצינור עיבוד נתונים שלם או לשלבים ספציפיים בצינור עיבוד הנתונים.

תמיכה ומגבלות

  • יש תמיכה ברמזים למשאבים ב-Apache Beam Java וב-Python SDK, בגרסאות 2.31.0 ואילך.
  • התאמה נכונה נתמכת בצינורות להעלאה בכמות גדולה.
  • התאמה נכונה נתמכת בצינורות סטרימינג עם שינוי גודל אוטומטי אופקי מופעל.

  • התאמה נכונה תומכת ב-Dataflow Prime.

  • התאמה נכונה לא תומכת ב-FlexRS.

  • כשמשתמשים בהתאמה לזרימה מימין לשמאל, לא משתמשים בworker_accelerator service option.

  • כשמשתמשים ב-Dataflow Prime, אי אפשר להשתמש בבחירה אוטומטית של מכונות וירטואליות.

הפעלה של התאמה נכונה

כדי להפעיל התאמה נכונה, משתמשים באחת או יותר מרמזים זמינים למשאבים בצינור. כשמשתמשים ברמז למשאב בצינור, התאמה נכונה מופעלת באופן אוטומטי. מידע נוסף זמין בקטע שימוש בהצעות למשאבים במסמך הזה.

רמזים זמינים למשאבים

אלה רמזים למשאבים שזמינים:

רמז למשאב תיאור
min_ram

כמות ה-RAM המינימלית בגיגה-בייט להקצאה לעובדים. ‫Dataflow משתמש בערך הזה כגבול תחתון כשמקצים זיכרון לעובדים חדשים (שינוי קנה מידה אופקי) או לעובדים קיימים (שינוי קנה מידה אנכי).

לדוגמה:

min_ram=NUMBERGB
  • מחליפים את NUMBER בערך המינימלי של זיכרון העובד שנדרש לצינור או לשלב בצינור.
  • min_ram הוא מפרט מצטבר לכל עובד. הוא לא מפרט לכל vCPU. לדוגמה, אם מגדירים את min_ram=15GB, ‏ Dataflow מגדיר את הזיכרון המצטבר שזמין בכל המעבדים הווירטואליים בעובד ל-15GB לפחות.
cpu_count

מספר המעבדים הווירטואליים להקצאה לכל עובד. כשמשתמשים ברמז המשאבים הזה, Dataflow בוחר סוגי מכונות עם מספר ה-vCPU שצוין ועומדות בדרישות הזיכרון.

לדוגמה:

cpu_count=NUMBER
  • מחליפים את NUMBER במספר השלם של המעבדים הווירטואליים שנדרשים לצינור או לשלב בצינור לכל עובד.
accelerator

הקצאה של יחידות GPU שסופקה על ידי המשתמש, שמאפשרת לכם לשלוט בשימוש ביחידות GPU ובעלות שלהן בצינור העיבוד ובשלבים שלו. מציינים את הסוג והמספר של יחידות ה-GPU לצירוף לעובדי Dataflow כפרמטרים של הדגל.

לדוגמה:

accelerator="type:GPU_TYPE;count:GPU_COUNT;machine_type:MACHINE_TYPE;CONFIGURATION_OPTIONS"
  • מחליפים את GPU_TYPE בסוג ה-GPU שרוצים להשתמש בו. רשימה של סוגי GPU שנתמכים ב-Dataflow זמינה במאמר תמיכה ב-GPU ב-Dataflow.
  • מחליפים את GPU_COUNT במספר המעבדים הגרפיים שרוצים להשתמש בהם.
  • אופציונלי: מחליפים את MACHINE_TYPE בסוג המכונה שרוצים להשתמש בה עם יחידות ה-GPU.
    • סוג המכונה צריך להיות תואם לסוג ה-GPU שנבחר. פרטים על סוגי ה-GPU וסוגי המכונות התואמים להם מופיעים במאמר פלטפורמות GPU.
    • אם מציינים סוג מכונה גם בaccelerator רמז המשאב וגם באפשרות צינור עיבוד הנתונים של סוג מכונת העובד, אז אפשרות צינור עיבוד הנתונים מתעלמת במהלך התאמה נכונה.
  • כדי להשתמש ב-GPU של NVIDIA עם Dataflow, צריך להגדיר את אפשרות ההגדרה install-nvidia-driver.
    • יש תמיכה באפשרויות של גרסת מנהל ההתקן default ו-latest.
    • אפשרות גרסת הדרייבר חייבת להיות זהה בכל צינור הנתונים, גם אם היא מושמטת. לא ניתן לשלב בין גרסה ללא מנהל התקן לבין גרסה של מנהל התקן default.

למידע נוסף על שימוש ביחידות GPU, אפשר לעיין במאמר בנושא יחידות GPU ב-Dataflow.

בחירה אוטומטית של מכונות וירטואליות לסוגי מכונות worker

כשמשתמשים ברמזים למשאבים min_ram או cpu_count בשלבים של צינור עיבוד נתונים שלא דורשים מאיצים, הגמישות של המופע (בחירת מכונה וירטואלית אוטומטית) מופעלת באופן אוטומטי. באמצעות התכונה 'בחירה אוטומטית של מכונות וירטואליות', העובדים מקבלים הקצאת משאבים מתוך מבחר של סוגי מכונות שעומדים בדרישות ה-RAM וה-CPU שלכם.

התכונה 'בחירה אוטומטית של מכונות וירטואליות' מייעלת את בחירת המכונות הווירטואליות בעיקר לצורך אמינות ולא לצורך ביצועים. המשמעות היא שאולי תהיה ירידה בביצועים בזמן השימוש בתכונה 'בחירת מכונה וירטואלית אוטומטית' כדי לשפר את האמינות של חלק מהמשימות המותאמות במיוחד. מומלץ לבדוק את התכונה 'בחירה אוטומטית של מכונות וירטואליות' בקבוצת משנה של המשימות הקיימות, לפני שפורסים אותה בהדרגה לכלל המשימות.

אם אתם משתמשים בשמירת מקום ב-Compute Engine עם התכונה 'בחירה אוטומטית של מכונות וירטואליות', חשוב לשים לב לנקודות הבאות:

מידע נוסף זמין במאמר גמישות בהזמנות של מכונות וירטואליות.

הוספת רמזים לגבי משאבים בתוך רמזים אחרים

הצעות לשיפור הביצועים של משאבים מוחלות על ההיררכיה של צינור הטרנספורמציה באופן הבא:

  • min_ram: הערך של טרנספורמציה מוערך כערך הרמז הגדול ביותר min_ram מבין הערכים שמוגדרים בטרנספורמציה עצמה ובכל ההורים שלה בהיררכיה של הטרנספורמציה.
    • לדוגמה: אם רמז להמרת נתונים פנימי מגדיר את min_ram ל-16GB, ורמז להמרת נתונים חיצוני בהיררכיה מגדיר את min_ram ל-32GB, רמז של 32GB ישמש לכל השלבים בהמרה כולה.
    • לדוגמה: אם רמז לשינוי פנימי מגדיר את min_ram ל-16GB, ורמז לשינוי חיצוני בהיררכיה מגדיר את min_ram ל-8GB, רמז של 8GB ישמש לכל השלבים בשינוי החיצוני שלא נכללים בשינוי הפנימי, ורמז של 16GB ישמש לכל השלבים בשינוי הפנימי.
  • accelerator: הערך הפנימי ביותר בהיררכיית הטרנספורמציה מקבל עדיפות.
    • דוגמה: אם רמז להמרת נתונים פנימית accelerator שונה מרמז להמרת נתונים חיצונית accelerator בהיררכיה, הרמז להמרת נתונים פנימית accelerator ישמש להמרת הנתונים הפנימית.

רמזים שמוגדרים לכל צינור העיבוד נחשבים כאילו הם מוגדרים בהמרת הנתונים החיצונית הנפרדת.

שימוש ברמזים למשאבים

אפשר להגדיר רמזים למשאבים בכל צינור הנתונים או בשלבים של צינור הנתונים.

הינטים של משאבים בפייפליין

אפשר להגדיר רמזים למשאבים בצינור כולו כשמריצים את צינור העיבוד משורת הפקודה.

הוראות להגדרת סביבת Python מופיעות במדריך ל-Python.

לדוגמה:

    python my_pipeline.py \
        --runner=DataflowRunner \
        --resource_hints=min_ram=numberGB \
        --resource_hints=cpu_count=number \
        --resource_hints=accelerator="type:type;count:number;install-nvidia-driver" \
        ...

רמזים לגבי משאבים בשלב של צינור עיבוד נתונים

אפשר להגדיר רמזים למשאבים בשלבים של צינורות (טרנספורמציות) באופן פרוגרמטי.

Java

כדי להתקין את Apache Beam SDK ל-Java, אפשר לעיין במאמר בנושא התקנה של Apache Beam SDK.

אפשר להגדיר רמזים למשאבים באופן פרוגרמטי בהמרות של צינורות באמצעות הסיווג ResourceHints.

בדוגמה הבאה אפשר לראות איך מגדירים רמזים למשאבים באופן פרוגרמטי בהמרות של צינור עיבוד נתונים.

pcoll.apply(MyCompositeTransform.of(...)
    .setResourceHints(
        ResourceHints.create()
            .withMinRam("15GB")
            .withCpuCount(8)
            .withAccelerator(
    "type:nvidia-l4;count:1;install-nvidia-driver")))

pcoll.apply(ParDo.of(new BigMemFn())
    .setResourceHints(
        ResourceHints.create()
          .withMinRam("30GB")
          .withCpuCount(16)))

כדי להגדיר רמזים למשאבים באופן פרוגרמטי בכל צינור הנתונים, משתמשים בממשק ResourceHintsOptions.

Python

כדי להתקין את Apache Beam SDK ל-Python, אפשר לעיין במאמר בנושא התקנה של Apache Beam SDK.

אפשר להגדיר רמזים למשאבים באופן פרוגרמטי בהמרות של צינורות באמצעות הסיווג PTransforms.with_resource_hints. מידע נוסף זמין במאמר בנושא ResourceHint class.

בדוגמה הבאה אפשר לראות איך מגדירים רמזים למשאבים באופן פרוגרמטי בהמרות של צינור עיבוד נתונים.

pcoll | MyPTransform().with_resource_hints(
    min_ram="4GB",
    cpu_count=8,
    accelerator="type:nvidia-tesla-l4;count:1;install-nvidia-driver")

pcoll | beam.ParDo(BigMemFn()).with_resource_hints(
    min_ram="30GB",
    cpu_count=16)

כדי להגדיר רמזים למשאבים בכל צינור העיבוד, משתמשים באפשרות --resource_hints של צינור העיבוד כשמריצים את צינור העיבוד. דוגמה מופיעה במאמר בנושא רמזים למשאבי צינורות.

המשך

אין תמיכה ברמזים למשאבים ב-Go.

תמיכה במספר מאיצים

בצינור, לטרנספורמציות שונות יכולות להיות הגדרות שונות של האצת החישובים. ההגדרות האלה כוללות הגדרות שדורשות סוגים שונים של מכונות. ההגדרות האלה של האצת טרנספורמציה מקבלות קדימות על פני ההגדרה ברמת צינור הנתונים, אם היא סופקה.

התאמה ומיזוג מימין

במקרים מסוימים, טרנספורמציות שהוגדרו עם רמזים שונים למשאבים יכולות להתבצע על עובדים באותו מאגר עובדים, כחלק מהתהליך של אופטימיזציה של מיזוג. כשממזגים טרנספורמציות, Dataflow מריץ אותן בסביבה שעומדת בדרישות של איחוד רמזי המשאבים שהוגדרו בטרנספורמציות. במקרים מסוימים, זה כולל את כל הצינור.

אם אי אפשר למזג רמזים למשאבים, לא מתבצע מיזוג. לדוגמה, אי אפשר למזג רמזים לגבי משאבים של GPU שונים, ולכן לא ניתן לבצע מיזוג של טרנספורמציות כאלה.

אפשר גם למנוע מיזוג על ידי הוספת פעולה לצינור העיבוד שמאלצת את Dataflow ליצור PCollection ביניים. האפשרות הזו שימושית במיוחד כשמנסים לבודד משאבים יקרים כמו מעבדי GPU או מכונות עם זיכרון גבוה משלבים איטיים או משלבים שדורשים הרבה משאבי מחשוב ולא צריכים את המשאבים המיוחדים האלה. במקרים כאלה, יכול להיות שיהיה כדאי לכפות פיצול של המיזוג בין השלבים האיטיים שמוגבלים על ידי המעבד לבין השלבים שדורשים שימוש במעבדים גרפיים יקרים או במכונות עם זיכרון גבוה, ולשלם את העלות של יצירת חומרים שקשורה לפיצול המיזוג. מידע נוסף זמין במאמר בנושא מניעת מיזוג.

התאמה של סטרימינג

במשימות סטרימינג, אפשר להפעיל התאמה נכונה על ידי הגדרת אפשרות הצינור --experiments=enable_streaming_rightfitting.

התאמה נכונה יכולה לשפר את הביצועים של צינור העיבוד אם הוא כולל שלבים עם דרישות שונות של משאבים.

דוגמה: צינור עם שלב שדורש הרבה משאבי CPU ושלב שדורש GPU

דוגמה לצינור עיבוד נתונים שיכול להפיק תועלת מהתאמה נכונה היא צינור שמבצע שלב שדורש הרבה משאבי CPU, ואחריו שלב שדורש GPU. אם לא מתאימים את הגודל של מאגר העובדים, צריך להגדיר מאגר עובדים יחיד של GPU כדי להריץ את כל שלבי צינור עיבוד הנתונים, כולל השלב שדורש הרבה משאבי CPU. זה עלול להוביל לניצול חלקי של משאבי ה-GPU כשמאגר העובדים מבצע את השלב שדורש הרבה משאבי CPU.

אם האפשרות 'התאמה נכונה' מופעלת ורמז למשאב מוחל על השלב שדורש GPU, צינור הנתונים ייצור שני מאגרי עובדים נפרדים, כך שהשלב שדורש CPU יבוצע על ידי מאגר העובדים של ה-CPU, והשלב שדורש GPU יבוצע על ידי מאגר העובדים של ה-GPU.

בפייפליין לדוגמה הזה, בטבלה של התאמה אוטומטית לעומס אפשר לראות שמאגר ה-workers שמבצע את השלב שדורש הרבה משאבי מעבד (CPU)‏, Pool 0, גדל בהתחלה ל-99 workers, ואחר כך קטן ל-87 workers. מאגר העובדים שמבצע את השלב שדורש GPU‏, Pool 1, מוגדל ל-13 עובדים:

טבלה שבה מוצגים שני מאגרי משאבים עם שינוי גודל אוטומטי.

בתרשים של ניצול המעבד (CPU) אפשר לראות שרמת הניצול של המעבד גבוהה באופן כללי בשני מאגרי העובדים:

תרשים שמציג את השימוש במעבד של עובדים משתי קבוצות שונות.

פתרון בעיות שקשורות להתאמה נכונה

בקטע הזה מפורטות הוראות לפתרון בעיות נפוצות שקשורות להתאמה נכונה.

הגדרות אישיות לא תקינות

כשמנסים להשתמש בהתאמה לימין, מופיעה השגיאה הבאה:

Workflow failed. Causes: One or more operations had an error: 'operation-OPERATION_ID':
[UNSUPPORTED_OPERATION] 'NUMBER vCpus with NUMBER MiB memory is
an invalid configuration for NUMBER count of 'GPU_TYPE' in family 'MACHINE_TYPE'.'.

השגיאה הזו מתרחשת כשסוג ה-GPU שנבחר לא תואם לסוג המכונה שנבחר. כדי לפתור את השגיאה הזו, צריך לבחור סוג GPU וסוג מכונה שתואמים זה לזה. פרטים על התאימות מופיעים במאמר בנושא פלטפורמות GPU.

איך לוודא שהאוזניות מתאימות

כדי לוודא שהתאמה נכונה מופעלת, אפשר לעיין במדדי שינוי הגודל האוטומטי ולוודא שהעמודה Worker pool מוצגת ומופיעים בה מאגרי משאבים שונים:

טבלה שבה מוצגת היסטוריית העובדים של צינור עם כמה מאגרי עובדים כשהאפשרות 'התאמה נכונה' מופעלת.

ביצועים של התאמת זכויות יוצרים לסטרימינג

יכול להיות שצינורות סטרימינג עם התאמה נכונה לא תמיד יניבו ביצועים טובים יותר מצינורות בלי התאמה נכונה. לדוגמה:

  1. הצינור משתמש ביותר עובדים
  2. זמן האחזור של המערכת ארוך יותר או שהתפוקה נמוכה יותר
  3. הגדלים של מאגרי העובדים משתנים בתדירות גבוהה יותר, או שלא מתייצבים

אם אתם רואים את זה בפייפליין שלכם, אתם יכולים להשבית את ההתאמה הנכונה על ידי הסרת --experiments=enable_streaming_rightfitting אפשרות הפייפליין. בנוסף, צינורות סטרימינג עם התאמה נכונה מופעלת באמצעות רמזים למשאבי האצה עשויים להשתמש ביותר מאיצי תוכנה מהרצוי. אם אתם רואים את זה בצינור עיבוד הנתונים שלכם, אתם יכולים להגדיר מספר מקסימלי של מאיצים שצינור עיבוד הנתונים משתמש בהם על ידי הגדרת אפשרות צינור עיבוד הנתונים --experiments=max_num_accelerators=NUM.