Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

שימוש בקונטיינרים מותאמים אישית ב-Dataflow

אתם יכולים להתאים אישית את סביבת זמן הריצה של קוד המשתמש בצינורות Dataflow באמצעות קובץ אימג' מותאם אישית של קונטיינר. קונטיינרים מותאמים אישית נתמכים בצינורות עיבוד נתונים שמשתמשים ב-Portable Runner של Dataflow.

כשמפעילים מכונות וירטואליות של עובדים ב-Dataflow, המערכת משתמשת בקובצי אימג' של קונטיינרים של Docker כדי להפעיל תהליכי SDK בקונטיינרים בעובדים. כברירת מחדל, צינורות משתמשים בתמונה מוכנה מראש של Apache Beam. עם זאת, אתם יכולים לספק קובץ אימג' מותאם אישית של קונטיינר לעבודת Dataflow. כשמציינים תמונת קונטיינר בהתאמה אישית, Dataflow מפעיל עובדים ששולפים את התמונה שצוינה.

יכול להיות שתשתמשו במאגר מותאם אישית מהסיבות הבאות:

כדי לקצר את זמן ההפעלה של העובד, כדאי להתקין מראש את התלויות של צינור הנתונים.
התקנה מראש של יחסי תלות בצינורות שלא זמינים במאגרים ציבוריים.
התקנה מראש של יחסי תלות בצינורות העברת נתונים כשגישה למאגרים ציבוריים מושבתת. יכול להיות שהגישה מושבתת מסיבות אבטחה.
כדי לקצר את זמן ההפעלה של העובד, כדאי להכין מראש קבצים גדולים.
הפעלת תוכנת צד שלישי ברקע.
התאמה אישית של סביבת ההפעלה.

מידע נוסף על מאגרי תגים בהתאמה אישית ב-Apache Beam זמין במדריך למאגרי תגים בהתאמה אישית ב-Apache Beam. דוגמאות לצינורות עיבוד נתונים של Python שמשתמשים בקונטיינרים מותאמים אישית זמינות במאמר קונטיינרים מותאמים אישית ב-Dataflow.

שימוש בקונטיינרים מותאמים אישית ב-Dataflow קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.

השלבים הבאים

שימוש בקונטיינרים מותאמים אישית ב-Dataflow