רכיב Pig אופציונלי של Managed Service for Apache Spark

כשיוצרים אשכול של Managed Service for Apache Spark באמצעות התכונה רכיבים אופציונליים, אפשר להתקין רכיבים נוספים כמו Apache Pig. בדף הזה מתואר רכיב Pig, פלטפורמת קוד פתוח לניתוח מערכי נתונים גדולים.

התקנת הרכיב

מתקינים את הרכיב כשיוצרים אשכול של Managed Service for Apache Spark.

‫Apache Pig הוא רכיב אופציונלי ב-Managed Service for Apache Spark 2.3 ובגרסאות מאוחרות יותר של תמונות.

במאמר גרסאות נתמכות של Managed Service for Apache Spark מפורטות גרסאות הרכיבים שנכללות במהדורות האחרונות של תמונות Managed Service for Apache Spark.

מסוףGoogle Cloud

  1. במסוף Google Cloud , פותחים את הדף Create cluster.
  2. לוחצים על הגדרה נוספת כדי להרחיב את הקטע.
  3. עורכים את הרכיבים האופציונליים.
  4. בחלונית שנפתחת, מסמנים את התיבה Pig ולוחצים על שמירה.

‫CLI של gcloud

כדי ליצור אשכול Managed Service for Apache Spark שכולל את רכיב Pig, משתמשים בפקודה gcloud dataproc clusters create CLUSTER_NAME עם הדגל --optional-components (באמצעות גרסת תמונה 2.3 ואילך).

gcloud dataproc clusters create CLUSTER_NAME \
    --region=REGION \
    --optional-components=PIG \
    --image-version=2.3 \
    ... other flags

‫API בארכיטקטורת REST

אפשר לציין את רכיב Pig באמצעות Dataproc API באמצעות SoftwareConfig.Component כחלק מבקשת clusters.create.