אפשר להתקין רכיבים נוספים כמו Zeppelin כשיוצרים אשכול של Managed Service for Apache Spark באמצעות התכונה Optional components (רכיבים אופציונליים). בדף הזה מתואר הרכיב Zeppelin.
רכיב Zeppelin Notebook הוא מחברת מבוססת-אינטרנט לניתוח נתונים אינטראקטיבי. ממשק האינטרנט של Zeppelin זמין ביציאה 8080 בצומת הראשי הראשון של האשכול.
כברירת מחדל, מחברות נשמרות ב-Cloud Storage בקטגוריית הביניים של Managed Service for Apache Spark, שמוגדרת על ידי המשתמש או נוצרת באופן אוטומטי כשיוצרים את האשכול. אפשר לשנות את המיקום בזמן יצירת האשכול באמצעות המאפיין zeppelin:zeppelin.notebook.gcs.dir.
התקנת הרכיב
מתקינים את הרכיב כשיוצרים אשכול של Managed Service for Apache Spark. אפשר להוסיף רכיבים לאשכולות שנוצרו באמצעות Managed Service for Apache Spark גרסה 1.3 ואילך.
במאמר גרסאות נתמכות של Dataproc מפורטת גרסת הרכיב שכלולה בכל מהדורה של תמונת Managed Service for Apache Spark.
מסוףGoogle Cloud
- במסוף Google Cloud , פותחים את הדף Create cluster.
- לוחצים על הגדרה נוספת כדי להרחיב את הקטע.
- עורכים את הרכיבים האופציונליים.
- בחלונית שנפתחת, מסמנים את תיבת הסימון Zeppelin Notebook ולוחצים על שמירה.
CLI של gcloud
כדי ליצור אשכול של Managed Service for Apache Spark שכולל את רכיב Zeppelin, משתמשים בפקודה gcloud dataproc clusters create cluster-name עם הדגל --optional-components.
gcloud dataproc clusters create cluster-name \ --optional-components=ZEPPELIN \ --region=region \ --enable-component-gateway \ ... other flags
API בארכיטקטורת REST
אפשר לציין את רכיב Zeppelin דרך Dataproc API באמצעות SoftwareConfig.Component כחלק מבקשת clusters.create.פתיחת מחברת Zeppelin
במאמר Viewing and Accessing Component Gateway URLs (צפייה בכתובות URL של Component Gateway וגישה אליהן) מוסבר איך ללחוץ על קישורים של Component Gateway במסוף Google Cloud כדי לפתוח את ממשק המשתמש של מחברת Zeppelin שפועל בצומת הראשי של האשכול בדפדפן המקומי.