רכיב Solr אופציונלי של Managed Service for Apache Spark

אפשר להתקין רכיבים נוספים כמו Solr כשיוצרים אשכול של Managed Service for Apache Spark באמצעות התכונה Optional components. בדף הזה מוסבר על רכיב Solr.

רכיב Apache Solr הוא פלטפורמת חיפוש ארגונית בקוד פתוח. שרת Solr וממשק המשתמש האינטרנטי זמינים ביציאה 8983 בצמתים הראשיים של האשכול.

שמירת קובצי Solr: כברירת מחדל, Solr כותב וקורא את קובצי האינדקס וקובצי יומן העסקאות ב-HDFS. כדי לשמור קבצים של Solr, צריך להשתמש בנתיב של Cloud Storage בתור ספריית הבית של Solr. לשם כך, מגדירים את dataproc:solr.gcs.path מאפיין האשכול כשמתקינים את הרכיב.

התקנת הרכיב

מתקינים את הרכיב כשיוצרים אשכול של Managed Service for Apache Spark. אפשר להוסיף רכיבים לאשכולות שנוצרו באמצעות Managed Service for Apache Spark גרסה 1.3 ואילך.

בקטע גרסאות נתמכות של Managed Service for Apache Spark מפורטת גרסת הרכיב שכלולה בכל מהדורת תמונת Managed Service for Apache Spark.

מסוףGoogle Cloud

  1. במסוף Google Cloud , פותחים את הדף Create cluster.
  2. לוחצים על הגדרה נוספת כדי להרחיב את הקטע.
  3. עורכים את הרכיבים האופציונליים.
  4. בחלונית שנפתחת, מסמנים את התיבה לצד Solr ולוחצים על שמירה.

‫CLI של gcloud

כדי ליצור אשכול של Managed Service for Apache Spark שכולל את רכיב Solr, משתמשים בפקודה gcloud dataproc clusters create cluster-name עם הדגל --optional-components. בדוגמה של הפקודה שבהמשך נעשה שימוש בדגל האופציונלי properties כדי להגדיר נתיב ב-Cloud Storage כספריית הבית של Solr.

gcloud dataproc clusters create cluster-name \
    --region=region \
    --optional-components=SOLR \
    --enable-component-gateway \
    ... other flags
מוסיפים את מאפיין האשכול --properties="dataproc:solr.gcs.path=gs://bucket-name/" לפקודה gcloud dataproc clusters create כדי להגדיר קטגוריה של Cloud Storage שבה יישמרו מסמכי Solr (ספריית הבית של Solr).

‫API בארכיטקטורת REST

אפשר לציין את רכיב Solr באמצעות Dataproc API באמצעות SoftwareConfig.Component כחלק מבקשת clusters.create.