"Managed Service for Apache Spark" is the new name for the product formerly known as "Dataproc on Compute Engine" (cluster deployment) and "Google Cloud Serverless for Apache Spark" (serverless deployment).

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

פתרון בעיות ביצירת אשכול

במסמך הזה מוסברות הודעות שגיאה נפוצות שמופיעות כשיוצרים אשכולות, ומופיעים בו טיפים לפתרון בעיות שקשורות ליצירת אשכולות.

הודעות שגיאה נפוצות שמופיעות כשיוצרים אשכול

למשתמש אין הרשאה לפעול כחשבון שירות

הגורם: לחשבון המשתמש שמנסה ליצור את אשכול Managed Service for Apache Spark אין את ההרשאות הנדרשות לשימוש בחשבון השירות שצוין. משתמשים ב-Managed Service for Apache Spark צריכים הרשאה ActAs בחשבון השירות כדי לפרוס משאבים של Managed Service for Apache Spark. ההרשאה הזו כלולה בתפקיד 'משתמש בחשבון שירות' (roles/iam.serviceAccountUser) (ראו תפקידים ב-Managed Service for Apache Spark).

פתרון: צריך לזהות את המשתמש או חשבון השירות שמנסה ליצור את אשכול Managed Service for Apache Spark. נותנים לחשבון המשתמש את התפקיד 'משתמש בחשבון שירות' (roles/iam.serviceAccountUser) בחשבון השירות שהאשכול מוגדר להשתמש בו (בדרך כלל, חשבון השירות של המכונה הווירטואלית של Managed Service for Apache Spark).
תם הזמן הקצוב לתפוגה של הפעולה: רק 0 מתוך 2 הצמתים הנדרשים של הנתונים או מנהלי הצמתים פועלים.

הגורם: צומת הבקרה לא יכול ליצור את האשכול כי הוא לא יכול לתקשר עם צמתי העובדים.

פתרון:
- בדיקת אזהרות לגבי כללי חומת האש
- מוודאים שכללי חומת האש הנכונים מוגדרים. מידע נוסף זמין במאמר סקירה כללית של כללי ברירת המחדל של חומת האש ב-Managed Service for Apache Spark.
- מבצעים בדיקת קישוריות במסוף Google Cloud כדי לקבוע מה חוסם את התקשורת בין הצמתים של הבקר והעובד.
ההרשאה compute.subnetworks.use שנדרשת ל-projects/{projectId}/regions/{region}/subnetworks/{subnetwork}

הגורם: השגיאה הזו יכולה להתרחש כשמנסים להגדיר אשכול של Managed Service for Apache Spark באמצעות רשת VPC בפרויקט אחר, ולחשבון השירות של סוכן השירות של Managed Service for Apache Spark אין את ההרשאות הנדרשות בפרויקט של ה-VPC המשותף שמארח את הרשת.

פתרון: פועלים לפי השלבים שמפורטים במאמר יצירת אשכול שמשתמש ברשת VPC בפרויקט אחר.
באזור projects/zones/{zone} אין מספיק משאבים זמינים כדי למלא את הבקשה (resource type:compute)

הגורם: באזור שבו משתמשים כדי ליצור את האשכול אין מספיק משאבים.

פתרון:
- משתמשים בתכונה Auto Zone placement של Managed Service for Apache Spark כדי ליצור את האשכול בכל אחד מהאזורים של האזור עם משאבים זמינים.
- יוצרים את האשכול באזור אחר.
שגיאות של חריגה מהמכסה

מכסת CPUS/CPUS_ALL_REGIONS לא מספיקה
מכסת DISKS_TOTAL_GB לא מספיקה
מכסת IN_USE_ADDRESSES לא מספיקה

הסיבה: הבקשה שלך למעבד, לדיסק או לכתובת IP חורגת מהמכסה הזמינה.

פתרון: שולחים בקשה להגדלת המכסה ממסוףGoogle Cloud .
פעולת האתחול נכשלה

הסיבה: פעולת האתחול שסופקה במהלך יצירת האשכול נכשלה בהתקנה.

פתרון:
- כדאי לעיין בשיקולים והנחיות לגבי פעולות אתחול.
- בודקים את יומני הפלט. בהודעת השגיאה אמור להיות קישור ליומנים ב-Cloud Storage.
האתחול של הצומת CLUSTER-NAME-m נכשל. ‫… See output in: <gs://PATH_TO_STARTUP_SCRIPT_OUTPUT>

הגורם: לא הייתה אפשרות לאתחל את צומת בקר האשכול של Managed Service for Apache Spark.

פתרון:
- בודקים את יומני הפלט של סקריפט לטעינה בזמן ההפעלה שמפורטים בהודעת השגיאה (gs://PATH_TO_STARTUP_SCRIPT_OUTPUT) ומוודאים מה הסיבה לכך שהאתחול של הצומת נכשל.
- הסיבות לכך יכולות להיות בעיות בהגדרת הרשת של אשכול Managed Service for Apache Spark והתקנה שנכשלה של יחסי תלות בחבילת Python.
- אם הבעיה לא נפתרה אחרי שבדקתם את היומנים של סקריפט ההפעלה, תקנתם בעיות בצד המשתמש וניסיתם שוב עם השהיה מעריכית לפני ניסיון חוזר (exponential backoff), פנו אל התמיכה של Google Cloud.
יצירת האשכול נכשלה: מרחב כתובות ה-IP מוצה

הסיבה: מרחב כתובות ה-IP שנדרש להקצאת צמתים של האשכול המבוקש לא זמין.

פתרון:
- ליצור אשכול עם פחות צמתים של worker, אבל עם סוג מכונה גדול יותר.
- יצירת אשכול ברשת משנה או ברשת אחרת.
- כדי לפנות מקום לכתובות IP, צריך לצמצם את השימוש ברשת.
- מחכים עד שיהיה מספיק מקום לכתובות IP ברשת.

הודעת שגיאה בסקריפט ההפעלה: למאגר REPO_NAME אין יותר קובץ Release

הסיבה: מאגר הגיבויים של Debian oldstable נמחק.

פתרון:

מוסיפים את הקוד הבא לפני הקוד שמריץ את apt-get בסקריפט האתחול.

oldstable=$(curl -s https://deb.debian.org/debian/dists/oldstable/Release | awk '/^Codename/ {print $2}');
stable=$(curl -s https://deb.debian.org/debian/dists/stable/Release | awk '/^Codename/ {print $2}');

matched_files="$(grep -rsil '\-backports' /etc/apt/sources.list*)"
if [[ -n "$matched_files" ]]; then
  for filename in "$matched_files"; do
    grep -e "$oldstable-backports" -e "$stable-backports" "$filename" || \
      sed -i -e 's/^.*-backports.*$//' "$filename"
  done
fi

הזמן הקצוב לתפוגה של ההמתנה לדיווח של מופע DATAPROC_CLUSTER_VM_NAME הסתיים או לא ניתן להגיע לרשת: dataproccontrol-REGION.googleapis.com

הסיבה: הודעות השגיאה האלה מציינות שהגדרת הרשת של אשכול Managed Service for Apache Spark לא הושלמה: יכול להיות שחסר מסלול לשער האינטרנט שמוגדר כברירת מחדל או כללי חומת אש.

פתרון:

כדי לפתור את הבעיה, אפשר ליצור את בדיקות הקישוריות הבאות:
- יצירת בדיקת קישוריות בין שתי מכונות וירטואליות של אשכולות Managed Service for Apache Spark. תוצאות הבדיקה הזו יעזרו לכם להבין אם כללי חומת האש של הרשת שלכם חלים על המכונות הווירטואליות של האשכול בצורה נכונה.
- יוצרים בדיקת קישוריות בין מכונה וירטואלית של אשכול Managed Service for Apache Spark לבין כתובת IP של API בקרה של Managed Service for Apache Spark. כדי לקבל את כתובת ה-IP הנוכחית של API הבקרה של Managed Service for Apache Spark, משתמשים בפקודה הבאה:
```
dig dataproccontrol-REGION.googleapis.com A
```
משתמשים באחת מכתובות ה-IPv4 בקטע התשובה של הפלט.

תוצאת בדיקת הקישוריות תעזור לכם להבין אם המסלול אל שער האינטרנט שמוגדר כברירת מחדל וחומת האש שמאפשרת יציאה מוגדרים בצורה תקינה.

על סמך התוצאות של בדיקות הקישוריות:
- מוסיפים נתיב לאינטרנט לרשת ה-VPC של האשכול: ‫0.0.0.0/0 ל-IPv4 ו- ‫::/0 ל-IPv6 עם ‫--next-hop-gateway=default-internet-gateway.
- מוסיפים כללים לחומת האש לצורך בקרת גישה.
שגיאה בגלל עדכון

הסיבה: האשכול קיבל עבודה שנשלחה לשירות Managed Service for Apache Spark, אבל לא הצליח להגדיל או להקטין את הקיבולת באופן ידני או באמצעות התאמה אוטומטית לעומס. גם הגדרת אשכול לא סטנדרטית יכולה לגרום לשגיאה הזו.

פתרון:
- איפוס אשכול: פותחים כרטיס תמיכה, כוללים קובץ tar של אבחון ומבקשים לאפס את האשכול למצב RUNNING.
- אשכול חדש: יוצרים מחדש את האשכול עם אותה הגדרה. הפתרון הזה יכול להיות מהיר יותר מאיפוס שמתבצע על ידי צוות התמיכה.

טיפים לפתרון בעיות באשכול

בקטע הזה מפורטת הדרכה נוספת לפתרון בעיות נפוצות שיכולות למנוע את היצירה של אשכולות Managed Service for Apache Spark.

כשקורה כשל בהקצאת אשכול של Managed Service for Apache Spark, בדרך כלל מוצגת הודעת שגיאה כללית או שהסטטוס הוא PENDING או PROVISIONING לפני הכשל. כדי לאבחן ולפתור בעיות שקשורות לכשל באשכול, צריך לבדוק את יומני האשכול ולהעריך נקודות כשל נפוצות.

תסמינים נפוצים

אלה התסמינים הנפוצים שקשורים לכשלים ביצירת אשכולות:

סטטוס האשכול נשאר PENDING או PROVISIONING למשך תקופה ממושכת.
האשכול עובר למצב ERROR.
שגיאות כלליות ב-API במהלך יצירת האשכול, כמו Operation timed out.
הודעות שגיאה שמופיעות ביומן או בתגובת ה-API, כמו:
- ‫RESOURCE_EXHAUSTED: קשורות למכסות של CPU, דיסק או כתובת IP
- Instance failed to start
- Permission denied
- Unable to connect to service_name.googleapis.com או Could not reach required Google APIs
- Connection refused או network unreachable
- שגיאות שקשורות לכשל בפעולות אתחול, כמו שגיאות בהפעלת סקריפט או קובץ שלא נמצא.

בדיקת יומני האשכול

שלב חשוב בתהליך אבחון כשלים ביצירת אשכולות הוא בדיקת יומני האשכולות המפורטים שזמינים ב-Cloud Logging.

עוברים אל Logs Explorer: פותחים את Logs Explorer במסוף Google Cloud .
סינון לפי אשכולות של Managed Service for Apache Spark:
- בתפריט הנפתח משאב, בוחרים באפשרות Cloud Managed Service for Apache Spark Cluster.
- מזינים את cluster_name ואת project_id. אפשר גם לסנן לפי location (אזור).
בדיקת רשומות ביומן:
- מחפשים הודעות ברמה ERROR או WARNING שמופיעות בסמוך לזמן שבו נכשלה יצירת האשכול.
- כדאי לשים לב ליומנים מרכיבי master-startup, worker-startup ו-agent כדי לקבל תובנות לגבי בעיות ברמת מכונת ה-VM או בסוכן של Managed Service for Apache Spark.
- כדי לקבל תובנות לגבי בעיות בזמן האתחול של מכונת ה-VM, מסננים את היומנים לפי resource.type="gce_instance" ומחפשים הודעות משמות המופעים שמשויכים לצמתי האשכול, כמו CLUSTER_NAME-m או CLUSTER_NAME-w-0. יומני מסוף סדרתי יכולים לחשוף בעיות בהגדרת הרשת, בעיות בדיסק וכשלים בסקריפטים שמתרחשים בשלב מוקדם במחזור החיים של מכונת ה-VM.

סיבות נפוצות לכשל באשכול וטיפים לפתרון בעיות

בקטע הזה מפורטות סיבות נפוצות לכך שיצירת אשכול של Managed Service for Apache Spark עלולה להיכשל, וטיפים לפתרון בעיות שיעזרו לכם לפתור בעיות שקשורות לאשכולות.

אין מספיק הרשאות IAM

חשבון השירות של המכונה הווירטואלית שבו משתמשים באשכול Managed Service for Apache Spark צריך לכלול תפקידי IAM מתאימים כדי להקצות מופעים של Compute Engine, לגשת לקטגוריות של Cloud Storage, לכתוב יומנים ולקיים אינטראקציה עם שירותים אחרים של Google Cloud .

תפקיד Worker נדרש: מוודאים שלחשבון השירות של מכונת ה-VM יש את התפקיד Managed Service for Apache Spark Worker ‏ (roles/dataproc.worker). התפקיד הזה כולל את ההרשאות המינימליות שנדרשות ל-Managed Service for Apache Spark כדי לנהל את משאבי האשכול.
הרשאות גישה לנתונים: אם העבודות קוראות מ-Cloud Storage או מ-BigQuery או כותבות לתוכם, לחשבון השירות צריכים להיות תפקידים שקשורים לכך, כמו Storage Object Viewer,‏ Storage Object Creator או Storage Object Admin ל-Cloud Storage, או BigQuery Data Viewer או BigQuery Editor ל-BigQuery.
הרשאות רישום ביומן: לחשבון השירות צריך להיות תפקיד עם ההרשאות הנדרשות לכתיבת יומנים ב-Cloud Logging, כמו התפקיד Logging Writer.

טיפים לפתרון בעיות:

זיהוי חשבון השירות: קובעים את חשבון השירות של המכונה הווירטואלית שהוגדר לשימוש באשכול. אם לא מציינים חשבון שירות, ברירת המחדל היא חשבון השירות שמוגדר כברירת מחדל ב-Compute Engine.
בודקים את התפקידים ב-IAM: במסוף Google Cloud , עוברים לדף IAM & Admin > IAM, מוצאים את חשבון השירות של מכונת ה-VM של האשכול ומוודאים שיש לו את התפקידים הנדרשים לפעולות באשכול. מעניקים את התפקידים החסרים.

חריגה ממכסות משאבים

אשכולות של Managed Service for Apache Spark צורכים משאבים מ-Compute Engine ומ Google Cloud שירותים אחרים. חריגה מהמכסות של הפרויקט או האזור עלולה לגרום לכשלים ביצירת אשכולות.

מכסות נפוצות של Managed Service for Apache Spark שכדאי לבדוק:
- CPUs (אזורי)
- DISKS_TOTAL_GB (אזורי)
- ‫IN_USE_ADDRESSES (אזוריות לכתובות IP פנימיות, גלובליות לכתובות IP חיצוניות)
- מכסות של Dataproc API, כמו ClusterOperationRequestsPerMinutePerProjectPerRegion
  כדי להשוות בין המכסות של Managed Service for Apache Spark לבין המכסות של Managed Service for Apache Spark, אפשר לעיין במאמר בנושא מכסות של Managed Service for Apache Spark.

טיפים לפתרון בעיות:

בדיקת המכסות: נכנסים לדף IAM & Admin > IAM במסוף Google Cloud . מסננים לפי 'שירות' כדי לראות את Compute Engine API ו-Dataproc API.
בדיקת השימוש לעומת המגבלה: זיהוי מכסות שהגיעו למגבלות או מתקרבות אליהן.
במקרה הצורך, מבקשים להגדיל את המכסה.

בעיות בהגדרת הרשת

בעיות בהגדרת הרשת, כמו הגדרה שגויה של רשת VPC, רשת משנה, חומת אש או DNS, הן סיבה נפוצה לכשלים ביצירת אשכולות. מופעי האשכול צריכים להיות מסוגלים לתקשר זה עם זה ועם Google APIs.

רשת VPC ותת-רשת:
- מוודאים שרשת ה-VPC והרשת המשנית של האשכול קיימות ומוגדרות בצורה נכונה.
- מוודאים שיש מספיק כתובות IP זמינות ברשת המשנה.
גישה פרטית ל-Google (PGA): אם למכונות וירטואליות באשכול יש כתובות IP פנימיות והן צריכות להגיע לממשקי Google API ל-Cloud Storage, ל-Cloud Logging ולפעולות אחרות, צריך לוודא שגישה פרטית ל-Google מופעלת ברשת המשנה. כברירת מחדל, מכונות וירטואליות (VM) באשכולות של Managed Service for Apache Spark שנוצרו עם גרסאות תמונה 2.2 ומעלה מוקצות עם כתובות IP פנימיות בלבד, כאשר הגישה הפרטית ל-Google מופעלת ברשת המשנה האזורית של האשכול.
‫Private Service Connect ‏(PSC): אם אתם משתמשים ב-Private Service Connect כדי לגשת לממשקי Google API, ודאו שנקודות הקצה (endpoints) של Private Service Connect שנדרשות מוגדרות בצורה נכונה לממשקי Google API ש-Managed Service for Apache Spark מסתמך עליהם, כמו dataproc.googleapis.com,‏ storage.googleapis.com,‏ compute.googleapis.com ו-logging.googleapis.com. ערכי ה-DNS של ממשקי ה-API צריכים להתפרש ככתובות IP פרטיות. שימו לב: שימוש ב-Private Service Connect לא מבטל את הצורך בשימוש בקישור (peering) בין רשתות VPC כדי לתקשר עם רשתות VPC אחרות שמנוהלות על ידי לקוחות.
לפתרון בעיות מפורט ברשת Private Service Connect, אפשר לעיין במאמר בנושא רשת של אשכול Managed Service for Apache Spark עם Private Service Connect.
VPC Peering: אם האשכול מתקשר עם משאבים ברשתות VPC אחרות, כמו פרויקטים מארחים של VPC משותף או רשתות VPC אחרות של לקוחות, צריך לוודא ש-VPC Peering מוגדר בצורה נכונה ושהנתיבים מופצים.
כללי חומת אש:
- כללי ברירת מחדל: מוודאים שכללי ברירת המחדל של חומת האש, כמו allow-internal או allow-ssh, לא מגבילים מדי.
- כללים בהתאמה אישית: אם יש כללים מותאמים אישית לחומת האש, צריך לוודא שהם מאפשרים את נתיבי התקשורת הנדרשים:
  - תקשורת פנימית בתוך האשכול (בין צומתי -m לבין צומתי -w).
  - תעבורת נתונים יוצאת ממכונות וירטואליות באשכול אל ממשקי Google APIs, באמצעות כתובות IP ציבוריות או שער לאינטרנט, גישה פרטית ל-Google או נקודות קצה של Private Service Connect.
  - תנועה לכל מקורות הנתונים או השירותים החיצוניים שהעבודות שלכם תלויות בהם.
רזולוציית DNS: מוודאים שמופעים של אשכול יכולים לפתור נכון שמות DNS עבור Google APIs ושירותים פנימיים או חיצוניים.

טיפים לפתרון בעיות:

בדיקת הגדרות הרשת: בודקים את ההגדרות של רשת ה-VPC והרשת המשנית שבהן מתבצעת הפריסה של האשכול.
בדיקת כללי חומת האש: בודקים את כללי חומת האש ברשת ה-VPC או בפרויקט המארח של ה-VPC המשותף.
בודקים את הקישוריות: מפעילים מכונה וירטואלית זמנית ב-Compute Engine ברשת המשנה של האשכול ומבצעים את השלבים הבאים:
- ‫ping או curl לדומיינים חיצוניים של Google API, כמו storage.googleapis.com.
- ‫nslookup כדי לוודא שכתובות ה-IP הצפויות מתקבלות מפתרון ה-DNS (גישה פרטית ל-Google או Private Service Connect).
- מריצים Google Cloud בדיקות קישוריות כדי לאבחן נתיבים ממכונה וירטואלית לבדיקה לנקודות קצה רלוונטיות.

כשלים בפעולות אתחול

פעולות אתחול של Managed Service for Apache Spark הן סקריפטים שמופעלים במכונות וירטואליות של אשכול במהלך יצירת האשכול. שגיאות בסקריפטים האלה יכולות למנוע את הפעלת האשכול.

טיפים לפתרון בעיות:

בדיקת יומנים לאיתור שגיאות בפעולת האתחול: מחפשים ב-Cloud Logging רשומות ביומן שקשורות ל-init-actions או ל-startup-script עבור מופעי האשכול.
בדיקת נתיבי הסקריפטים וההרשאות: מוודאים שסקריפטים של פעולות אתחול ממוקמים בצורה נכונה ב-Cloud Storage, ושלחשבון השירות של מכונת ה-VM באשכול יש את התפקיד Storage Object Viewer שנדרש לקריאת סקריפטים של Cloud Storage.
ניפוי באגים בלוגיקה של הסקריפט: בודקים את הלוגיקה של הסקריפט במכונה וירטואלית נפרדת של Compute Engine שמדמה את סביבת האשכול כדי לזהות שגיאות. מוסיפים רישום מפורט ביומן לסקריפט.

זמינות של משאבים אזוריים (מלאי חסר)

מדי פעם, סוג מכונה או משאב באזור או בתחום (zone) לא זמינים באופן זמני (מלאי אזל). בדרך כלל, התוצאה היא שגיאות RESOURCE_EXHAUSTED שלא קשורות לבעיות במכסת הפרויקט.

טיפים לפתרון בעיות:

מנסים להשתמש באזור או באזור משנה אחרים: מנסים ליצור את האשכול באזור אחר באותו אזור, או באזור אחר.
שימוש במיקום אוטומטי של אזור: אפשר להשתמש בתכונה מיקום אוטומטי של אזור של Managed Service for Apache Spark כדי לבחור באופן אוטומטי אזור עם קיבולת.
שינוי סוג המכונה: אם משתמשים בסוג מכונה מותאם אישית או ייעודי, כדאי לנסות סוג מכונה רגיל כדי לבדוק אם זה פותר את הבעיה.

פנייה ל-Cloud Customer Care

אם אתם ממשיכים להיתקל בבעיות שקשורות לכשל באשכול, אתם יכולים לפנות אל Cloud Customer Care. תארו את הבעיה בכשל באשכול ואת השלבים לפתרון הבעיה שביצעתם. בנוסף, עליך לספק את הפרטים הבאים:

נתוני אבחון של אשכול

פלט מהפקודה הבאה:

  gcloud dataproc clusters describe CLUSTER_NAME \
      --region=REGION

יומנים שיוצאו עבור האשכול שנכשל.

שימוש בכלי `gcpdiag`

‫gcpdiag הוא כלי בקוד פתוח. זה לא מוצר נתמך רשמית של Google Cloud . אפשר להשתמש בgcpdiagכלי כדי לזהות ולפתור Google Cloudבעיות בפרויקט. מידע נוסף זמין בפרויקט gcpdiag ב-GitHub.

הכלי gcpdiag עוזר לכם לגלות את הבעיות הבאות שקשורות ליצירת אשכולות של Managed Service for Apache Spark באמצעות הבדיקות הבאות:

שגיאות של חוסר במלאי: הערכת יומנים ב-Logs Explorer כדי לגלות חוסר במלאי באזורים ובאזורי זמינות.
מכסה לא מספיקה: בדיקה של זמינות המכסה בפרויקט של אשכול Managed Service for Apache Spark.
הגדרת רשת לא מלאה: מבצע בדיקות קישוריות לרשת, כולל בדיקות של כללי חומת האש הנדרשים והגדרות של כתובות IP חיצוניות ופנימיות. אם האשכול נמחק, הכלי gcpdiag לא יכול לבצע בדיקה של קישוריות הרשת.
הגדרה שגויה של פרויקטים: בדיקה של חשבונות שירות חוצי-פרויקטים ובדיקה של תפקידים נוספים ושל אכיפת מדיניות הארגון.
תפקידי IAM חסרים ברשת של ענן וירטואלי פרטי (VPC) משותף: אם אשכול Managed Service for Apache Spark משתמש ברשת של ענן וירטואלי פרטי (VPC) משותף, המערכת בודקת אם נוספו תפקידים נדרשים של חשבון שירות.
כשלים בפעולות אתחול: בדיקת יומנים בכלי Logs Explorer כדי לגלות כשלים ופסק זמן בסקריפטים של פעולות אתחול.

רשימה של gcpdiag שלבי Dataproc, כולל שלבים ליצירת אשכול, מופיעה במאמר בנושא שלבים ב-Managed Service for Apache Spark.

מריצים את הפקודה `gcpdiag`.

אפשר להריץ את הפקודה gcpdiag מ-Cloud Shell במסוףGoogle Cloud או בתוך קונטיינר Docker.

מסוףGoogle Cloud

משלימים את הפקודה הבאה ואז מעתיקים אותה.

gcpdiag runbook managed-spark/cluster-creation \
    --parameter project_id=PROJECT_ID \
    --parameter cluster_name=CLUSTER_NAME \
    --parameter OPTIONAL_FLAGS

פותחים את Google Cloud המסוף ומפעילים את Cloud Shell.

פתיחת מסוף Cloud

מדביקים את הפקודה שהועתקה.
מריצים את הפקודה gcpdiag, שמורידה את קובץ האימג' של Docker‏ gcpdiag, ואז מבצעת בדיקות אבחון. אם רלוונטי, פועלים לפי ההוראות שמופיעות בפלט כדי לתקן את הבדיקות שנכשלו.

Docker

אפשר להריץ את gcpdiag באמצעות wrapper שמפעיל את gcpdiag בקונטיינר של Docker. צריך להתקין את Docker או את Podman.

מעתיקים את הפקודה הבאה ומריצים אותה בתחנת העבודה המקומית.
```
curl https://gcpdiag.dev/gcpdiag.sh >gcpdiag && chmod +x gcpdiag
```

מריצים את הפקודה gcpdiag.

./gcpdiag runbook managed-spark/cluster-creation \
    --parameter project_id=PROJECT_ID \
    --parameter cluster_name=CLUSTER_NAME \
    --parameter OPTIONAL_FLAGS

הצגת הפרמטרים הזמינים של קובץ ה-runbook הזה.

מחליפים את מה שכתוב בשדות הבאים:

‫PROJECT_ID: מזהה הפרויקט שמכיל את המשאב
‫CLUSTER_NAME: השם של אשכול היעד של Managed Service for Apache Spark בפרויקט
‫OPTIONAL_PARAMETERS: מוסיפים פרמטר אופציונלי אחד או יותר מהפרמטרים הבאים. חובה לציין את הפרמטרים האלה אם האשכול נמחק.
- ‫cluster_uuid: ה-UUID של אשכול היעד של Managed Service for Apache Spark בפרויקט
- ‫service_account: חשבון השירות של ה-VM באשכול Managed Service for Apache Spark
- ‫subnetwork: הנתיב המלא של ה-URI של רשת המשנה של אשכול Managed Service for Apache Spark
- ‫internal_ip_only: True או False
- ‫cross_project: מזהה הפרויקט אם אשכול Managed Service for Apache Spark משתמש בחשבון שירות של מכונה וירטואלית בפרויקט אחר

דגלים שימושיים:

‫--universe-domain: אם רלוונטי, הדומיין של Trusted Partner Sovereign Cloud שמארח את המשאב
‫--parameter או -p: פרמטרים של Runbook

רשימה ותיאור של כל הדגלים של הכלי gcpdiag מופיעים במאמר הוראות לשימוש ב-gcpdiag.

המאמרים הבאים

מידע נוסף על כלי המעקב ופתרון הבעיות של Managed Service for Apache Spark
איך מאבחנים אשכולות של Managed Service for Apache Spark
מידע נוסף מופיע במסמך שאלות נפוצות בנושא Managed Service for Apache Spark .

פתרון בעיות ביצירת אשכול קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.

הודעות שגיאה נפוצות שמופיעות כשיוצרים אשכול

טיפים לפתרון בעיות באשכול

תסמינים נפוצים

בדיקת יומני האשכול

סיבות נפוצות לכשל באשכול וטיפים לפתרון בעיות

אין מספיק הרשאות IAM

חריגה ממכסות משאבים

בעיות בהגדרת הרשת

כשלים בפעולות אתחול

זמינות של משאבים אזוריים (מלאי חסר)

פנייה ל-Cloud Customer Care

שימוש בכלי gcpdiag

מריצים את הפקודה gcpdiag.

מסוףGoogle Cloud

Docker

המאמרים הבאים

פתרון בעיות ביצירת אשכול

שימוש בכלי `gcpdiag`

מריצים את הפקודה `gcpdiag`.