במסמך הזה מוסברות הודעות שגיאה נפוצות שמופיעות כשיוצרים אשכולות, ומופיעים בו טיפים לפתרון בעיות שקשורות ליצירת אשכולות.
הודעות שגיאה נפוצות שמופיעות כשיוצרים אשכול
למשתמש אין הרשאה לפעול כחשבון שירות
הגורם: לחשבון המשתמש שמנסה ליצור את אשכול Managed Service for Apache Spark אין את ההרשאות הנדרשות לשימוש בחשבון השירות שצוין. משתמשים ב-Managed Service for Apache Spark צריכים הרשאה
ActAsבחשבון השירות כדי לפרוס משאבים של Managed Service for Apache Spark. ההרשאה הזו כלולה בתפקיד 'משתמש בחשבון שירות' (roles/iam.serviceAccountUser) (ראו תפקידים ב-Managed Service for Apache Spark).פתרון: צריך לזהות את המשתמש או חשבון השירות שמנסה ליצור את אשכול Managed Service for Apache Spark. נותנים לחשבון המשתמש את התפקיד 'משתמש בחשבון שירות' (
roles/iam.serviceAccountUser) בחשבון השירות שהאשכול מוגדר להשתמש בו (בדרך כלל, חשבון השירות של המכונה הווירטואלית של Managed Service for Apache Spark).תם הזמן הקצוב לתפוגה של הפעולה: רק 0 מתוך 2 הצמתים הנדרשים של הנתונים או מנהלי הצמתים פועלים.
הגורם: צומת הבקרה לא יכול ליצור את האשכול כי הוא לא יכול לתקשר עם צמתי העובדים.
פתרון:
- בדיקת אזהרות לגבי כללי חומת האש
- מוודאים שכללי חומת האש הנכונים מוגדרים. מידע נוסף זמין במאמר סקירה כללית של כללי ברירת המחדל של חומת האש ב-Managed Service for Apache Spark.
- מבצעים בדיקת קישוריות במסוף Google Cloud כדי לקבוע מה חוסם את התקשורת בין הצמתים של הבקר והעובד.
ההרשאה
compute.subnetworks.useשנדרשת ל-projects/{projectId}/regions/{region}/subnetworks/{subnetwork}הגורם: השגיאה הזו יכולה להתרחש כשמנסים להגדיר אשכול של Managed Service for Apache Spark באמצעות רשת VPC בפרויקט אחר, ולחשבון השירות של סוכן השירות של Managed Service for Apache Spark אין את ההרשאות הנדרשות בפרויקט של ה-VPC המשותף שמארח את הרשת.
פתרון: פועלים לפי השלבים שמפורטים במאמר יצירת אשכול שמשתמש ברשת VPC בפרויקט אחר.
באזור
projects/zones/{zone}אין מספיק משאבים זמינים כדי למלא את הבקשה(resource type:compute)הגורם: באזור שבו משתמשים כדי ליצור את האשכול אין מספיק משאבים.
פתרון:
- משתמשים בתכונה Auto Zone placement של Managed Service for Apache Spark כדי ליצור את האשכול בכל אחד מהאזורים של האזור עם משאבים זמינים.
- יוצרים את האשכול באזור אחר.
שגיאות של חריגה מהמכסה
מכסת CPUS/CPUS_ALL_REGIONS לא מספיקה
מכסת DISKS_TOTAL_GB לא מספיקה
מכסת IN_USE_ADDRESSES לא מספיקההסיבה: הבקשה שלך למעבד, לדיסק או לכתובת IP חורגת מהמכסה הזמינה.
פתרון: שולחים בקשה להגדלת המכסה ממסוףGoogle Cloud .
פעולת האתחול נכשלה
הסיבה: פעולת האתחול שסופקה במהלך יצירת האשכול נכשלה בהתקנה.
פתרון:
- כדאי לעיין בשיקולים והנחיות לגבי פעולות אתחול.
- בודקים את יומני הפלט. בהודעת השגיאה אמור להיות קישור ליומנים ב-Cloud Storage.
האתחול של הצומת
CLUSTER-NAME-mנכשל. … See output in:<gs://PATH_TO_STARTUP_SCRIPT_OUTPUT>הגורם: לא הייתה אפשרות לאתחל את צומת בקר האשכול של Managed Service for Apache Spark.
פתרון:
- בודקים את יומני הפלט של סקריפט לטעינה בזמן ההפעלה שמפורטים בהודעת השגיאה (
gs://PATH_TO_STARTUP_SCRIPT_OUTPUT) ומוודאים מה הסיבה לכך שהאתחול של הצומת נכשל. - הסיבות לכך יכולות להיות בעיות בהגדרת הרשת של אשכול Managed Service for Apache Spark והתקנה שנכשלה של יחסי תלות בחבילת Python.
- אם הבעיה לא נפתרה אחרי שבדקתם את היומנים של סקריפט ההפעלה, תקנתם בעיות בצד המשתמש וניסיתם שוב עם השהיה מעריכית לפני ניסיון חוזר (exponential backoff), פנו אל התמיכה של Google Cloud.
- בודקים את יומני הפלט של סקריפט לטעינה בזמן ההפעלה שמפורטים בהודעת השגיאה (
יצירת האשכול נכשלה: מרחב כתובות ה-IP מוצה
הסיבה: מרחב כתובות ה-IP שנדרש להקצאת צמתים של האשכול המבוקש לא זמין.
פתרון:
- ליצור אשכול עם פחות צמתים של worker, אבל עם סוג מכונה גדול יותר.
- יצירת אשכול ברשת משנה או ברשת אחרת.
- כדי לפנות מקום לכתובות IP, צריך לצמצם את השימוש ברשת.
- מחכים עד שיהיה מספיק מקום לכתובות IP ברשת.
הודעת שגיאה בסקריפט ההפעלה: למאגר REPO_NAME אין יותר קובץ Release
הסיבה: מאגר הגיבויים של Debian oldstable נמחק.
פתרון:
מוסיפים את הקוד הבא לפני הקוד שמריץ את
apt-getבסקריפט האתחול.oldstable=$(curl -s https://deb.debian.org/debian/dists/oldstable/Release | awk '/^Codename/ {print $2}'); stable=$(curl -s https://deb.debian.org/debian/dists/stable/Release | awk '/^Codename/ {print $2}'); matched_files="$(grep -rsil '\-backports' /etc/apt/sources.list*)" if [[ -n "$matched_files" ]]; then for filename in "$matched_files"; do grep -e "$oldstable-backports" -e "$stable-backports" "$filename" || \ sed -i -e 's/^.*-backports.*$//' "$filename" done fiהזמן הקצוב לתפוגה של ההמתנה לדיווח של מופע
DATAPROC_CLUSTER_VM_NAMEהסתיים או לא ניתן להגיע לרשת:dataproccontrol-REGION.googleapis.comהסיבה: הודעות השגיאה האלה מציינות שהגדרת הרשת של אשכול Managed Service for Apache Spark לא הושלמה: יכול להיות שחסר מסלול לשער האינטרנט שמוגדר כברירת מחדל או כללי חומת אש.
פתרון:
כדי לפתור את הבעיה, אפשר ליצור את בדיקות הקישוריות הבאות:
- יצירת בדיקת קישוריות בין שתי מכונות וירטואליות של אשכולות Managed Service for Apache Spark. תוצאות הבדיקה הזו יעזרו לכם להבין אם כללי חומת האש של הרשת שלכם חלים על המכונות הווירטואליות של האשכול בצורה נכונה.
- יוצרים בדיקת קישוריות בין מכונה וירטואלית של אשכול Managed Service for Apache Spark לבין כתובת IP של API בקרה של Managed Service for Apache Spark. כדי לקבל את כתובת ה-IP הנוכחית של API הבקרה של Managed Service for Apache Spark, משתמשים בפקודה הבאה:
dig dataproccontrol-REGION.googleapis.com A
משתמשים באחת מכתובות ה-IPv4 בקטע התשובה של הפלט.
תוצאת בדיקת הקישוריות תעזור לכם להבין אם המסלול אל שער האינטרנט שמוגדר כברירת מחדל וחומת האש שמאפשרת יציאה מוגדרים בצורה תקינה.
על סמך התוצאות של בדיקות הקישוריות:
- מוסיפים נתיב לאינטרנט לרשת ה-VPC של האשכול:
0.0.0.0/0ל-IPv4 ו- ::/0ל-IPv6 עם --next-hop-gateway=default-internet-gateway. - מוסיפים כללים לחומת האש לצורך בקרת גישה.
שגיאה בגלל עדכון
הסיבה: האשכול קיבל עבודה שנשלחה לשירות Managed Service for Apache Spark, אבל לא הצליח להגדיל או להקטין את הקיבולת באופן ידני או באמצעות התאמה אוטומטית לעומס. גם הגדרת אשכול לא סטנדרטית יכולה לגרום לשגיאה הזו.
פתרון:
איפוס אשכול: פותחים כרטיס תמיכה, כוללים קובץ tar של אבחון ומבקשים לאפס את האשכול למצב RUNNING.
אשכול חדש: יוצרים מחדש את האשכול עם אותה הגדרה. הפתרון הזה יכול להיות מהיר יותר מאיפוס שמתבצע על ידי צוות התמיכה.
טיפים לפתרון בעיות באשכול
בקטע הזה מפורטת הדרכה נוספת לפתרון בעיות נפוצות שיכולות למנוע את היצירה של אשכולות Managed Service for Apache Spark.
כשקורה כשל בהקצאת אשכול של Managed Service for Apache Spark, בדרך כלל מוצגת הודעת שגיאה כללית או שהסטטוס הוא PENDING או PROVISIONING לפני הכשל. כדי לאבחן ולפתור בעיות שקשורות לכשל באשכול, צריך לבדוק את יומני האשכול ולהעריך נקודות כשל נפוצות.
תסמינים נפוצים
אלה התסמינים הנפוצים שקשורים לכשלים ביצירת אשכולות:
- סטטוס האשכול נשאר
PENDINGאוPROVISIONINGלמשך תקופה ממושכת. - האשכול עובר למצב
ERROR. - שגיאות כלליות ב-API במהלך יצירת האשכול, כמו
Operation timed out. הודעות שגיאה שמופיעות ביומן או בתגובת ה-API, כמו:
-
RESOURCE_EXHAUSTED: קשורות למכסות של CPU, דיסק או כתובת IP Instance failed to startPermission deniedUnable to connect to service_name.googleapis.comאוCould not reach required Google APIsConnection refusedאוnetwork unreachable- שגיאות שקשורות לכשל בפעולות אתחול, כמו שגיאות בהפעלת סקריפט או קובץ שלא נמצא.
-
בדיקת יומני האשכול
שלב חשוב בתהליך אבחון כשלים ביצירת אשכולות הוא בדיקת יומני האשכולות המפורטים שזמינים ב-Cloud Logging.
- עוברים אל Logs Explorer: פותחים את Logs Explorer במסוף Google Cloud .
- סינון לפי אשכולות של Managed Service for Apache Spark:
- בתפריט הנפתח משאב, בוחרים באפשרות
Cloud Managed Service for Apache Spark Cluster. - מזינים את
cluster_nameואתproject_id. אפשר גם לסנן לפיlocation(אזור).
- בתפריט הנפתח משאב, בוחרים באפשרות
- בדיקת רשומות ביומן:
- מחפשים הודעות ברמה
ERRORאוWARNINGשמופיעות בסמוך לזמן שבו נכשלה יצירת האשכול. - כדאי לשים לב ליומנים מרכיבי
master-startup,worker-startupו-agentכדי לקבל תובנות לגבי בעיות ברמת מכונת ה-VM או בסוכן של Managed Service for Apache Spark. - כדי לקבל תובנות לגבי בעיות בזמן האתחול של מכונת ה-VM, מסננים את היומנים לפי
resource.type="gce_instance"ומחפשים הודעות משמות המופעים שמשויכים לצמתי האשכול, כמוCLUSTER_NAME-mאוCLUSTER_NAME-w-0. יומני מסוף סדרתי יכולים לחשוף בעיות בהגדרת הרשת, בעיות בדיסק וכשלים בסקריפטים שמתרחשים בשלב מוקדם במחזור החיים של מכונת ה-VM.
- מחפשים הודעות ברמה
סיבות נפוצות לכשל באשכול וטיפים לפתרון בעיות
בקטע הזה מפורטות סיבות נפוצות לכך שיצירת אשכול של Managed Service for Apache Spark עלולה להיכשל, וטיפים לפתרון בעיות שיעזרו לכם לפתור בעיות שקשורות לאשכולות.
אין מספיק הרשאות IAM
חשבון השירות של המכונה הווירטואלית שבו משתמשים באשכול Managed Service for Apache Spark צריך לכלול תפקידי IAM מתאימים כדי להקצות מופעים של Compute Engine, לגשת לקטגוריות של Cloud Storage, לכתוב יומנים ולקיים אינטראקציה עם שירותים אחרים של Google Cloud .
- תפקיד Worker נדרש: מוודאים שלחשבון השירות של מכונת ה-VM יש את התפקיד Managed Service for Apache Spark Worker (
roles/dataproc.worker). התפקיד הזה כולל את ההרשאות המינימליות שנדרשות ל-Managed Service for Apache Spark כדי לנהל את משאבי האשכול. - הרשאות גישה לנתונים: אם העבודות קוראות מ-Cloud Storage או מ-BigQuery או כותבות לתוכם, לחשבון השירות צריכים להיות תפקידים שקשורים לכך, כמו
Storage Object Viewer,Storage Object CreatorאוStorage Object Adminל-Cloud Storage, אוBigQuery Data ViewerאוBigQuery Editorל-BigQuery. - הרשאות רישום ביומן: לחשבון השירות צריך להיות תפקיד עם ההרשאות הנדרשות לכתיבת יומנים ב-Cloud Logging, כמו התפקיד
Logging Writer.
טיפים לפתרון בעיות:
זיהוי חשבון השירות: קובעים את חשבון השירות של המכונה הווירטואלית שהוגדר לשימוש באשכול. אם לא מציינים חשבון שירות, ברירת המחדל היא חשבון השירות שמוגדר כברירת מחדל ב-Compute Engine.
בודקים את התפקידים ב-IAM: במסוף Google Cloud , עוברים לדף IAM & Admin > IAM, מוצאים את חשבון השירות של מכונת ה-VM של האשכול ומוודאים שיש לו את התפקידים הנדרשים לפעולות באשכול. מעניקים את התפקידים החסרים.
חריגה ממכסות משאבים
אשכולות של Managed Service for Apache Spark צורכים משאבים מ-Compute Engine ומ Google Cloud שירותים אחרים. חריגה מהמכסות של הפרויקט או האזור עלולה לגרום לכשלים ביצירת אשכולות.
- מכסות נפוצות של Managed Service for Apache Spark שכדאי לבדוק:
CPUs(אזורי)DISKS_TOTAL_GB(אזורי)-
IN_USE_ADDRESSES(אזוריות לכתובות IP פנימיות, גלובליות לכתובות IP חיצוניות) - מכסות של Dataproc API, כמו
ClusterOperationRequestsPerMinutePerProjectPerRegion
טיפים לפתרון בעיות:
- בדיקת המכסות: נכנסים לדף IAM & Admin > IAM במסוף Google Cloud . מסננים לפי 'שירות' כדי לראות את Compute Engine API ו-Dataproc API.
- בדיקת השימוש לעומת המגבלה: זיהוי מכסות שהגיעו למגבלות או מתקרבות אליהן.
- במקרה הצורך, מבקשים להגדיל את המכסה.
בעיות בהגדרת הרשת
בעיות בהגדרת הרשת, כמו הגדרה שגויה של רשת VPC, רשת משנה, חומת אש או DNS, הן סיבה נפוצה לכשלים ביצירת אשכולות. מופעי האשכול צריכים להיות מסוגלים לתקשר זה עם זה ועם Google APIs.
- רשת VPC ותת-רשת:
- מוודאים שרשת ה-VPC והרשת המשנית של האשכול קיימות ומוגדרות בצורה נכונה.
- מוודאים שיש מספיק כתובות IP זמינות ברשת המשנה.
- גישה פרטית ל-Google (PGA): אם למכונות וירטואליות באשכול יש כתובות IP פנימיות והן צריכות להגיע לממשקי Google API ל-Cloud Storage, ל-Cloud Logging ולפעולות אחרות, צריך לוודא שגישה פרטית ל-Google מופעלת ברשת המשנה. כברירת מחדל, מכונות וירטואליות (VM) באשכולות של Managed Service for Apache Spark שנוצרו עם גרסאות תמונה 2.2 ומעלה מוקצות עם כתובות IP פנימיות בלבד, כאשר הגישה הפרטית ל-Google מופעלת ברשת המשנה האזורית של האשכול.
- Private Service Connect (PSC): אם אתם משתמשים ב-Private Service Connect כדי לגשת לממשקי Google API, ודאו שנקודות הקצה (endpoints) של Private Service Connect שנדרשות מוגדרות בצורה נכונה לממשקי Google API ש-Managed Service for Apache Spark מסתמך עליהם, כמו
dataproc.googleapis.com,storage.googleapis.com,compute.googleapis.comו-logging.googleapis.com. ערכי ה-DNS של ממשקי ה-API צריכים להתפרש ככתובות IP פרטיות. שימו לב: שימוש ב-Private Service Connect לא מבטל את הצורך בשימוש בקישור (peering) בין רשתות VPC כדי לתקשר עם רשתות VPC אחרות שמנוהלות על ידי לקוחות. - VPC Peering: אם האשכול מתקשר עם משאבים ברשתות VPC אחרות, כמו פרויקטים מארחים של VPC משותף או רשתות VPC אחרות של לקוחות, צריך לוודא ש-VPC Peering מוגדר בצורה נכונה ושהנתיבים מופצים.
כללי חומת אש:
- כללי ברירת מחדל: מוודאים שכללי ברירת המחדל של חומת האש, כמו
allow-internalאוallow-ssh, לא מגבילים מדי. כללים בהתאמה אישית: אם יש כללים מותאמים אישית לחומת האש, צריך לוודא שהם מאפשרים את נתיבי התקשורת הנדרשים:
- תקשורת פנימית בתוך האשכול (בין צומתי -m לבין צומתי -w).
תעבורת נתונים יוצאת ממכונות וירטואליות באשכול אל ממשקי Google APIs, באמצעות כתובות IP ציבוריות או שער לאינטרנט, גישה פרטית ל-Google או נקודות קצה של Private Service Connect.
תנועה לכל מקורות הנתונים או השירותים החיצוניים שהעבודות שלכם תלויות בהם.
- כללי ברירת מחדל: מוודאים שכללי ברירת המחדל של חומת האש, כמו
רזולוציית DNS: מוודאים שמופעים של אשכול יכולים לפתור נכון שמות DNS עבור Google APIs ושירותים פנימיים או חיצוניים.
טיפים לפתרון בעיות:
- בדיקת הגדרות הרשת: בודקים את ההגדרות של רשת ה-VPC והרשת המשנית שבהן מתבצעת הפריסה של האשכול.
- בדיקת כללי חומת האש: בודקים את כללי חומת האש ברשת ה-VPC או בפרויקט המארח של ה-VPC המשותף.
- בודקים את הקישוריות: מפעילים מכונה וירטואלית זמנית ב-Compute Engine ברשת המשנה של האשכול ומבצעים את השלבים הבאים:
-
pingאוcurlלדומיינים חיצוניים של Google API, כמוstorage.googleapis.com. -
nslookupכדי לוודא שכתובות ה-IP הצפויות מתקבלות מפתרון ה-DNS (גישה פרטית ל-Google או Private Service Connect). - מריצים Google Cloud בדיקות קישוריות כדי לאבחן נתיבים ממכונה וירטואלית לבדיקה לנקודות קצה רלוונטיות.
-
כשלים בפעולות אתחול
פעולות אתחול של Managed Service for Apache Spark הן סקריפטים שמופעלים במכונות וירטואליות של אשכול במהלך יצירת האשכול. שגיאות בסקריפטים האלה יכולות למנוע את הפעלת האשכול.
טיפים לפתרון בעיות:
- בדיקת יומנים לאיתור שגיאות בפעולת האתחול: מחפשים ב-Cloud Logging רשומות ביומן שקשורות ל-
init-actionsאו ל-startup-scriptעבור מופעי האשכול. - בדיקת נתיבי הסקריפטים וההרשאות: מוודאים שסקריפטים של פעולות אתחול ממוקמים בצורה נכונה ב-Cloud Storage, ושלחשבון השירות של מכונת ה-VM באשכול יש את התפקיד
Storage Object Viewerשנדרש לקריאת סקריפטים של Cloud Storage. - ניפוי באגים בלוגיקה של הסקריפט: בודקים את הלוגיקה של הסקריפט במכונה וירטואלית נפרדת של Compute Engine שמדמה את סביבת האשכול כדי לזהות שגיאות. מוסיפים רישום מפורט ביומן לסקריפט.
זמינות של משאבים אזוריים (מלאי חסר)
מדי פעם, סוג מכונה או משאב באזור או בתחום (zone) לא זמינים באופן זמני (מלאי אזל). בדרך כלל, התוצאה היא שגיאות RESOURCE_EXHAUSTED שלא קשורות לבעיות במכסת הפרויקט.
טיפים לפתרון בעיות:
- מנסים להשתמש באזור או באזור משנה אחרים: מנסים ליצור את האשכול באזור אחר באותו אזור, או באזור אחר.
- שימוש במיקום אוטומטי של אזור: אפשר להשתמש בתכונה מיקום אוטומטי של אזור של Managed Service for Apache Spark כדי לבחור באופן אוטומטי אזור עם קיבולת.
- שינוי סוג המכונה: אם משתמשים בסוג מכונה מותאם אישית או ייעודי, כדאי לנסות סוג מכונה רגיל כדי לבדוק אם זה פותר את הבעיה.
פנייה ל-Cloud Customer Care
אם אתם ממשיכים להיתקל בבעיות שקשורות לכשל באשכול, אתם יכולים לפנות אל Cloud Customer Care. תארו את הבעיה בכשל באשכול ואת השלבים לפתרון הבעיה שביצעתם. בנוסף, עליך לספק את הפרטים הבאים:
- נתוני אבחון של אשכול
- פלט מהפקודה הבאה:
gcloud dataproc clusters describe CLUSTER_NAME \ --region=REGION
- יומנים שיוצאו עבור האשכול שנכשל.
שימוש בכלי gcpdiag
gcpdiag
הוא כלי בקוד פתוח. זה לא מוצר נתמך רשמית של Google Cloud .
אפשר להשתמש בgcpdiagכלי כדי לזהות ולפתור Google Cloudבעיות בפרויקט. מידע נוסף זמין בפרויקט gcpdiag ב-GitHub.
הכלי gcpdiag עוזר לכם לגלות את הבעיות הבאות שקשורות ליצירת אשכולות של Managed Service for Apache Spark באמצעות הבדיקות הבאות:
- שגיאות של חוסר במלאי: הערכת יומנים ב-Logs Explorer כדי לגלות חוסר במלאי באזורים ובאזורי זמינות.
- מכסה לא מספיקה: בדיקה של זמינות המכסה בפרויקט של אשכול Managed Service for Apache Spark.
- הגדרת רשת לא מלאה: מבצע בדיקות קישוריות לרשת, כולל בדיקות של כללי חומת האש הנדרשים והגדרות של כתובות IP חיצוניות ופנימיות. אם האשכול נמחק, הכלי
gcpdiagלא יכול לבצע בדיקה של קישוריות הרשת. - הגדרה שגויה של פרויקטים: בדיקה של חשבונות שירות חוצי-פרויקטים ובדיקה של תפקידים נוספים ושל אכיפת מדיניות הארגון.
- תפקידי IAM חסרים ברשת של ענן וירטואלי פרטי (VPC) משותף: אם אשכול Managed Service for Apache Spark משתמש ברשת של ענן וירטואלי פרטי (VPC) משותף, המערכת בודקת אם נוספו תפקידים נדרשים של חשבון שירות.
- כשלים בפעולות אתחול: בדיקת יומנים בכלי Logs Explorer כדי לגלות כשלים ופסק זמן בסקריפטים של פעולות אתחול.
רשימה של gcpdiag שלבי Dataproc, כולל שלבים ליצירת אשכול, מופיעה במאמר בנושא שלבים ב-Managed Service for Apache Spark.
מריצים את הפקודה gcpdiag.
אפשר להריץ את הפקודה gcpdiag מ-Cloud Shell במסוףGoogle Cloud או בתוך קונטיינר Docker.
מסוףGoogle Cloud
- משלימים את הפקודה הבאה ואז מעתיקים אותה.
- פותחים את Google Cloud המסוף ומפעילים את Cloud Shell. פתיחת מסוף Cloud
- מדביקים את הפקודה שהועתקה.
- מריצים את הפקודה
gcpdiag, שמורידה את קובץ האימג' של Dockergcpdiag, ואז מבצעת בדיקות אבחון. אם רלוונטי, פועלים לפי ההוראות שמופיעות בפלט כדי לתקן את הבדיקות שנכשלו.
gcpdiag runbook managed-spark/cluster-creation \
--parameter project_id=PROJECT_ID \
--parameter cluster_name=CLUSTER_NAME \
--parameter OPTIONAL_FLAGSDocker
אפשר
להריץ את gcpdiag באמצעות wrapper שמפעיל את gcpdiag בקונטיינר של Docker. צריך להתקין את Docker או את Podman.
- מעתיקים את הפקודה הבאה ומריצים אותה בתחנת העבודה המקומית.
curl https://gcpdiag.dev/gcpdiag.sh >gcpdiag && chmod +x gcpdiag
- מריצים את הפקודה
gcpdiag../gcpdiag runbook managed-spark/cluster-creation \ --parameter project_id=PROJECT_ID \ --parameter cluster_name=CLUSTER_NAME \ --parameter OPTIONAL_FLAGS
הצגת הפרמטרים הזמינים של קובץ ה-runbook הזה.
מחליפים את מה שכתוב בשדות הבאים:
- PROJECT_ID: מזהה הפרויקט שמכיל את המשאב
- CLUSTER_NAME: השם של אשכול היעד של Managed Service for Apache Spark בפרויקט
- OPTIONAL_PARAMETERS: מוסיפים פרמטר אופציונלי אחד או יותר מהפרמטרים הבאים. חובה לציין את הפרמטרים האלה אם האשכול נמחק.
-
cluster_uuid: ה-UUID של אשכול היעד של Managed Service for Apache Spark בפרויקט -
service_account: חשבון השירות של ה-VM באשכול Managed Service for Apache Spark -
subnetwork: הנתיב המלא של ה-URI של רשת המשנה של אשכול Managed Service for Apache Spark -
internal_ip_only: True או False -
cross_project: מזהה הפרויקט אם אשכול Managed Service for Apache Spark משתמש בחשבון שירות של מכונה וירטואלית בפרויקט אחר
-
דגלים שימושיים:
-
--universe-domain: אם רלוונטי, הדומיין של Trusted Partner Sovereign Cloud שמארח את המשאב -
--parameterאו-p: פרמטרים של Runbook
רשימה ותיאור של כל הדגלים של הכלי gcpdiag מופיעים במאמר הוראות לשימוש ב-gcpdiag.
המאמרים הבאים
- מידע נוסף על כלי המעקב ופתרון הבעיות של Managed Service for Apache Spark
- איך מאבחנים אשכולות של Managed Service for Apache Spark
- מידע נוסף מופיע במסמך שאלות נפוצות בנושא Managed Service for Apache Spark .