Introduction to Vertex AI Workbench
מכונות של Vertex AI Workbench הן סביבות פיתוח מבוססות Jupyter notebook לכל תהליך העבודה של מדעי הנתונים. אתם יכולים ליצור אינטראקציה עם Vertex AI ושירותים אחרים של Google Cloud Google מתוך מחברת Jupyter של מכונת Vertex AI Workbench.
השילובים והתכונות של Vertex AI Workbench יכולים להקל על הגישה לנתונים, לעבד נתונים מהר יותר, לתזמן הפעלות של מחברות ועוד.
מכונות של Vertex AI Workbench מגיעות עם חבילה מראש של JupyterLab, ויש בהן חבילה מותקנת מראש של חבילות ללמידה עמוקה, כולל תמיכה ב-frameworks של TensorFlow ו-PyTorch. אפשר להגדיר מכונות וירטואליות עם מעבד בלבד או עם מעבד גרפי.
מכונות של Vertex AI Workbench תומכות באפשרות לסנכרון עם מאגר GitHub.
מכונות של Vertex AI Workbench מוגנות באמצעות Google Cloud אימות והרשאות.
גישה לנתונים
אתם יכולים לגשת לנתונים בלי לצאת מממשק המשתמש של JupyterLab.
בתפריט הניווט של JupyterLab במופע של Vertex AI Workbench, אפשר להשתמש בשילוב עם Cloud Storage כדי לעיין בנתונים ובקבצים אחרים שיש לכם גישה אליהם. איך ניגשים לקטגוריות ולקבצים ב-Cloud Storage מתוך JupyterLab
אפשר גם להשתמש בשילוב עם BigQuery כדי לעיין בטבלאות שיש לכם גישה אליהן, לכתוב שאילתות, לראות תצוגה מקדימה של התוצאות ולטעון נתונים במחברת. אפשר לעיין במאמר בנושא שאילתת נתונים בטבלאות BigQuery מתוך JupyterLab.
ביצוע של הפעלות של מחברות
אפשר להשתמש ב-executor כדי להריץ קובץ notebook כהפעלה חד-פעמית או לפי לוח זמנים. בוחרים את הסביבה והחומרה הספציפיות שרוצים להריץ עליהן את ההפעלה. הקוד של ה-notebook יפעל באימון מותאם אישית של Vertex AI, שיכול להקל על ביצוע אימון מבוזר, אופטימיזציה של היפרפרמטרים או תזמון של משימות אימון רציפות.
אתם יכולים להשתמש בפרמטרים בהרצה כדי לבצע שינויים ספציפיים בכל הרצה. לדוגמה, אפשר לציין מערך נתונים אחר לשימוש, לשנות את קצב הלמידה של המודל או לשנות את גרסת המודל.
אפשר גם להגדיר הפעלה של מחברת בתזמון חוזר. גם כשהמופע מושבת, Vertex AI Workbench יפעיל את קובץ ה-notebook וישמור את התוצאות כדי שתוכלו לעיין בהן ולשתף אותן עם אחרים. איך מתזמנים הפעלה של מחברת
שיתוף תובנות
הפעלות של מחברות מבוצעות מאוחסנות בקטגוריה של Cloud Storage, כך שאפשר לשתף את התובנות עם אחרים על ידי מתן גישה לתוצאות. אפשר לעיין בקטע הקודם בנושא הפעלת מחברות.
אבטחת המופע
בקטעים הבאים מוסבר על היכולות הנתמכות שיכולות לעזור לכם לאבטח את מופע Vertex AI Workbench.
VPC
אפשר לפרוס את מופע Vertex AI Workbench עם רשת ברירת המחדל בניהול Google, שמשתמשת ברשת VPC ובתת-רשת ברירת מחדל. במקום רשת ברירת המחדל, אפשר לציין רשת VPC לשימוש עם המופע.
כדי להשתמש ב-Vertex AI Workbench בתוך גבולות גזרה לשירות, אפשר לעיין במאמר בנושא שימוש במכונת Vertex AI Workbench בתוך גבולות גזרה לשירות.
מפתחות הצפנה בניהול הלקוח (CMEK)
כברירת מחדל, Google Cloud הנתונים מוצפנים אוטומטית כשהם במצב מנוחה באמצעות מפתחות הצפנה שמנוהלים על ידי Google. אם יש לכם דרישות רגולטוריות או דרישות תאימות ספציפיות שקשורות למפתחות שמגנים על הנתונים שלכם, אתם יכולים להשתמש במפתחות הצפנה בניהול הלקוח (CMEK) עם מופעי Vertex AI Workbench. מידע נוסף מופיע במאמר בנושא מפתחות הצפנה בניהול הלקוח.
Confidential Computing
אתם יכולים להצפין את הנתונים בשימוש באמצעות Confidential Computing. כדי להשתמש ב-Confidential Computing, צריך להפעיל את שירות Confidential VM כשיוצרים מכונה ב-Vertex AI Workbench. כדי להתחיל, כדאי לעיין במאמר יצירת מכונה עם Confidential Computing.
כיבוי אוטומטי של מופעים לא פעילים
כדי לעזור לכם לנהל את העלויות, מכונות של Vertex AI Workbench נסגרות כברירת מחדל אחרי תקופה מסוימת של חוסר פעילות. אפשר לשנות את משך הזמן או להשבית את התכונה הזו. מידע נוסף זמין במאמר בנושא כיבוי במצב לא פעיל.
הוספת סביבות conda
מכונות של Vertex AI Workbench משתמשות בקרנלים שמבוססים על סביבות conda. אפשר להוסיף סביבת conda למופע של Vertex AI Workbench, והסביבה מופיעה כליבה בממשק JupyterLab של המופע.
הוספת סביבות conda מאפשרת לכם להשתמש בקרנלים שלא זמינים במופע ברירת המחדל של Vertex AI Workbench. לדוגמה, אפשר להוסיף סביבות conda ל-R ול-Apache Beam. אפשר גם להוסיף סביבות conda לגרסאות קודמות ספציפיות של המסגרות הזמינות, כמו TensorFlow, PyTorch או Python.
מידע נוסף זמין במאמר בנושא הוספת סביבת conda.
מאגרי תגים בהתאמה אישית
אתם יכולים ליצור מכונה של Vertex AI Workbench על סמך קונטיינר בהתאמה אישית. מתחילים עם קובץ אימג' בסיסי של קונטיינר שסופק על ידי Google, ומשנים אותו בהתאם לצורך. לאחר מכן יוצרים מופע על סמך מאגר התגים המותאם אישית.
מידע נוסף זמין במאמר בנושא יצירת מופע באמצעות קונטיינר בהתאמה אישית.
שילוב עם Dataproc
אתם יכולים לעבד נתונים במהירות על ידי הפעלת מחברת באשכול Dataproc. אחרי שמגדירים את האשכול, אפשר להריץ קובץ notebook בלי לצאת מממשק המשתמש של JupyterLab. מידע נוסף זמין במאמר בנושא יצירת מופע עם Dataproc.
שריון משאבי VM
כדי להבטיח שיהיו מספיק משאבי מכונה וירטואלית (VM) להרצת המכונות של Vertex AI Workbench, מומלץ להשתמש בהזמנות של Compute Engine.
מקומות שמורים הם תכונה של Compute Engine. הם עוזרים לוודא שמתי שתצטרכו יהיו לכם משאבים בשביל ליצור מכונות וירטואליות עם אותה חומרה (זיכרון ו-vCPU) ומשאבים אופציונליים (יחידות GPU ודיסקים מקומיים של SSD).
מידע נוסף מפורט במאמר בנושא שימוש בהזמנות.
יצירת מופעים עם פרטי כניסה של צד שלישי
אתם יכולים ליצור ולנהל מכונות של Vertex AI Workbench באמצעות פרטי כניסה של צד שלישי שסופקו על ידי איחוד שירותי אימות הזהות של כוח עבודה. איחוד שירותי אימות הזהות של כוח עבודה משתמש בספק הזהויות החיצוני (IdP) שלכם כדי להעניק לקבוצת משתמשים גישה למופעים של Vertex AI Workbench דרך שרת proxy.
הגישה למכונה של Vertex AI Workbench ניתנת על ידי הקצאת חשבון משתמש במאגר כוח העבודה לחשבון השירות של מכונת Vertex AI Workbench.
מידע נוסף מופיע במאמר יצירת מופע עם פרטי כניסה של צד שלישי.
תגים למכונות של Vertex AI Workbench
המכונה הווירטואלית הבסיסית של מכונת Vertex AI Workbench היא מכונת VM של Compute Engine. אפשר להוסיף ולנהל תגי משאבים במופע של Vertex AI Workbench דרך מכונת ה-VM שלו ב-Compute Engine.
כשיוצרים מכונה ב-Vertex AI Workbench, Vertex AI Workbench מצרף את תג המשאב של Compute Engine vertex-workbench-instances:prod=READ_ONLY. תג המשאב הזה משמש רק לצרכים פנימיים.
למידע נוסף על ניהול תגים של מופעי Compute Engine, ראו איך מנהלים תגים של משאבים.
מגבלות
כשמתכננים את הפרויקט, כדאי להביא בחשבון את המגבלות הבאות של מכונות Vertex AI Workbench:
אין תמיכה בתוספים של צד שלישי ל-JupyterLab.
כשמשתמשים ב-Access Context Manager וב-Chrome Enterprise Premium כדי להגן על מופעים של Vertex AI Workbench באמצעות אמצעי בקרה לגישה מודעת-הקשר, הגישה מוערכת בכל פעם שהמשתמש עובר אימות למופע. לדוגמה, הגישה נבדקת בפעם הראשונה שהמשתמש ניגש ל-JupyterLab, ובכל פעם שהוא ניגש אליו לאחר מכן אם תוקף קובץ ה-Cookie של דפדפן האינטרנט שלו פג.
שימוש במאגר תגים מותאם אישית שלא נגזר ממאגר התגים הבסיסי ש-Google מספקת (
gcr.io/deeplearning-platform-release/workbench-container:latest) מגדיל את הסיכון לבעיות תאימות לשירותים שלנו, ולא נתמך. במקום זאת, משנים את קונטיינר הבסיס כדי ליצור קונטיינר בהתאמה אישית שעונה על הצרכים שלכם, ואז יוצרים מופע באמצעות הקונטיינר בהתאמה אישית.מכונות של Vertex AI Workbench מצפות לתמונות מהפרויקט
cloud-notebooks-managed. רשימת שמות התמונות זמינה בדף היצירה במסוף Google Cloud . אפשר להשתמש בתמונות של מכונות וירטואליות (VM) בהתאמה אישית או בתמונות של Deep Learning VM עם מופעים של Vertex AI Workbench, אבל Vertex AI Workbench לא מספק תמיכה בהתנהגויות לא צפויות או בתקלות שמתרחשות כשמשתמשים בתמונות האלה.אי אפשר להשתמש בתמונה של מחברת בניהול משתמשים או בתמונה של מחברת מנוהלת כדי ליצור מופע של Vertex AI Workbench.
אי אפשר לערוך את מכונת ה-VM הבסיסית של מופע Vertex AI Workbench באמצעות Google Cloud המסוף או Compute Engine API. כדי לערוך מכונה וירטואלית בסיסית של מופע Vertex AI Workbench, משתמשים בשיטה
projects.locations.instances.patchב-Notebooks API או בפקודהgcloud workbench instances updateב-Google Cloud SDK.במקרים שבהם נעשה שימוש ב-VPC Service Controls, השימוש ב-executor לא נתמך.
כדי להשתמש במאיצים במופעים של Vertex AI Workbench, סוג המאיץ שרוצים להשתמש בו צריך להיות זמין באזור של המופע. מידע על זמינות של מאיצים לפי אזור זמין במאמר זמינות של אזורים ואזורים גיאוגרפיים של GPU.