מילון מונחים של Vertex AI
קל לארגן דפים בעזרת אוספים
אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.
annotation set
קבוצת הערות מכילה את התוויות שמשויכות לקובצי המקור שהועלו בתוך מערך נתונים. קבוצת הערות משויכת גם לסוג נתונים וגם למטרה (לדוגמה, סרטון/סיווג).
נקודת קצה ל-API
נקודות קצה ב-API הן היבט של הגדרת שירות שמציין את כתובות הרשת, שנקראות גם נקודות קצה של שירותים (לדוגמה, aiplatform.googleapis.com).
Application Default Credentials (ADC)
ה-Application Default Credentials (ADC) מספקים דרך פשוטה לקבל פרטי כניסה להרשאה לשימוש בקריאות ל-Google APIs. הן מתאימות במיוחד למקרים שבהם הקריאה צריכה לכלול את אותה זהות ואת אותה רמת הרשאה לאפליקציה, ללא קשר למשתמש. זו הגישה המומלצת לאישור קריאות לממשקי Google Cloud API, במיוחד כשיוצרים אפליקציה שפרוסה ב-Google App Engine (GAE) או במכונות וירטואליות של Compute Engine. מידע נוסף זמין במאמר הסבר על Application Default Credentials.
שכן קרוב משוער (ANN)
שירות Approximate Nearest Neighbor (ANN) הוא פתרון עם היקף גדול וזמן אחזור נמוך, למציאת וקטורים דומים (או ליתר דיוק, 'הטמעות') עבור קורפוס גדול. מידע נוסף זמין במאמר איך משתמשים בחיפוש וקטורי להתאמה סמנטית.
artifact
ארטיפקט הוא ישות נפרדת או חלק נתונים שנוצרים ונצרכים על ידי תהליך עבודה של למידת מכונה. דוגמאות לארטיפקטים: מערכי נתונים, מודלים, קובצי קלט ויומני אימון.
Artifact Registry
Artifact Registry הוא שירות אוניברסלי לניהול ארטיפקטים. זהו השירות המומלץ לניהול קונטיינרים וארטיפקטים אחרים ב-Google Cloud. מידע נוסף זמין במאמר בנושא Artifact Registry.
בינה מלאכותית (AI)
בינה מלאכותית (AI) היא תחום מחקר ותכנון של מכונות שנראות "אינטליגנטיות", כלומר מכונות שמחקות פונקציות אנושיות או אינטלקטואליות כמו תנועה מכנית, חשיבה רציונלית או פתרון בעיות. אחד מתחומי המשנה הפופולריים ביותר של AI הוא למידת מכונה, שמשתמשת בגישה סטטיסטית ומבוססת-נתונים כדי ליצור AI. עם זאת, יש אנשים שמשתמשים בשני המונחים האלה לסירוגין.
אימות
התהליך של אימות הזהות של לקוח (שיכול להיות משתמש או תהליך אחר) לצורך קבלת גישה למערכת מאובטחת. לקוח שהוכיח את הזהות שלו נקרא לקוח מאומת. מידע נוסף זמין במאמר שיטות אימות ב-Google.
הצגה אוטומטית זו לצד זו (AutoSxS)
הכלי 'השוואה אוטומטית זה לצד זה' (AutoSxS) הוא כלי להערכה בעזרת מודל, שמשווה בין שני מודלים גדולים של שפה (LLM) זה לצד זה. אפשר להשתמש בו כדי להעריך את הביצועים של מודלים של AI גנרטיבי במרשם המודלים של Vertex AI או של מסקנות שנוצרו מראש. ב-AutoSxS נעשה שימוש במערכת דירוג אוטומטית כדי להחליט איזה מודל מספק את התשובה הטובה יותר להנחיה. התכונה AutoSxS זמינה לפי דרישה, והיא מעריכה מודלים של שפה עם ביצועים דומים לאלה של מעריכים אנושיים.
AutoML
אלגוריתמים של למידת מכונה ש "לומדים ללמוד" באמצעות אופטימיזציה של קופסה שחורה. מידע נוסף זמין במאמר בנושא מונחון למידת מכונה.
רישום אוטומטי ביומן
רישום אוטומטי הוא תכונה בפלטפורמות ובספריות של למידת מכונה, שרושמת באופן אוטומטי מדדים, פרמטרים וארטיפקטים מרכזיים במהלך תהליך אימון המודל, בלי שנדרש קוד מפורש. הכלי מייעל את מעקב הניסויים על ידי תיעוד אוטומטי של מידע כמו היפרפרמטרים, מדדי הערכה (לדוגמה, דיוק, הפסד) ונקודות ביקורת של המודל, וכך מאפשר למפתחים להשוות בין ניסויים ולשחזר אותם בקלות.
autorater
מדרג אוטומטי הוא מודל שפה שמעריך את איכות התגובות של המודל להנחיית הסקה מקורית. הוא משמש בצינור (pipeline) של AutoSxS כדי להשוות בין ההסקות של שני מודלים ולקבוע איזה מודל השיג את הביצועים הכי טובים. מידע נוסף זמין במאמר בנושא הערכת מהירות התגובה.
התאמה אוטומטית לעומס
שינוי גודל אוטומטי (Autoscaling) הוא היכולת של משאב מחשוב, כמו מאגר העובדים של אשכול Ray, להתאים באופן אוטומטי את מספר הצמתים כלפי מעלה או מטה על סמך דרישות עומס העבודה, כדי לייעל את השימוש במשאבים ואת העלויות. מידע נוסף זמין במאמר בנושא התאמת הגודל של אשכולות Ray ב-Vertex AI: שינוי גודל אוטומטי.
baseline
מודל שמשמש כנקודת התייחסות להשוואה של רמת הביצועים של מודל אחר (בדרך כלל מודל מורכב יותר). לדוגמה, מודל רגרסיה לוגיסטית יכול לשמש כבסיס טוב למודל עמוק. בבעיה מסוימת, נתוני הבסיס עוזרים למפתחי מודלים לכמת את הביצועים המינימליים הצפויים שמודל חדש צריך להשיג כדי שהוא יהיה שימושי. מידע נוסף זמין במאמר קבוצות נתונים של בסיס ושל יעד.
batch
קבוצת הדוגמאות שמשמשת באיטרציה אחת של אימון. גודל האצווה קובע את מספר הדוגמאות באצווה.
גודל אצווה
מספר הדוגמאות באצווה. לדוגמה, גודל האצווה של SGD הוא 1, בעוד שגודל האצווה של מיני-אצווה הוא בדרך כלל בין 10 ל-1,000. גודל האצווה בדרך כלל קבוע במהלך האימון וההסקה, אבל TensorFlow מאפשר גדלים דינמיים של אצווה.
1. הצגת סטריאוטיפים, דעות קדומות או העדפה של דברים, אנשים או קבוצות מסוימים על פני אחרים. ההטיות האלה יכולות להשפיע על איסוף הנתונים ועל הפרשנות שלהם, על עיצוב המערכת ועל האופן שבו המשתמשים מבצעים אינטראקציה עם המערכת. 2. שגיאה שיטתית שנובעת מהליך דגימה או דיווח.
bidrectional
מונח שמשמש לתיאור מערכת שמעריכה את הטקסט שמופיע לפני קטע טקסט יעד ואחריו. לעומת זאת, במערכת חד-כיוונית, הטקסט שמוערך הוא רק הטקסט שקודם לקטע הטקסט הממוקד.
ייצוגים דו-כיווניים של מקודד מטרנספורמרים (BERT)
BERT היא שיטה לאימון מראש של ייצוגי שפה, כלומר אנחנו מאמנים מודל 'הבנת שפה' לשימוש כללי על קורפוס טקסט גדול (כמו ויקיפדיה), ואז משתמשים במודל הזה למשימות NLP downstream שחשובות לנו (כמו מענה לשאלות). הביצועים של BERT טובים יותר משיטות קודמות כי זו המערכת הראשונה ללימוד מראש של NLP ללא פיקוח, עם יכולת ניתוח דו-כיווני עמוק.
BigQuery
BigQuery הוא מחסן נתונים (data warehouse) ארגוני מנוהל במלואו, ללא שרת ועם יכולת התאמה רחבה במיוחד, שמוצע על ידי Google Cloud. הוא מיועד לניתוח של מערכי נתונים עצומים באמצעות שאילתות SQL במהירויות גבוהות במיוחד. BigQuery מאפשר בינה עסקית וניתוח נתונים מתקדמים בלי שהמשתמשים יצטרכו לנהל תשתית כלשהי. מידע נוסף זמין במאמר ממחסן נתונים לפלטפורמת נתונים ו-AI אוטונומית.
BigQuery ML
BigQuery ML הוא תכונה במחסן הנתונים BigQuery של Google Cloud, שמאפשרת למנתחי נתונים ולמדעני נתונים ליצור, לאמן ולפרוס מודלים של למידת מכונה ישירות ב-BigQuery באמצעות שאילתות SQL סטנדרטי. כך לא צריך להעביר נתונים לפלטפורמות נפרדות של ML, מה שמפשט את תהליך העבודה של למידת מכונה והופך את ה-ML לנגיש יותר למשתמשי SQL. מידע נוסף זמין במאמר יצירת מודלים של למידת מכונה ב-BigQuery ML.
Bigtable
שירות מנוהל של מסד נתונים NoSQL, מומלץ גם כאפשרות אחסון לנתוני אימון כשמשתמשים ב-Vertex AI. מידע נוסף זמין במאמר סקירה כללית על Bigtable.
Bilingual Evaluation Understudy (BLEU)
מדד פופולרי להערכת האיכות של אלגוריתם לתרגום מכונה, על ידי השוואת הפלט שלו לפלט של תרגום אנושי אחד או יותר.
תיבה תוחמת
אפשר לציין תיבת תוחמת לאובייקט בפריים של הסרטון באחת משתי דרכים: (1) באמצעות 2 קודקודים שמורכבים מקבוצה של קואורדינטות x,y אם הם נקודות מנוגדות באלכסון של המלבן. לדוגמה: x_relative_min, y_relative_min,,,x_relative_max,y_relative_max,, (ii) צריך להשתמש בכל 4 הקודקודים. מידע נוסף זמין במאמר בנושא הכנת נתוני וידאו.
bucket
תיקייה ברמה העליונה ב-Cloud Storage. שמות של קטגוריות חייבים להיות ייחודיים לכל המשתמשים ב-Cloud Storage. קטגוריות מכילות קבצים. מידע נוסף זמין במאמר סקירה כללית על המוצר Cloud Storage.
צ'אט
התוכן של דיאלוג הלוך ושוב עם מערכת למידת מכונה, בדרך כלל מודל שפה גדול. האינטראקציה הקודמת בצ'אט (מה הקלדתם ואיך מודל שפה גדול (LLM) הגיב) הופכת להקשר לחלקים הבאים של הצ'אט. צ'אטבוט הוא יישום של מודל שפה גדול.
נקודת ביקורת
נתונים שמתעדים את מצב הפרמטרים של מודל במהלך האימון או אחרי שהאימון מסתיים. לדוגמה, במהלך האימון, אתם יכולים: 1. להפסיק את האימון, אולי בכוונה או אולי כתוצאה משגיאות מסוימות. 2. מצלמים את נקודת הביקורת. 3. בשלב מאוחר יותר, טוענים מחדש את נקודת הבדיקה, אולי בחומרה אחרת. 4. להתחיל מחדש את ההדרכה. ב-Gemini, נקודת ביקורת מתייחסת לגרסה ספציפית של מודל Gemini שאומנה על מערך נתונים ספציפי.
מודל סיווג
מודל שההסקה שלו היא מחלקה. לדוגמה, אלה הם מודלים של סיווג: מודל שמנבא את השפה של משפט קלט (צרפתית? ספרדית? איטלקית?). מודל שמנבא את מיני העצים (אדר? אלון? באובב?). מודל שמנבא את הסיווג החיובי או השלילי של מצב רפואי מסוים.
מדדי סיווג
מדדי הסיווג הנתמכים ב-Vertex AI SDK ל-Python הם מטריצת בלבול ועקומת ROC.
Cloud Logging
Cloud Logging הוא שירות רישום ביומן בזמן אמת שמנוהל באופן מלא על ידי Google Cloud. השירות מאפשר לכם לאסוף, לאחסן, לנתח ולנטר יומנים מכל המשאבים שלכם ב-Google Cloud, מאפליקציות מקומיות ואפילו ממקורות מותאמים אישית. Cloud Logging מרכז את ניהול היומנים, וכך קל יותר לפתור בעיות, לבצע ביקורת ולהבין את ההתנהגות והתקינות של האפליקציות והתשתיות. מידע נוסף זמין במאמר סקירה כללית על Cloud Logging.
Cloud Monitoring
Cloud Monitoring היא פלטפורמת נראות מקיפה שמסופקת על ידי Google Cloud. היא אוספת ומציגה מדדים, יומנים ואירועים משירותי Google Cloud, מתשתית מקומית ומרכיבים של אפליקציות. הוא מאפשר למשתמשים לקבל תובנות לגבי הביצועים, הזמינות והתקינות הכללית של המערכות שלהם, וכך לזהות בעיות באופן יזום, לפתור אותן ולקבל התראות. מידע נוסף זמין במאמר בנושא מדדים של Cloud Monitoring ל-Vertex AI.
Cloud Network Address Translation (Cloud NAT)
Cloud NAT (תרגום כתובות רשת) הוא שירות מנוהל לחלוטין של Google Cloud שמאפשר למכונות וירטואליות ולמשאבים אחרים ללא כתובות IP חיצוניות להתחבר לאינטרנט. מידע נוסף זמין במאמרי העזרה בנושא Cloud NAT.
Cloud Profiler
Cloud Profiler הוא שירות פרופילים רציף שמוצע על ידי Google Cloud. הוא עוזר לכם לזהות ולנתח את צריכת המעבד והזיכרון, וגם את השימוש במשאבים אחרים (כמו heap, זמן בפועל, contention) באפליקציות שלכם. הכלי אוסף באופן אוטומטי נתונים ליצירת פרופיל מהאפליקציות שלכם בסביבת הייצור עם תקורה מינימלית, ומאפשר לכם להמחיש ולהבין את צווארי הבקבוק בביצועים בשירותים שונים, ולבצע אופטימיזציה של הקוד כדי לשפר את היעילות ולהפחית את העלויות. מידע נוסף זמין במאמר סקירה כללית על Cloud Profiler.
Cloud Router
Cloud Router הוא שירות מבוזר ומנוהל לחלוטין שמספק יכולות של רמקול ומשיב של פרוטוקול Border Gateway (BGP). Cloud Router פועל עם Cloud Interconnect, Cloud VPN, Cloud NAT ומכשירי נתב כדי ליצור מסלולים דינמיים ברשתות VPC על סמך מסלולים שהתקבלו מ-BGP ומסלולים מותאמים אישית. מידע נוסף זמין במאמר סקירה כללית על מושגים ב-Cloud Router.
Cloud Storage
שירות אחסון האובייקטים של Google Cloud הוא שירות מאובטח וניתן להרחבה, ומומלץ לאחסון מערכי נתונים גדולים שמשמשים לאימון ולאימות עם Vertex AI כדי להשיג ביצועים אופטימליים. מידע נוסף זמין במסמכי Cloud Storage.
Cloud Storage Fuse
מתאם FUSE בקוד פתוח שמאפשר לטעון קטגוריות של Cloud Storage כמערכת קבצים במערכות Linux או macOS. מידע נוסף מופיע במאמר בנושא Cloud Storage Fuse.
Cloud TPU
שיפור המהירות באמצעות חומרה מיוחדת שנועד להאיץ עומסי עבודה של למידת מכונה ב-Google Cloud.
Colab Enterprise
Colab Enterprise היא סביבת Jupyter Notebook מנוהלת ושיתופית שמביאה את חוויית המשתמש הפופולרית של Google Colab אל Google Cloud, ומציעה יכולות אבטחה ותאימות ברמה הארגונית. Colab Enterprise מספק חוויה שמתמקדת במחברות, ללא צורך בהגדרה, עם משאבי מחשוב שמנוהלים על ידי Vertex AI, ומשולב עם שירותים אחרים של Google Cloud כמו BigQuery. מידע נוסף זמין במאמר מבוא ל-Colab Enterprise.
consumer VPC
רשת ענן וירטואלי פרטי (VPC) של צרכן משמשת לגישה פרטית לשירותים מנוהלים מתוך רשת ה-VPC שלו. מידע נוסף זמין במאמר Private Service Connect.
קובץ אימג' של קונטיינר
קובץ אימג' של קונטיינר הוא חבילה שכוללת את הקוד הניתן להפעלה של הרכיב והגדרה של הסביבה שבה הקוד פועל. מידע נוסף זמין במאמר סקירה כללית על אימון ללא שרת ב-Vertex AI.
context
הקשר משמש לקיבוץ של פריטי מידע וביצועים יחד בקטגוריה אחת שאפשר להריץ עליה שאילתות ולסווג אותה. אפשר להשתמש בהקשרים כדי לייצג קבוצות של מטא-נתונים. דוגמה להקשר: הרצה של צינור עיבוד נתונים של למידת מכונה.
מטמון הקשר
מטמון הקשר ב-Vertex AI הוא כמות גדולה של נתונים שאפשר להשתמש בהם בכמה בקשות למודל Gemini. התוכן שנשמר במטמון מאוחסן באזור שבו מתבצעת הבקשה ליצירת המטמון. זה יכול להיות כל סוג MIME שנתמך על ידי מודלים של Gemini multimodal, כמו טקסט, אודיו או וידאו. מידע נוסף זמין במאמר סקירה כללית על שמירת הקשר במטמון.
חלון ההקשר
מספר הטוקנים שמודל יכול לעבד בהנחיה נתונה. ככל שחלון ההקשר גדול יותר, המודל יכול להשתמש ביותר מידע כדי לספק תשובות עקביות וקוהרנטיות להנחיה.
מפתחות הצפנה בניהול הלקוח (CMEK)
מפתחות הצפנה בניהול הלקוח (CMEK) הם שילובים שמאפשרים ללקוחות להצפין נתונים בשירותי Google קיימים באמצעות מפתח שהם מנהלים ב-Cloud KMS (שנקרא גם Storky). המפתח ב-Cloud KMS הוא המפתח להצפנת מפתחות הצפנה שמגן על הנתונים שלהם. מידע נוסף מופיע במאמר בנושא מפתחות הצפנה בניהול הלקוח (CMEK).
רשת VPC של צרכן
רשת VPC של צרכן היא ענן וירטואלי פרטי (VPC) ב-Google Cloud, שמקבל גישה פרטית לשירות שמארח ב-VPC אחר (שנקרא VPC של ספק). מידע נוסף זמין במאמר Private Service Connect.
CustomJob
CustomJob הוא אחד משלושת המשאבים של Vertex AI שמשתמש יכול ליצור כדי לאמן מודלים בהתאמה אישית ב-Vertex AI. משימות אימון בלי שרת (serverless) הן הדרך הבסיסית להפעיל קוד אימון מותאם אישית של למידת מכונה (ML) ב-Vertex AI. מידע נוסף מופיע במאמר יצירת משימת אימון ללא שרת.
קובץ אימג' של קונטיינר בהתאמה אישית
קובץ אימג' מותאם אישית של קונטיינר הוא חבילה עצמאית שניתנת להרצה וכוללת את קוד האפליקציה של המשתמש, את זמן הריצה שלה, את הספריות, את יחסי התלות ואת הגדרות הסביבה. בהקשר של Google Cloud, ובמיוחד של Vertex AI, הוא מאפשר למשתמש לארוז את קוד האימון של למידת המכונה או את אפליקציית ההצגה עם התלות המדויקת שלה, וכך להבטיח שחזור ולאפשר למשתמש להריץ עומס עבודה בשירותים מנוהלים באמצעות גרסאות תוכנה ספציפיות או הגדרות ייחודיות שלא מסופקות על ידי סביבות סטנדרטיות. מידע נוסף זמין במאמר בנושא דרישות של קונטיינרים בהתאמה אישית להסקת מסקנות.
אימון בהתאמה אישית
ב-Vertex AI יש שני מצבים עיקריים להרצת קוד האימון בהתאמה אישית: סביבה לפי דרישה ללא שרתים או אשכול ייעודי שמור. מידע נוסף מופיע במאמר בנושא אימון מודלים משלכם ושימוש בהם.
Dask
Dask היא פלטפורמת מחשוב מבוזרת שמשמשת לעיתים קרובות עם TensorFlow, Pytorch ומסגרות ML אחרות לניהול משימות אימון מבוזרות. מידע נוסף זמין ב-Wikipedia.
ניתוח נתונים
הבנת הנתונים על ידי בחינת דוגמאות, מדידה והמחשה. ניתוח נתונים יכול להיות שימושי במיוחד כשמקבלים מערך נתונים בפעם הראשונה, לפני שבונה המודל הראשון. הוא גם חיוני להבנת ניסויים ולניפוי באגים במערכת.
הגדלת מערך הנתונים
הגדלה מלאכותית של טווח הדוגמאות לאימון ומספרן על ידי שינוי דוגמאות קיימות כדי ליצור דוגמאות נוספות. לדוגמה, נניח שתמונות הן אחת מהתכונות שלכם, אבל מערך הנתונים לא מכיל מספיק דוגמאות של תמונות כדי שהמודל יוכל ללמוד שיוכים שימושיים. מומלץ להוסיף למערך הנתונים מספיק תמונות מתויגות כדי לאפשר אימון תקין של המודל. אם זה לא אפשרי, אפשר להשתמש בהגדלת מערך הנתונים כדי לסובב, למתוח ולשקף כל תמונה וליצור הרבה וריאציות של התמונה המקורית. יכול להיות שזה יניב מספיק נתונים מתויגים כדי לאפשר אימון מצוין.
סוג נתונים פופולרי של pandas לייצוג מערכי נתונים בזיכרון. אובייקט DataFrame דומה לטבלה או לגיליון אלקטרוני. לכל עמודה ב-DataFrame יש שם (כותרת), וכל שורה מזוהה באמצעות מספר ייחודי. כל עמודה ב-DataFrame מובנית כמו מערך דו-ממדי, אלא שלכל עמודה אפשר להקצות סוג נתונים משלה.
מערך נתונים (dataset)
הגדרה רחבה של מערך נתונים היא אוסף של רשומות נתונים מובְנים או לא מובְנים. אוסף של נתונים גולמיים, בדרך כלל (אבל לא רק) מאורגנים באחד מהפורמטים הבאים: גיליון אלקטרוני או קובץ בפורמט CSV (ערכים מופרדים בפסיקים). מידע נוסף זמין במאמר יצירת מערך נתונים.
decoder
באופן כללי, כל מערכת ML שמבצעת המרה מייצוג מעובד, צפוף או פנימי לייצוג גולמי, דליל או חיצוני יותר. מפענחים הם לרוב רכיב של מודל גדול יותר, ולעתים קרובות הם משולבים עם מקודד. במשימות של רצף לרצף, מפענח מתחיל עם המצב הפנימי שנוצר על ידי המקודד כדי לחזות את הרצף הבא.
רשת עצבית עמוקה (DNN)
רשת נוירונים עם כמה שכבות מוסתרות, שבדרך כלל מתוכנתת באמצעות טכניקות של למידה עמוקה.
עומק
סכום הערכים הבאים ברשת נוירונים: 1. מספר השכבות הנסתרות 2. מספר שכבות הפלט, שבדרך כלל הוא אחד 3. מספר שכבות ההטמעה. לדוגמה, לרשת נוירונים עם חמש שכבות נסתרות ושכבת פלט אחת יש עומק של 6. שימו לב ששכבת הקלט לא משפיעה על העומק.
DevOps
DevOps היא חבילה של מוצרי Google Cloud Platform, לדוגמה, Artifact Registry ו-Cloud Deploy.
עצירה מוקדמת
שיטה לרגולריזציה שכוללת סיום של האימון לפני שההפסד של האימון מפסיק לרדת. בשיטת העצירה המוקדמת, עוצרים בכוונה את אימון המודל כשההפסד במערך נתוני אימות מתחיל לעלות, כלומר כשביצועי ההכללה מתדרדרים.
הטמעה
ייצוגים מספריים של מילים או של חלקי טקסט. המספרים האלה משקפים את המשמעות הסמנטית וההקשר של הטקסט. למילים או לטקסט דומים או קשורים יש בדרך כלל הטמעות דומות, כלומר הם קרובים יותר זה לזה במרחב הווקטורי הרב-ממדי.
מרחב הטמעה (מרחב סמוי)
ב-AI גנרטיבי, מרחב הטמעה הוא ייצוג מספרי של טקסט, תמונות או סרטונים, שמתעד את הקשרים בין נתוני הקלט. מודלים של למידת מכונה, ובמיוחד מודלים של AI גנרטיבי, מצטיינים ביצירת ההטמעות האלה על ידי זיהוי דפוסים במערכי נתונים גדולים. אפליקציות יכולות להשתמש בהטמעות כדי לעבד ולייצר שפה, ולזהות משמעויות מורכבות וקשרים סמנטיים שספציפיים לתוכן.
וקטור הטמעה
ייצוג וקטורי צפוף, ולעתים קרובות דו-ממדי, של פריט. אם שני פריטים דומים מבחינה סמנטית, ההטמעות שלהם ממוקמות קרוב זו לזו במרחב וקטורי ההטמעה.
encoder
באופן כללי, כל מערכת ML שמבצעת המרה מייצוג גולמי, דליל או חיצוני לייצוג מעובד יותר, צפוף יותר או פנימי יותר. מקודדים הם בדרך כלל רכיב של מודל גדול יותר, ולעתים קרובות הם משולבים עם מפענח. חלק מהטרנספורמציות משלבות מקודדים ומפענחים, אבל טרנספורמציות אחרות משתמשות רק במקודד או רק במפענח. יש מערכות שמשתמשות בפלט של המקודד כקלט לרשת סיווג או רגרסיה. במשימות של רצף לרצף, מקודד מקבל רצף קלט ומחזיר מצב פנימי (וקטור). לאחר מכן, המפענח משתמש במצב הפנימי הזה כדי לחזות את הרצף הבא.
נקודת קצה
משאבים שאפשר לפרוס אליהם מודלים מאומנים כדי להציג מסקנות. מידע נוסף זמין במאמר בחירת סוג נקודת קצה.
ensemble
קבוצה של מודלים שאומנו באופן עצמאי, והמסקנות שלהם מחושבות כממוצע או כסכום. במקרים רבים, קבוצת מודלים מניבה מסקנות טובות יותר ממודל יחיד. לדוגמה, יער אקראי הוא אנסמבל שנבנה מכמה עצי החלטה. חשוב לזכור שלא כל יערות ההחלטה הם קבוצות.
environment
בשיטת הלמידה באמצעות חיזוקים, העולם שמכיל את ה-Agent ומאפשר לו לצפות במצב של העולם הזה. לדוגמה, העולם המיוצג יכול להיות משחק כמו שחמט, או עולם פיזי כמו מבוך. כשהסוכן מבצע פעולה בסביבה, הסביבה עוברת בין מצבים.
הערכה (eval)
הערכה היא סוג של ניסוי שבו שאילתות מתועדות או סינתטיות נשלחות דרך שתי מערכות של חיפוש Google – מערכת ניסיונית שכוללת את השינוי שלכם ומערכת בסיסית בלי השינוי. ההערכות יוצרות הבדלים ומדדים שמאפשרים לכם להעריך את ההשפעה, האיכות והשפעות אחרות של השינוי על תוצאות החיפוש ועל חלקים אחרים בחוויית המשתמש ב-Google. ההערכות משמשות במהלך ההתאמה או האיטרציות של השינוי. הן משמשות גם כחלק מהשקת שינוי בתנועת משתמשים פעילה.
event
אירוע מתאר את הקשר בין ארטיפקטים לבין הפעלות. כל ארטיפקט יכול להיווצר על ידי הפעלה ולהיצרך על ידי הפעלות אחרות. אירועים עוזרים לקבוע את מקור הארטיפקטים בתהליכי העבודה של למידת המכונה (ML) על ידי שרשור של ארטיפקטים וביצועים.
execution
הרצה היא רשומה של שלב מסוים בתהליך העבודה של למידת מכונה, בדרך כלל עם הערות של פרמטרים של זמן הריצה. דוגמאות לביצועים כוללות קליטת נתונים, אימות נתונים, אימון מודלים, הערכת מודלים ופריסת מודלים.
ניסוי
ניסוי הוא הקשר שיכול להכיל קבוצה של n הרצות של ניסויים בנוסף להרצות של צינורות, שבהן משתמש יכול לבדוק, כקבוצה, הגדרות שונות כמו פריטי קלט או היפרפרמטרים.
הרצת ניסוי
ביצוע ספציפי שאפשר לעקוב אחריו במסגרת ניסוי ב-Vertex AI, שמתעד קלטים (כמו אלגוריתם, פרמטרים וערכות נתונים) ופלטים (כמו מודלים, נקודות ביקורת ומדדים) כדי לעקוב אחרי איטרציות של פיתוח למידת מכונה ולהשוות ביניהן. מידע נוסף זמין במאמר בנושא יצירה וניהול של הרצות ניסויים.
AI ניתן להסברה
תכונה של Vertex AI שמספקת כלים ויכולות להבנה ולפרשנות של מסקנות שנובעות ממודלים של למידת מכונה, ומציעה תובנות לגבי חשיבות התכונות והתנהגות המודל. מידע נוסף זמין במאמר מבוא ל-Vertex AI ניתן להסברה.
ניתוח נתונים ראשוני
בסטטיסטיקה, ניתוח נתונים ראשוני (EDA) הוא גישה לניתוח של מערכי נתונים כדי לסכם את המאפיינים העיקריים שלהם, לרוב באמצעות שיטות ויזואליות. אפשר להשתמש במודל סטטיסטי או לא, אבל בעיקר EDA נועד להראות לנו מה הנתונים יכולים לספר לנו מעבר למשימת המידול הפורמלית או בדיקת ההשערות.
ציון F1
ציון F1 הוא מדד שמשמש להערכת הדיוק של הפלט של מודל. המדד הזה שימושי במיוחד להערכת הביצועים של מודלים במשימות שבהן גם הדיוק וגם ההחזרה חשובים, כמו חילוץ מידע. במודלים של AI גנרטיבי, אפשר להשתמש בציון F1 כדי להשוות בין ההסקות של המודל לבין נתוני האמת הבסיסית, וכך לקבוע את רמת הדיוק של המודל. עם זאת, למשימות גנרטיביות כמו סיכום ויצירת טקסט, יכול להיות שיהיה מתאים יותר להשתמש במדדים אחרים כמו ציון Rough-L.
תכונה
בלמידת מכונה (ML), תכונה היא מאפיין של מופע או ישות שמשמש כקלט לאימון מודל ML או להסקת מסקנות.
הנדסת פיצ'רים (feature engineering)
הנדסת פיצ'רים (feature engineering) היא תהליך של שינוי נתונים גולמיים של למידת מכונה (ML) לפיצ'רים שאפשר להשתמש בהם כדי לאמן מודלים של למידת מכונה או כדי להסיק מסקנות.
קבוצת תכונות
קבוצת תכונות היא משאב במאגר התכונות שתואם לטבלה או לתצוגה של מקור ב-BigQuery שמכילים נתוני תכונות. תצוגת תכונות עשויה להכיל תכונות, ואפשר לחשוב עליה כקיבוץ לוגי של עמודות תכונות במקור הנתונים.
רשומת תכונה
רשומת תכונה היא צבירה של כל ערכי התכונות שמתארים את המאפיינים של ישות ייחודית בנקודת זמן מסוימת.
מאגר תכונות
מאגר תכונות הוא ממשק מרכזי לתיעוד מקורות נתונים של תכונות שרוצים להשתמש בהן להסקת מסקנות אונליין. מידע נוסף מופיע במאמר בנושא הגדרת Feature Registry.
feature serving
ייצוא מאפיינים הוא תהליך של ייצוא או אחזור של ערכי מאפיינים לצורך אימון או היקש. ב-Vertex AI יש שני סוגים של ייצוא מאפיינים: מילוי בקשה באופן מיידי וייצוא אופליין. מילוי בקשה באופן מיידי מאחזר את הערכים העדכניים ביותר של תכונות מתוך קבוצת משנה של מקור נתוני התכונות לצורך הסקת מסקנות באופן מיידי. ייצוא אופליין או שליפת נתונים ב-batch מאפשר לייצא כמויות גדולות של נתוני תכונות – כולל נתונים היסטוריים – לעיבוד אופליין, כמו אימון מודלים של למידת מכונה.
חותמת זמן של תכונה
חותמת זמן של תכונה מציינת מתי נוצר מערך ערכי התכונות ברשומה ספציפית של תכונה עבור ישות.
ערך התכונה
ערך של תכונה תואם לערך בפועל ולערך הניתן למדידה של תכונה (מאפיין) של מופע או ישות. אוסף של ערכי תכונות עבור הישות הייחודית מייצג את רשומת התכונות שמתאימה לישות.
תצוגת תכונות
תצוגת תכונות היא אוסף לוגי של תכונות שנוצרו ממקור נתונים ב-BigQuery למופע של חנות וירטואלית. תצוגת תכונות מאחסנת את נתוני התכונות של הלקוח ומרעננת אותם מעת לעת. הנתונים מתרעננים מעת לעת ממקור BigQuery. תצוגת תכונה משויכת לאחסון נתוני התכונה באופן ישיר או באמצעות שיוכים למשאבי מרשם התכונות.
Filestore
שירות אחסון קבצים מנוהל לחלוטין עם ביצועים גבוהים מ-Google Cloud, שמשמש לעיתים קרובות לאפליקציות שנדרשת בהן מערכת קבצים משותפת. מידע נוסף מופיע במאמר סקירה כללית על Filestore.
מודל בסיסי (FM)
מודלים שעברו אימון על נתונים רחבים, כך שאפשר להתאים אותם (לדוגמה, לכוונן אותם) למגוון רחב של משימות downstream.
תפעול של מודלים בסיסיים (FMOPs)
FMOps מרחיב את היכולות של MLOps ומתמקד בהעברה יעילה לייצור של מודלים בסיסיים שאומנו מראש (מאפס) או בהתאמה אישית (כוונון עדין).
Google Cloud pipeline components SDK
Google Cloud pipeline components (GCPC) SDK מספק קבוצה של רכיבי Kubeflow Pipelines מוכנים מראש, באיכות של מוצר, עם ביצועים טובים ונוחים לשימוש. אתם יכולים להשתמש ברכיבי צינור עיבוד נתונים של Google Cloud כדי להגדיר ולהפעיל צינורות עיבוד נתונים של ML ב-Vertex AI Pipelines ובקצה העורפי של הפעלת צינורות עיבוד נתונים אחרים של ML שתואמים ל-Kubeflow Pipelines. מידע נוסף זמין במאמר מבוא לרכיבי צינורות ב-Google Cloud.
Compute Engine
Compute Engine הוא רכיב של Google Cloud Platform, והוא פתרון של תשתית כשירות (IaaS) שמאפשר למשתמשים להריץ מכונות וירטואליות בתשתית של Google. מידע נוסף זמין במאמר סקירה כללית על Compute Engine.
מכונה ב-Compute Engine
מכונה ב-Compute Engine היא מכונה וירטואלית (VM) שפועלת בתשתית של Google. אתם יכולים לבחור את המפרט שלה, להריץ עליה אפליקציות ולהתחבר אליה דרך האינטרנט, אבל אתם לא צריכים לנהל את החומרה הפיזית. מידע נוסף זמין במאמר מכונות וירטואליות לכל עומס עבודה.
Google Embedded Modem System (GEMS)
GEMS הוא שלד תוכנה מוטמע שמיועד למודמים, וכולל קבוצה של תהליכי עבודה ותשתית לפיתוח. החזון המרכזי של GEMS הוא לספק קוד מערכת מודם באיכות גבוהה עם יכולת שימוש חוזר גבוהה במכשירים רבים של Google שמכילים מודמים. כדי להגשים את החזון הרחב הזה, GEMS מספקת סביבה מקיפה למפתחים, שכוללת את אבני הבניין העיקריות שמוצגות בהמשך.
gradient
הווקטור של הנגזרות החלקיות ביחס לכל המשתנים הבלתי תלויים. בלמידת מכונה, הגרדיאנט הוא וקטור של נגזרות חלקיות של פונקציית המודל. השיפוע מצביע על הכיוון של העלייה התלולה ביותר.
תרשים
בהקשר של Vertex AI, גרף הוא מבנה נתונים שמייצג את הקשרים בין ישויות לבין המאפיינים שלהן. הוא משמש ליצירת מודלים ולניתוח של נתונים מורכבים, כמו גרפים של ידע, רשתות חברתיות ותהליכים עסקיים. מידע נוסף זמין במאמר מבוא ל-Vertex ML Metadata.
נתוני אמת (GT)
המונח 'אמת בסיסית' משמש בתחומים שונים כדי להתייחס לאמת המוחלטת של בעיה מסוימת שקשורה להחלטה או למדידה, בניגוד להערכה של מערכת מסוימת. בלמידת מכונה, המונח 'אמת קרקע (ground truth)' מתייחס לקבוצת נתונים לאימון של שיטות למידה מפוקחת.
היוריסטיקה
פתרון פשוט לבעיה שאפשר ליישם במהירות. לדוגמה, "באמצעות היוריסטיקה, הגענו לרמת דיוק של 86%. כשעברנו לרשת נוירונים עמוקה, רמת הדיוק עלתה ל-98%".
שכבה מוסתרת
שכבה ברשת נוירונים בין שכבת הקלט (התכונות) לבין שכבת הפלט (היקש). כל שכבה סמויה מורכבת מנוירון אחד או יותר. רשת עצבית עמוקה מכילה יותר משכבה נסתרת אחת.
היסטוגרמה
הצגה גרפית של השונות בקבוצת נתונים באמצעות עמודות. היסטוגרמה מאפשרת לראות דפוסים שקשה לזהות בטבלה פשוטה של מספרים.
hyperparameter
היפר-פרמטר הוא משתנה ששולט בתהליך האימון של מודל למידת מכונה. המשתנים האלה יכולים לכלול שיעורי למידה, ערכי מומנטום באופטימיזציה ומספר היחידות בשכבה הנסתרת האחרונה של מודל. מידע נוסף זמין במאמר סקירה כללית על אופטימיזציה של היפרפרמטרים.
כוונון היפר-פרמטרים
התאמה של היפרפרמטרים ב-Vertex AI כוללת הפעלה של כמה ניסויים של אפליקציית אימון עם ערכים שונים להיפרפרמטרים שנבחרו, שמוגדרים במסגרת מגבלות שצוינו. המטרה היא לבצע אופטימיזציה של הגדרות ההיפרפרמטרים כדי למקסם את דיוק החיזוי של המודל. מידע נוסף זמין במאמר סקירה כללית על אופטימיזציה של היפרפרמטרים.
הרשאות של ניהול זהויות והרשאות גישה (IAM)
הרשאות בניהול זהויות והרשאות גישה (IAM) הן יכולות פרטניות ספציפיות שמגדירות למי יש אפשרות לבצע פעולות מסוימות במשאבים מסוימים ב-Google Cloud. הם מוקצים לישויות מורשות (כמו משתמשים, קבוצות או חשבונות שירות) באמצעות תפקידים, ומאפשרים שליטה מדויקת בגישה לשירותים ולנתונים בתוך פרויקט בענן או ארגון ב-Google Cloud. מידע נוסף זמין במאמר בקרת גישה באמצעות IAM.
זיהוי תמונות
זיהוי תמונות הוא תהליך של סיווג אובייקטים, דפוסים או מושגים בתמונה. היא נקראת גם סיווג תמונות. זיהוי תמונות הוא תחום משנה של למידת מכונה וראייה ממוחשבת.
index
אוסף של וקטורים שמוצבים יחד לחיפוש דמיון. אפשר להוסיף וקטורים לאינדקס או להסיר אותם ממנו. שאילתות של חיפוש דמיון מופנות לאינדקס ספציפי ומחפשות את הווקטורים באינדקס הזה.
הסקת מסקנות
בהקשר של פלטפורמת Vertex AI, הסקה מתייחסת לתהליך של הפעלת נקודות נתונים דרך מודל של למידת מכונה כדי לחשב פלט, כמו ציון מספרי יחיד. התהליך הזה נקרא גם "הפעלת מודל למידת מכונה" או "העברת מודל למידת מכונה לייצור". הסקת מסקנות היא שלב חשוב בתהליך העבודה של למידת מכונה, כי היא מאפשרת להשתמש במודלים כדי להסיק מסקנות לגבי נתונים חדשים. ב-Vertex AI, אפשר לבצע הסקה בדרכים שונות, כולל הסקה באצווה והסקה אונליין. הסקת מסקנות באצווה כוללת הפעלה של קבוצת בקשות להסקת מסקנות והפקת התוצאות בקובץ אחד, בעוד שהסקת מסקנות אונליין מאפשרת להסיק מסקנות בזמן אמת לגבי נקודות נתונים בודדות.
אחזור מידע (IR)
אחזור מידע (IR) הוא רכיב מרכזי בחיפוש מבוסס-Vertex AI. זהו תהליך של חיפוש ואחזור מידע רלוונטי מתוך אוסף גדול של נתונים. בהקשר של Vertex AI, מערכת IR משמשת לאחזור מסמכים ממאגר מידע על סמך שאילתה של משתמש. Vertex AI מציע חבילה של ממשקי API שיעזרו לכם לבנות אפליקציות משלכם של Retrieval Augmented Generation (יצירה משולבת-אחזור, RAG) או לבנות מנוע חיפוש משלכם. מידע נוסף זמין במאמר שימוש בחיפוש מבוסס-Vertex AI כקצה עורפי לאחזור באמצעות RAG Engine.
תשתית כקוד (IaC)
תשתית כקוד. גישה לניהול תשתית IT שבה צוותים יכולים לנהל שירותים ולספק אותם באמצעות קוד. עם IaC, נוצרים קובצי תצורה שמכילים את מפרטי התשתית, וכך קל יותר ליצור ולערוך תשתית בהיקף גדול.
תשתית כקוד (IaC)
תשתית כקוד. גישה לניהול תשתית IT שבה צוותים יכולים לנהל שירותים ולספק אותם באמצעות קוד. עם IaC, נוצרים קובצי תצורה שמכילים את מפרטי התשתית, וכך קל יותר ליצור ולערוך תשתית בהיקף גדול.
מיקום הוא המקום הפיזי בעולם שבו מתארחים משאבי הענן שלכם. הקונספט הזה מחולק לשני חלקים עיקריים: אזורים ותחומים. מידע נוסף זמין במאמר אזורים ותחומים.
מיקום
מיקום הוא המקום הפיזי בעולם שבו מתארחים משאבי הענן שלכם. הקונספט הזה מחולק לשני חלקים עיקריים: אזורים ותחומים. מידע נוסף זמין במאמר אזורים ותחומים.
login node
צומת התחברות הוא נקודת הכניסה הראשית של משתמש כדי לגשת לאשכול, לשלוח עבודות ולנהל קבצים. מידע נוסף זמין במאמר מהו מחשוב עתיר ביצועים?
מטא-נתונים של למידת מכונה
ML Metadata (MLMD) היא ספרייה לתיעוד ולאחזור של מטא-נתונים שמשויכים לזרימות עבודה של מפתחי למידת מכונה ומדעני נתונים. MLMD הוא חלק בלתי נפרד מ-TensorFlow Extended (TFX), אבל הוא מתוכנן כך שאפשר להשתמש בו באופן עצמאי. כחלק מפלטפורמת TFX הרחבה יותר, רוב המשתמשים מקיימים אינטראקציה עם MLMD רק כשהם בודקים את התוצאות של רכיבי צינור, למשל במחברות או ב-TensorBoard.
מערך נתונים מנוהל
אובייקט של מערך נתונים שנוצר ב-Vertex AI ומארח אותו.
רישום ידני ביומן
התהליך של הוספת קוד באופן מפורש (לדוגמה, באמצעות Vertex AI SDK ל-Python) לסקריפט אימון כדי לעקוב אחרי פרמטרים, מדדים וארטיפקטים מותאמים אישית ולרשום אותם ביומן של הרצת ניסוי ב-Vertex AI Experiments. מידע נוסף זמין במאמר סקירה כללית על ניהול יומנים וניטור.
Managed Lustre
מערכת קבצים מקבילית ומבוזרת שמיועדת למחשוב עתיר ביצועים. Managed Lustre של Google Cloud מספק מערכת קבצים עם תפוקה גבוהה לעומסי עבודה תובעניים. מידע נוסף מופיע במאמר סקירה כללית על Managed Lustre.
אימון מנוהל באשכולות שמורים
אימון מנוהל באשכולות שמורים הוא שירות של Google Cloud שנועד לפשט ולהאיץ את עומסי העבודה הגדולים והמורכבים ביותר של AI/ML. השירות מספק חוויה מנוהלת לחלוטין בחומרה ייעודית ושמורה. הוא נועד לפתור אתגרים נפוצים באימון מודלים בקנה מידה גדול, כולל הגדרה מורכבת של אשכולות, שחזור אחרי כשל בחומרה ואופטימיזציה של מסגרות. מידע נוסף מופיע במאמר סקירה כללית על אימון מנוהל באשכולות שמורים.
שינוי גודל ידני
הגדלה או הקטנה ידנית של הקיבולת מתייחסת לתהליך של שינוי מכוון ומפורש של מספר משאבי המחשוב (כמו מכונות וירטואליות, קונטיינרים או שרתים) שהוקצו לאפליקציה או לשירות על ידי משתמש או אדמין. בניגוד להתאמה אוטומטית לעומס, שמתאימה את המשאבים באופן אוטומטי לפי הביקוש, התאמה ידנית לעומס מחייבת התערבות ישירה כדי להקצות משאבים או לבטל את ההקצאה שלהם. כך אפשר לשלוט במשאבים בצורה מדויקת, אבל אין את הגמישות של פתרונות אוטומטיים. מידע נוסף זמין במאמר שינוי גודל של אשכולות Ray ב-Vertex AI: שינוי גודל ידני.
שינוי גודל ידני
הגדלה או הקטנה ידנית של הקיבולת מתייחסת לתהליך של שינוי מכוון ומפורש של מספר משאבי המחשוב (כמו מכונות וירטואליות, קונטיינרים או שרתים) שהוקצו לאפליקציה או לשירות על ידי משתמש או אדמין. בניגוד להתאמה אוטומטית לעומס, שמתאימה את המשאבים באופן אוטומטי לפי הביקוש, התאמה ידנית לעומס מחייבת התערבות ישירה כדי להקצות משאבים או לבטל את ההקצאה שלהם. כך אפשר לשלוט במשאבים בצורה מדויקת, אבל אין את הגמישות של פתרונות אוטומטיים. מידע נוסף זמין במאמר שינוי גודל של אשכולות Ray ב-Vertex AI: שינוי גודל ידני.
יחידת שידור מקסימלית (MTU)
הגודל המקסימלי של מנת נתונים שמכשיר שמחובר לרשת יכול לשדר. גדלים גדולים יותר של MTU (מסגרות ג'מבו) יכולים לשפר את ביצועי הרשת עבור עומסי עבודה מסוימים. מידע נוסף זמין במאמר בנושא יחידת שידור מקסימלית.
MetadataSchema
MetadataSchema מתאר את הסכימה של סוגים מסוימים של ארטיפקטים, הפעלות או הקשרים. משתמשים ב-MetadataSchemas כדי לאמת את צמדי המפתח/ערך במהלך היצירה של משאבי המטא-נתונים התואמים. אימות הסכימה מתבצע רק בשדות תואמים בין המשאב לבין MetadataSchema. סכימות של סוגים מיוצגות באמצעות אובייקטים של סכימת OpenAPI, שצריך לתאר באמצעות YAML.
MetadataStore
MetadataStore הוא הקונטיינר ברמה העליונה של משאבי מטא-נתונים. מאגר המטא-נתונים הוא אזורי ומשויך לפרויקט ספציפי ב-Google Cloud. בדרך כלל, ארגון משתמש במאגר MetadataStore משותף אחד למשאבי מטא-נתונים בכל פרויקט.
צינורות עיבוד נתונים של ML
צינורות עיבוד נתונים של למידת מכונה הם תהליכי עבודה ניידים וניתנים להרחבה של למידת מכונה שמבוססים על קונטיינרים.
model
כל מודל, שעבר אימון מראש או לא. באופן כללי, כל מבנה מתמטי שמבצע עיבוד של נתוני קלט ומחזיר פלט. במילים אחרות, מודל הוא קבוצת הפרמטרים והמבנה שנדרשים למערכת כדי להסיק מסקנות.
זיקוק מודלים (זיקוק ידע, מודלים של מורה-תלמיד)
זיקוק מודל הוא טכניקה שמאפשרת למודל תלמיד קטן יותר ללמוד ממודל מורה גדול יותר. המודל של התלמיד מאומן לחקות את הפלט של המודל של המורה, ואז אפשר להשתמש בו כדי ליצור נתונים חדשים או להסיק מסקנות. זיקוק מודלים משמש לעיתים קרובות כדי לשפר את היעילות של מודלים גדולים או כדי להפוך אותם לנגישים יותר למכשירים עם משאבים מוגבלים. אפשר להשתמש בו גם כדי לשפר את ההכללה של מודלים על ידי הפחתת התאמת יתר.
Model Evaluation
הכלי להערכת מודלים ב-Vertex AI הוא שירות מנוהל בפלטפורמת Vertex AI של Google Cloud, שעוזר למשתמשים להעריך את הביצועים והאיכות של המודלים ללמידת מכונה שלהם. הכלי מספק כלים ליצירת מדדי הערכה שונים והדמיות, שמאפשרים למשתמש להבין את רמת הביצועים של המודלים שלו, לזהות הטיה פוטנציאלית ולקבל החלטות מושכלות לגבי פריסת המודלים ושיפורם. מידע נוסף זמין במאמר הערכת מודלים ב-Vertex AI.
מעקב אחרי מודלים
שירות Vertex AI Model Monitoring מעריך באופן רציף את הביצועים של מודלים שנפרסו על ידי זיהוי של הטיה (skew) ותזוזה (drift) בתכונות בבקשות לחיזוי, וכך עוזר לשמור על איכות המודל לאורך זמן. מידע נוסף זמין במאמר מבוא ל-Vertex AI Model Monitoring.
שם המשאב של המודל
שם המשאב של model הוא: projects/<PROJECT_ID>/locations/<LOCATION_ID>/models/<MODEL_ID>. אפשר למצוא את מזהה המודל במסוף Cloud בדף מרשם המודלים.
Network File System (NFS)
מערכת לקוח/שרת שמאפשרת למשתמשים לגשת לקבצים ברשת ולטפל בהם כאילו הם נמצאים בספריית קבצים מקומית. מידע נוסף זמין במאמר בנושא הוספת שיתוף של מערכת קבצים ברשת.
NVIDIA Collective Communications Library (NCCL)
ספרייה שמספקת פרימיטיבים אופטימליים לתקשורת בין מעבדי GPU עבור מסגרות של למידה עמוקה, ומאפשרת אימון רב-מעבדי GPU עם ביצועים גבוהים. מידע נוסף זמין במאמר NVIDIA Collective Communications Library (NCCL).
node
מכונה וירטואלית אחת (מכונה וירטואלית של Compute Engine) באשכול. בהקשר של אימון מנוהל באשכולות שמורים, צומת מתייחס למכונה וירטואלית (VM) ספציפית שמשמשת כיחידת חישוב יחידה באשכול. אפשר לחשוב על זה כאחת ממכונות ה-worker הייעודיות שמריצות חלק ממשימת האימון הכוללת. כל צומת מצויד במשאבים ספציפיים כמו CPU, זיכרון ומאיצים (לדוגמה, GPU מסוג A3 או A4), וכולם פועלים יחד בצורה מתואמת כדי לטפל במשימות אימון מבוזרות בקנה מידה גדול.
offline store
המאגר במצב אופליין הוא מתקן אחסון שבו מאוחסנים נתונים של תכונות מהזמן האחרון ונתונים היסטוריים, שבדרך כלל משמשים לאימון מודלים של למידת מכונה. חנות אופליין מכילה גם את ערכי התכונות העדכניים ביותר, שאפשר להשתמש בהם להסקת מסקנות אונליין.
הסקת מסקנות אונליין
קבלת מסקנות לגבי מקרים ספציפיים באופן סינכרוני. מידע נוסף זמין במאמר בנושא הסקת מסקנות אונליין.
תחזית אונליין
קבלת חיזויים לגבי מקרים ספציפיים באופן סינכרוני. מידע נוסף זמין במאמר בנושא חיזוי אונליין.
חנות וירטואלית
בניהול התכונות, חנות וירטואלית היא מתקן אחסון של ערכי התכונות העדכניים ביותר שמוצגים להסקת מסקנות אונליין.
פרמטר
פרמטרים הם ערכי קלט עם מפתח שמגדירים הפעלה, מווסתים את ההתנהגות של ההפעלה ומשפיעים על התוצאות שלה. לדוגמה, קצב הלמידה, שיעור הנשירה ומספר שלבי האימון.
partition
ב-Slurm, קבוצה לוגית של צמתים, שמשמשת לעיתים קרובות להפרדה בין צמתים עם הגדרות חומרה שונות.
שכבת ביצועים
הגדרת תצורה של מופע Managed Lustre שמגדירה את מהירות התפוקה שלו (ב-MBps לכל TiB) ומשפיעה על הקיבולת המינימלית והמקסימלית שלו.
משאב קבוע
סוג של משאב מחשוב ב-Vertex AI, כמו אשכול Ray, שנשאר מוקצה וזמין עד למחיקה מפורשת. זה מועיל לפיתוח איטרטיבי ומצמצם את התקורה של ההפעלה בין משימות. מידע נוסף זמין במאמר קבלת מידע מתמשך על משאבים.
pipeline
צינורות עיבוד נתונים של למידת מכונה הם תהליכי עבודה ניידים וניתנים להרחבה של למידת מכונה שמבוססים על קונטיינרים. מידע נוסף זמין במאמר מבוא ל-Vertex AI Pipelines.
רכיב של צינור עיבוד נתונים
קבוצה עצמאית של קוד שמבצעת שלב אחד בתהליך העבודה של צינור עיבוד נתונים, כמו עיבוד מקדים של נתונים, שינוי נתונים ואימון מודל.
pipeline job
משימת צינור עיבוד נתונים או הרצה של צינור עיבוד נתונים תואמות למשאב PipelineJob ב-Vertex AI API. זוהי דוגמה להרצה של הגדרת צינור עיבוד נתונים של למידת מכונה, שמוגדרת כקבוצה של משימות למידת מכונה שמקושרות ביניהן באמצעות יחסי תלות של קלט-פלט.
הפעלת צינור עיבוד נתונים
אפשר לשייך ניסוי למשימה אחת או יותר של צינור עיבוד נתונים ב-Vertex, כאשר כל משימה של צינור עיבוד נתונים מיוצגת כהפעלה יחידה. בהקשר הזה, הפרמטרים של ההרצה נגזרים מהפרמטרים של PipelineJob. המדדים נגזרים מהמערכת.ארטיפקטים של מדדים שנוצרו על ידי PipelineJob. הארטיפקטים של הריצה נגזרים מארטיפקטים שנוצרו על ידי PipelineJob.
pipeline template
הגדרה של תהליך עבודה של למידת מכונה שמשתמש אחד או כמה משתמשים יכולים לעשות בה שימוש חוזר כדי ליצור כמה הרצות של צינורות.
positive class
'הסיווג החיובי' מתייחס לתוצאה או לקטגוריה שהמודל אומן לחזות. לדוגמה, אם מודל מנסה לחזות אם לקוח ירכוש מעיל, המחלקה החיובית תהיה 'הלקוח רוכש מעיל'. באופן דומה, במודל שמנבא הרשמה של לקוחות לפיקדון לזמן קצוב, הסיווג החיובי יהיה 'הלקוח נרשם'. ההפך הוא 'הסיווג השלילי'.
מאגר מוכן מראש
קובצי אימג' של קונטיינר שמסופקים על ידי Vertex AI ומגיעים עם מסגרות ותלויות נפוצות של למידת מכונה שמותקנות מראש, כדי לפשט את ההגדרה של משימות אימון והיקש. מידע נוסף זמין במאמר מאגרי תגים מוכנים מראש לאימון בלי שרת (serverless) .
גישה פרטית ל-Google (PGA)
הגישה הפרטית ל-Google מאפשרת למכונות וירטואליות עם כתובות IP פנימיות (פרטיות) בלבד (ללא כתובות IP חיצוניות) להגיע לכתובות ה-IP הציבוריות של שירותים וממשקי API של Google. מידע נוסף זמין במאמר הגדרת גישה פרטית ל-Google.
גישה לשירותים פרטיים
גישה לשירותים פרטיים היא חיבור פרטי בין הרשת של הענן הווירטואלי הפרטי (VPC) שלכם לבין רשתות בבעלות Google או ספקי שירותים של צד שלישי. היא מאפשרת למכונות וירטואליות ברשת ה-VPC לתקשר עם השירותים האלה באמצעות כתובות IP פנימיות, וכך להימנע מחשיפה לאינטרנט הציבורי. מידע נוסף זמין במאמר גישה לשירותים פרטיים.
Private Service Connect (PSC)
Private Service Connect היא טכנולוגיה שמאפשרת ללקוחות Compute Engine למפות כתובות IP פרטיות ברשת שלהם לרשת VPC אחרת או לממשקי API של Google. מידע נוסף זמין במאמר Private Service Connect.
ממשק Private Service Connect (PSC-I)
ממשק Private Service Connect מאפשר לספקים ליזום חיבורים באופן פרטי לכל משאבי הרשת ב-VPC של הצרכן.
producer VPC
רשת VPC של ספק היא רשת של ענן וירטואלי פרטי (VPC) שמארחת שירות מנוהל ומאפשרת לרשתות VPC אחרות לגשת אליו.
quantization
קוונטיזציה היא טכניקה לאופטימיזציה של מודלים שמשמשת להפחתת הדיוק של המספרים שמשמשים לייצוג הפרמטרים של המודל. הדבר יכול להוביל למודלים קטנים יותר, לצריכת חשמל נמוכה יותר ולזמן אחזור מופחת של הסקת מסקנות.
Random Forest
Random Forest הוא אלגוריתם של למידת מכונה שמשמש לסיווג ולרגרסיה. הוא לא מודל AI גנרטיבי בעצמו, אבל הוא רכיב שאפשר להשתמש בו במערכת גדולה יותר של AI גנרטיבי. יער אקראי מורכב מכמה עצי החלטה, וההסקה שלו היא צבירה של ההסקות מהעצים הבודדים האלה. לדוגמה, במשימת סיווג, כל עץ 'מצביע' על מחלקה, והמסקנה הסופית היא המחלקה עם הכי הרבה הצבעות. מידע נוסף זמין במאמר בנושא יער החלטות.
Ray client API (Ray Client)
Ray client הוא API שמאפשר לסקריפט Python מקומי או למעטפת אינטראקטיבית (כמו Jupyter notebook) להתחבר לאשכול Ray מרוחק ולקיים איתו אינטראקציה. בעצם, לקוח Ray מאפשר למשתמשים לפתח ולהריץ קוד Ray כאילו הקוד רץ באופן מקומי, תוך ניצול כוח המחשוב המבוזר של אשכול מרוחק. מידע נוסף זמין במאמר סקירה כללית על Ray ב-Vertex AI.
Ray cluster on Vertex AI
קלאסטר Ray ב-Vertex AI הוא קלאסטר מנוהל של צמתי מחשוב שאפשר להשתמש בו כדי להריץ אפליקציות של למידת מכונה (ML) ושל Python מבוזרות. הוא מספק את התשתית לביצוע חישוב מבוזר ועיבוד מקבילי בתהליך העבודה של למידת המכונה. אשכולות Ray מובנים ב-Vertex AI כדי להבטיח זמינות של קיבולת לעומסי עבודה קריטיים של ML או בעונות שיא. בניגוד למשימות בהתאמה אישית, שבהן שירות ההדרכה משחרר את המשאב אחרי שהמשימה מסתיימת, קלאסטרים של Ray נשארים זמינים עד שהם נמחקים. מידע נוסף זמין במאמר סקירה כללית על Ray ב-Vertex AI.
Ray on Vertex AI (RoV)
Ray ב-Vertex AI מתוכנן כך שתוכלו להשתמש באותו קוד Ray בקוד פתוח כדי לכתוב תוכניות ולפתח אפליקציות ב-Vertex AI עם שינויים מינימליים. מידע נוסף זמין במאמר סקירה כללית על Ray ב-Vertex AI.
Ray on Vertex AI SDK ל-Python
Ray on Vertex AI SDK for Python היא גרסה של Vertex AI SDK ל-Python שכוללת את הפונקציונליות של Ray Client, Ray BigQuery connector, Ray cluster management ב-Vertex AI והסקת מסקנות ב-Vertex AI. מידע נוסף זמין במאמר מבוא ל-Vertex AI SDK ל-Python.
recall
אחוז השכנים הקרובים האמיתיים שמוחזרים על ידי האינדקס. לדוגמה, אם שאילתת שכנים קרובים ל-20 שכנים קרובים החזירה 19 מהשכנים הקרובים של 'האמת הבסיסית', הזיכרון הוא 19/20x100 = 95%.
מתכון
בהקשר של Managed Training, מתכון הוא חבילה מקיפה וניתנת לשימוש חוזר שמכילה את כל מה שצריך כדי להריץ עומס עבודה ספציפי של אימון בקנה מידה גדול.
שרת צמצום
שרת Reduction הוא תכונה או רכיב שזמינים ב-Vertex AI, והוא מיועד במיוחד לאופטימיזציה של אימון GPU מבוזר. שרת ההפחתה פועל כאלגוריתם all-reduce שעוזר להגדיל את התפוקה ולהפחית את זמן האחזור באימון מודלים של למידת מכונה בקנה מידה גדול. מידע נוסף זמין במאמר בנושא קיצור זמן האימון באמצעות Reduction Server.
רגולריזציה
רגולריזציה היא טכניקה שמשמשת למניעת התאמת יתר במודלים של למידת מכונה. התאמת יתר מתרחשת כשמודל לומד את נתוני האימון בצורה טובה מדי, וכתוצאה מכך הביצועים שלו על נתונים שלא נראו לו קודם נמוכים. סוג ספציפי של רגולריזציה שמוזכר הוא עצירה מוקדמת, שבה האימון מופסק לפני שההפסד במערך נתוני אימות מתחיל לעלות, מה שמצביע על ירידה בביצועי ההכללה. מידע נוסף מופיע במאמר בנושא Overfitting: L2 regularization (התאמת יתר: רגולריזציה מסוג L2).
למידת חיזוק (RL)
סוג של למידת מכונה שבה סוכן לומד לקבל החלטות על ידי ביצוע פעולות בסביבה כדי למקסם את התגמול המצטבר. למידע נוסף, ראו שיפור ביצועים באמצעות RLHF ב-Vertex AI.
מגביל
פונקציונליות ל'הגבלת' חיפושים לקבוצת משנה של האינדקס באמצעות כללים בוליאניים. הגבלה נקראת גם "סינון". בעזרת חיפוש וקטורי, אפשר להשתמש בסינון מספרי ובסינון של מאפייני טקסט.
חשבון שירות
חשבונות שירות הם חשבונות מיוחדים ב-Google Cloud שאפליקציות או מכונות וירטואליות משתמשות בהם כדי לבצע קריאות מורשות ל-API של שירותי Google Cloud. בניגוד לחשבונות משתמשים, הם לא משויכים לאדם פרטי, אלא משמשים כזהות לקוד שלכם, ומאפשרים גישה מאובטחת ותוכנתית למשאבים בלי לדרוש אישורים של בני אדם. מידע נוסף מופיע במאמר סקירה כללית על חשבונות שירות.
סוכן שירות
סוכן שירות הוא חשבון שירות בניהול Google. הוא משמש כששירות מסוים צריך גישה למשאבים שנוצרו על ידי שירות אחר. לדוגמה, כששירותי Dataflow או Dataproc צריכים ליצור מופעים במהלך זמן הריצה, או כשפונקציית Cloud Functions רוצה להשתמש בשירות לניהול מפתחות (KMS) כדי להגן על פונקציית Cloud Functions. סוכני שירות נוצרים אוטומטית על ידי Google Cloud כששירות מסוים דורש אותם. בדרך כלל משתמשים בהם כדי לנהל את הגישה למשאבים ולבצע משימות שונות בשם השירות. מידע נוסף מופיע במאמר סוכני שירות.
Simple Linux Utility for Resource Management (SLURM)
Slurm הוא מנהל עומסי עבודה ומתזמן משימות חזק ופופולרי בקוד פתוח לליבות של Linux ו-Unix, במיוחד בסביבות של מחשוב עתיר ביצועים (HPC). מידע נוסף זמין במאמר הכלי לניהול עומסי עבודה Slurm.
אשכול Slurm
אוסף של מופעי Compute Engine שמנוהלים על ידי Slurm, שכולל צומת כניסה וכמה צמתים של עובדים שהוגדרו להרצת משימות אימון. מידע נוסף זמין במאמר הכלי לניהול עומסי עבודה Slurm.
מדדי סיכום
מדדי הסיכום הם ערך יחיד לכל מפתח מדד בהרצת ניסוי. לדוגמה, דיוק הבדיקה של ניסוי הוא הדיוק שמחושב ביחס למערך נתוני בדיקה בסוף האימון, שאפשר לתעד אותו כמדד סיכום של ערך יחיד.
כוונון עדין מפוקח (SFT)
טכניקה של למידת מכונה שבה מודל שאומן מראש עובר אימון נוסף על מערך נתונים קטן יותר ומתויג, כדי להתאים אותו למשימה ספציפית.
TensorBoard
TensorBoard היא חבילה של אפליקציות אינטרנט להמחשה ולהבנה של הפעלות ומודלים של TensorFlow. מידע נוסף זמין במאמר בנושא TensorBoard.
מכונת TensorBoard
מופע TensorBoard הוא משאב אזורי שבו מאוחסנים ניסויים של Vertex AI TensorBoard שמשויכים לפרויקט. אפשר ליצור כמה מופעים של TensorBoard בפרויקט, למשל אם רוצים כמה מופעים עם הפעלה של CMEK. זהה למשאב TensorBoard ב-API.
שם המשאב של TensorBoard
שם משאב של TensorBoard משמש לזיהוי מלא של מופע TensorBoard של Vertex AI. הפורמט הוא: projects/PROJECT_ID_OR_NUMBER/locations/REGION/tensorboards/TENSORBOARD_INSTANCE_ID.
TensorFlow Extended (TFX)
TensorFlow extended (TFX) היא פלטפורמה מקצה לקצה לפריסת צינורות של למידת מכונה לייצור, שמבוססים על פלטפורמת TensorFlow.
TensorFlow Serving container
קובץ אימג' של קונטיינר ייעודי שנועד להפעיל מודלים של TensorFlow להסקת מסקנות בצורה יעילה. משתמשים בו כשפורסים מודלים טבלאיים בהתאמה אישית באמצעות Vertex AI Model Monitoring.
הזמן שחלף
הזמן שחלף הוא יחסי לתחילת הסרטון.
פלח זמן
פלח זמן מזוהה לפי היסטים של זמן התחלה וזמן סיום.
מדדים של סדרות עיתיות
מדדים של סדרות עיתיות הם ערכים של מדדים לאורך זמן, שכל ערך מייצג שלב בחלק של שגרת האימון בהרצה. מדדים של סדרות עיתיות מאוחסנים ב-Vertex AI TensorBoard. ב-Vertex AI Experiments מאוחסן הפניה למשאב Vertex TensorBoard.
token
טוקן במודל שפה הוא היחידה האטומית שהמודל מתאמן עליה ומסיק ממנה מסקנות, כלומר מילים, מורפמות ותווים. בדומיינים מחוץ למודלי שפה, טוקנים יכולים לייצג סוגים אחרים של יחידות אטומיות. לדוגמה, בראייה ממוחשבת, טוקן יכול להיות קבוצת משנה של תמונה. מידע נוסף זמין במאמר רשימה וספירה של אסימונים.
אשכול אימון
אשכול אימון הוא קבוצה של משאבי מחשוב מחוברים (כמו מכונות וירטואליות, מעבדי GPU ואחסון משויך) שהוגדרו במיוחד לביצוע עומסי עבודה של אימון מודלים של למידת מכונה באופן מבוזר. האשכולות האלה נועדו לספק את כוח המחשוב והמדרגיות שנדרשים לאימון מודלים מורכבים בצורה יעילה, ולרוב הם מנצלים עיבוד מקביל בכמה צמתים. מידע נוסף מופיע במאמר בנושא המבנה של אשכול האימון.
קבוצת נתונים לאימון
ב-Vertex AI, קבוצת הנתונים לאימון היא החלק הכי גדול בנתונים (בדרך כלל 80%) שמשמש לאימון מודל של למידת מכונה. המודל לומד את הדפוסים והקשרים בנתונים האלה כדי להסיק מסקנות. קבוצת נתונים לאימון שונה מקבוצות האימות וקבוצות נתונים לבדיקה, שמשמשות להערכת הביצועים של המודל במהלך האימון ואחריו.
מסלול
'מסלול' מתייחס לרצף של שלבים או פעולות שמבצע סוכן או מודל. המדד הזה משמש לעיתים קרובות להערכת מודלים גנרטיביים, שבהם נבדקת היכולת של המודל ליצור טקסט, קוד או תוכן אחר. יש כמה סוגים של מדדי מסלול שאפשר להשתמש בהם כדי להעריך מודלים גנרטיביים, כולל התאמה מדויקת של מסלול, התאמה של מסלול לפי סדר, התאמה של מסלול בכל סדר ודיוק של מסלול. המדדים האלה מודדים את הדמיון בין הפלט של המודל לבין קבוצה של פלטים לדוגמה שנוצרו על ידי בני אדם.
שנאי
'טרנספורמר' הוא ארכיטקטורת רשת נוירונים שעומדת בבסיס רוב המודלים הגנרטיביים החדשניים. הוא משמש ביישומים שונים של מודלי שפה, כולל תרגום. מודלים של טרנספורמרים מורכבים ממקודד ומפענח. המקודד ממיר טקסט קלט לייצוג ביניים, והמפענח ממיר את הייצוג הזה לפלט שימושי. הם משתמשים במנגנון של קשב עצמי כדי לאסוף הקשר מהמילים שמקיפות את המילה שעוברת עיבוד. הדרכה של מודל Transformer דורשת משאבים משמעותיים, אבל כוונון עדין של מודל Transformer שאומן מראש עבור אפליקציות ספציפיות הוא יעיל יותר.
חיובי אמיתי
'חיובי אמיתי' מתייחס להיקש שבו המודל מזהה נכון מחלקה חיובית. לדוגמה, אם מודל אומן לזהות לקוחות שירכשו מעיל, חיובי אמיתי יהיה חיזוי נכון שלקוח יבצע רכישה כזו.
פריטי מידע שנוצרו בתהליך פיתוח (Artifact) לא מנוהלים
ארטיפקט שקיים מחוץ להקשר של Vertex AI.
וקטור
וקטור הוא ייצוג מספרי של טקסט, תמונות או סרטונים, שמתעד את הקשרים בין נתוני הקלט. מודלים של למידת מכונה מתאימים ליצירת הטמעות על ידי זיהוי דפוסים בתוך קבוצות נתונים גדולות. אפליקציות יכולות להשתמש בהטמעות כדי לעבד ולייצר שפה, ולזהות משמעויות מורכבות וקשרים סמנטיים שספציפיים לתוכן. מידע נוסף מופיע במאמר סקירה כללית על ממשקי Embeddings API.
Vertex AI Agent Engine
Vertex AI Agent Engine, חלק מהפלטפורמה AI Platform, הוא קבוצה של שירותים שמאפשרים למפתחים לפרוס, לנהל ולבצע התאמה לעומס (scaling) של סוכני AI בסביבת ייצור. Agent Engine מטפל בתשתית כדי להרחיב את השימוש בסוכנים בסביבת הייצור, כך שתוכלו להתמקד ביצירת אפליקציות. מידע נוסף זמין במאמר סקירה כללית על Vertex AI Agent Engine.
סוג הנתונים של Vertex AI
סוגי הנתונים ב-Vertex AI הם image, text, tabular ו-video.
Vertex AI Experiments
באמצעות Vertex AI Experiments, המשתמשים יכולים לעקוב אחרי הפעולות הבאות: 1. שלבים בהרצת ניסוי (לדוגמה, עיבוד מקדים ואימון). 2. נתוני קלט (לדוגמה, אלגוריתם, פרמטרים ומערכי נתונים). 3. פלט של השלבים האלה (לדוגמה, מודלים, נקודות ביקורת ומדדים).
שירות Vertex AI שמאפשר להשתמש במודל מאומן של למידת מכונה (ML) כדי להסיק מסקנות מנתונים חדשים שלא נראו קודם. Vertex AI מספק שירותים לפריסת מודלים לצורך הסקת מסקנות. מידע נוסף זמין במאמר קבלת מסקנות ממודל שאומן בהתאמה אישית.
Vertex ML Metadata
מערכת למעקב ולניתוח של מטא-נתונים מתהליכי עבודה של למידת מכונה. מידע נוסף זמין במאמר מבוא ל-Vertex ML Metadata.
מרשם המודלים של Vertex AI
מרשם המודלים של Vertex AI הוא מאגר מרכזי שבו אפשר לנהל את מחזור החיים של מודלים של למידת מכונה. במרשם המודלים של Vertex AI, תוכלו לראות סקירה כללית של המודלים שלכם כדי לארגן אותם טוב יותר, לעקוב אחריהם ולאמן גרסאות חדשות. אם יש לכם גרסת מודל שאתם רוצים לפרוס, אתם יכולים להקצות אותה לנקודת קצה ישירות מהמאגר, או לפרוס מודלים לנקודת קצה באמצעות שמות חלופיים. מידע נוסף זמין במאמר מבוא למרשם המודלים של Vertex AI.
Vertex AI SDK ל-Python
Vertex AI SDK ל-Python מספק פונקציונליות דומה לזו של ספריית הלקוח של Vertex AI Python, אבל ה-SDK הוא ברמה גבוהה יותר ופחות מפורט.
Vertex AI TensorBoard
Vertex AI TensorBoard הוא שירות מנוהל וניתן להרחבה ב-Google Cloud, שמאפשר למדעני נתונים ולמהנדסי ML להמחיש את הניסויים שלהם בלמידת מכונה, לנפות באגים באימון המודלים ולעקוב אחרי מדדי הביצועים באמצעות הממשק המוכר של TensorBoard בקוד פתוח. הוא משתלב בצורה חלקה עם Vertex AI Training ושירותים אחרים, ומספק אחסון מתמיד לנתוני ניסויים ומאפשר ניתוח משותף של פיתוח מודלים. מידע נוסף זמין במאמר מבוא ל-Vertex AI TensorBoard.
Vertex AI Workbench היא סביבת פיתוח מאוחדת שמבוססת על מחברת Jupyter, ותומכת בכל תהליך העבודה של מדעי הנתונים, החל מחיפוש וניתוח נתונים ועד לפיתוח, לאימון ולפריסה של מודלים. Vertex AI Workbench מספק תשתית מנוהלת וניתנת להרחבה עם שילובים מובנים לשירותים אחרים של Google Cloud, כמו BigQuery ו-Cloud Storage. כך מדעני נתונים יכולים לבצע את משימות למידת המכונה שלהם ביעילות בלי לנהל את התשתית הבסיסית. מידע נוסף זמין במאמר מבוא ל-Vertex AI Workbench.
פלח סרטון
קטע וידאו מזוהה לפי ההיסט של זמן ההתחלה וזמן הסיום של הסרטון.
מכונה וירטואלית (VM)
מכונה וירטואלית (VM) היא מערכת מחשב שלמה שמודמת לחלוטין בתוכנה. היא פועלת כ'אורחת' עצמאית במכונה פיזית 'מארחת'. למידע נוסף, ראו מכונות Compute Engine.
ענן וירטואלי פרטי (VPC)
ענן פרטי מאובטח ומבודד שמתארח בענן ציבורי, ומאפשר להגדיר רשת וירטואלית שמבודדת באופן לוגי מרשתות וירטואליות אחרות ב-Google Cloud. מידע נוסף זמין במאמר בנושא ענן וירטואלי פרטי.
קישור בין רשתות VPC שכנות (peering)
חיבור רשת שמאפשר לשתי רשתות VPC לתקשר באופן פרטי. בהקשר של Managed Training באשכולות שמורים, קישור בין רשתות VPC שכנות (peering) הוא רכיב קריטי לשילוב שירותים חיוניים. לדוגמה, זו השיטה הנדרשת לחיבור ה-VPC של האשכול למופע Filestore, שמספק את ספריית ה-/home המשותפת הנדרשת לכל הצמתים באשכול.
VPC Service Controls
VPC Service Controls הוא אמצעי אבטחה ב-Google Cloud שמאפשר לארגונים ליצור גבולות גזרה מאובטחים מסביב למידע אישי רגיש ולמשאבים, כדי לצמצם את הסיכון לזליגת נתונים. התכונה VPC Service Controls עושה זאת על ידי הגבלת הגישה לשירותים ולנתונים ספציפיים ב-Google Cloud מרשתות לא מורשות, ומניעת העברת נתונים מחוץ למתחמים המוגדרים האלה. כך היא מספקת הגנה חזקה מפני איומים פנימיים וזליגת נתונים מקרית. מידע נוסף זמין במאמר VPC Service Controls.
צומת עובד
צומת עובד הוא מכונה או מופע חישובי בתוך אשכול, שאחראי להפעלת משימות או לביצוע עבודה. במערכות כמו אשכולות Kubernetes או Ray, הצמתים הם יחידות המחשוב הבסיסיות. מידע נוסף זמין במאמר מהו מחשוב עתיר ביצועים (HPC)?
מאגר של Workers
רכיבים של אשכול Ray שמריצים משימות מבוזרות. אפשר להגדיר מאגרי עובדים עם סוגי מכונות ספציפיים, והם תומכים גם בהתאמה אוטומטית לעומס וגם בהרחבה ידנית. מידע נוסף מופיע במאמר בנושא המבנה של אשכול האימון.
zone
אזור פריסה ספציפי בתוך אזור Google Cloud. במסגרת Managed Training באשכולות שמורים, כדי לקבל את הביצועים הכי טובים, צריך ליצור את כל הרכיבים של השירות (האשכול, Filestore והמכונות ב-Managed Lustre) באותו אזור.
[[["התוכן קל להבנה","easyToUnderstand","thumb-up"],["התוכן עזר לי לפתור בעיה","solvedMyProblem","thumb-up"],["סיבה אחרת","otherUp","thumb-up"]],[["התוכן קשה להבנה","hardToUnderstand","thumb-down"],["שגיאות בקוד לדוגמה או במידע","incorrectInformationOrSampleCode","thumb-down"],["חסרים לי פרטים או דוגמאות","missingTheInformationSamplesINeed","thumb-down"],["בעיה בתרגום","translationIssue","thumb-down"],["סיבה אחרת","otherDown","thumb-down"]],["עדכון אחרון: 2026-03-10 (שעון UTC)."],[],[]]