מילון מונחים של Vertex AI

annotation set

קבוצת הערות מכילה את התוויות שמשויכות לקובצי המקור שהועלו בתוך מערך נתונים. קבוצת הערות משויכת גם לסוג נתונים וגם למטרה (לדוגמה, סרטון/סיווג).

נקודת קצה ל-API

נקודות קצה ב-API הן היבט של הגדרת שירות שמציין את כתובות הרשת, שנקראות גם נקודות קצה של שירותים (לדוגמה, aiplatform.googleapis.com).

Application Default Credentials ‏ (ADC)

ה-Application Default Credentials ‏ (ADC) מספקים דרך פשוטה לקבל פרטי כניסה להרשאה לשימוש בקריאות ל-Google APIs. הן מתאימות במיוחד למקרים שבהם הקריאה צריכה לכלול את אותה זהות ואת אותה רמת הרשאה לאפליקציה, ללא קשר למשתמש. זו הגישה המומלצת לאישור קריאות לממשקי Google Cloud API, במיוחד כשיוצרים אפליקציה שפרוסה ב-Google App Engine ‏ (GAE) או במכונות וירטואליות של Compute Engine. מידע נוסף זמין במאמר הסבר על Application Default Credentials.

שכן קרוב משוער (ANN)

שירות Approximate Nearest Neighbor ‏ (ANN) הוא פתרון עם היקף גדול וזמן אחזור נמוך, למציאת וקטורים דומים (או ליתר דיוק, 'הטמעות') עבור קורפוס גדול. מידע נוסף זמין במאמר איך משתמשים בחיפוש וקטורי להתאמה סמנטית.

artifact

ארטיפקט הוא ישות נפרדת או חלק נתונים שנוצרים ונצרכים על ידי תהליך עבודה של למידת מכונה. דוגמאות לארטיפקטים: מערכי נתונים, מודלים, קובצי קלט ויומני אימון.

Artifact Registry

‫Artifact Registry הוא שירות אוניברסלי לניהול ארטיפקטים. זהו השירות המומלץ לניהול קונטיינרים וארטיפקטים אחרים ב-Google Cloud. מידע נוסף זמין במאמר בנושא Artifact Registry.

בינה מלאכותית (AI)

בינה מלאכותית (AI) היא תחום מחקר ותכנון של מכונות שנראות "אינטליגנטיות", כלומר מכונות שמחקות פונקציות אנושיות או אינטלקטואליות כמו תנועה מכנית, חשיבה רציונלית או פתרון בעיות. אחד מתחומי המשנה הפופולריים ביותר של AI הוא למידת מכונה, שמשתמשת בגישה סטטיסטית ומבוססת-נתונים כדי ליצור AI. עם זאת, יש אנשים שמשתמשים בשני המונחים האלה לסירוגין.

אימות

התהליך של אימות הזהות של לקוח (שיכול להיות משתמש או תהליך אחר) לצורך קבלת גישה למערכת מאובטחת. לקוח שהוכיח את הזהות שלו נקרא לקוח מאומת. מידע נוסף זמין במאמר שיטות אימות ב-Google.

הצגה אוטומטית זו לצד זו (AutoSxS)

הכלי 'השוואה אוטומטית זה לצד זה' (AutoSxS) הוא כלי להערכה בעזרת מודל, שמשווה בין שני מודלים גדולים של שפה (LLM) זה לצד זה. אפשר להשתמש בו כדי להעריך את הביצועים של מודלים של AI גנרטיבי במרשם המודלים של Vertex AI או של מסקנות שנוצרו מראש. ב-AutoSxS נעשה שימוש במערכת דירוג אוטומטית כדי להחליט איזה מודל מספק את התשובה הטובה יותר להנחיה. התכונה AutoSxS זמינה לפי דרישה, והיא מעריכה מודלים של שפה עם ביצועים דומים לאלה של מעריכים אנושיים.

AutoML

אלגוריתמים של למידת מכונה ש "לומדים ללמוד" באמצעות אופטימיזציה של קופסה שחורה. מידע נוסף זמין במאמר בנושא מונחון למידת מכונה.

רישום אוטומטי ביומן

רישום אוטומטי הוא תכונה בפלטפורמות ובספריות של למידת מכונה, שרושמת באופן אוטומטי מדדים, פרמטרים וארטיפקטים מרכזיים במהלך תהליך אימון המודל, בלי שנדרש קוד מפורש. הכלי מייעל את מעקב הניסויים על ידי תיעוד אוטומטי של מידע כמו היפרפרמטרים, מדדי הערכה (לדוגמה, דיוק, הפסד) ונקודות ביקורת של המודל, וכך מאפשר למפתחים להשוות בין ניסויים ולשחזר אותם בקלות.

autorater

מדרג אוטומטי הוא מודל שפה שמעריך את איכות התגובות של המודל להנחיית הסקה מקורית. הוא משמש בצינור (pipeline) של AutoSxS כדי להשוות בין ההסקות של שני מודלים ולקבוע איזה מודל השיג את הביצועים הכי טובים. מידע נוסף זמין במאמר בנושא הערכת מהירות התגובה.

התאמה אוטומטית לעומס

שינוי גודל אוטומטי (Autoscaling) הוא היכולת של משאב מחשוב, כמו מאגר העובדים של אשכול Ray, להתאים באופן אוטומטי את מספר הצמתים כלפי מעלה או מטה על סמך דרישות עומס העבודה, כדי לייעל את השימוש במשאבים ואת העלויות. מידע נוסף זמין במאמר בנושא התאמת הגודל של אשכולות Ray ב-Vertex AI: שינוי גודל אוטומטי.

baseline

מודל שמשמש כנקודת התייחסות להשוואה של רמת הביצועים של מודל אחר (בדרך כלל מודל מורכב יותר). לדוגמה, מודל רגרסיה לוגיסטית יכול לשמש כבסיס טוב למודל עמוק. בבעיה מסוימת, נתוני הבסיס עוזרים למפתחי מודלים לכמת את הביצועים המינימליים הצפויים שמודל חדש צריך להשיג כדי שהוא יהיה שימושי. מידע נוסף זמין במאמר קבוצות נתונים של בסיס ושל יעד.

batch

קבוצת הדוגמאות שמשמשת באיטרציה אחת של אימון. גודל האצווה קובע את מספר הדוגמאות באצווה.

גודל אצווה

מספר הדוגמאות באצווה. לדוגמה, גודל האצווה של SGD הוא 1, בעוד שגודל האצווה של מיני-אצווה הוא בדרך כלל בין 10 ל-1,000. גודל האצווה בדרך כלל קבוע במהלך האימון וההסקה, אבל TensorFlow מאפשר גדלים דינמיים של אצווה.

הסקת מסקנות בקבוצות

הסקת מסקנות באצווה מקבלת קבוצה של בקשות להסקת מסקנות ומפיקה את התוצאות בקובץ אחד. מידע נוסף זמין במאמר סקירה כללית על קבלת מסקנות ב-Vertex AI.

הטיה

1. הצגת סטריאוטיפים, דעות קדומות או העדפה של דברים, אנשים או קבוצות מסוימים על פני אחרים. ההטיות האלה יכולות להשפיע על איסוף הנתונים ועל הפרשנות שלהם, על עיצוב המערכת ועל האופן שבו המשתמשים מבצעים אינטראקציה עם המערכת. 2. שגיאה שיטתית שנובעת מהליך דגימה או דיווח.

bidrectional

מונח שמשמש לתיאור מערכת שמעריכה את הטקסט שמופיע לפני קטע טקסט יעד ואחריו. לעומת זאת, במערכת חד-כיוונית, הטקסט שמוערך הוא רק הטקסט שקודם לקטע הטקסט הממוקד.

ייצוגים דו-כיווניים של מקודד מטרנספורמרים (BERT)

‫BERT היא שיטה לאימון מראש של ייצוגי שפה, כלומר אנחנו מאמנים מודל 'הבנת שפה' לשימוש כללי על קורפוס טקסט גדול (כמו ויקיפדיה), ואז משתמשים במודל הזה למשימות NLP downstream שחשובות לנו (כמו מענה לשאלות). הביצועים של BERT טובים יותר משיטות קודמות כי זו המערכת הראשונה ללימוד מראש של NLP ללא פיקוח, עם יכולת ניתוח דו-כיווני עמוק.

BigQuery

‫BigQuery הוא מחסן נתונים (data warehouse) ארגוני מנוהל במלואו, ללא שרת ועם יכולת התאמה רחבה במיוחד, שמוצע על ידי Google Cloud. הוא מיועד לניתוח של מערכי נתונים עצומים באמצעות שאילתות SQL במהירויות גבוהות במיוחד. ‫BigQuery מאפשר בינה עסקית וניתוח נתונים מתקדמים בלי שהמשתמשים יצטרכו לנהל תשתית כלשהי. מידע נוסף זמין במאמר ממחסן נתונים לפלטפורמת נתונים ו-AI אוטונומית.

BigQuery ML

‫BigQuery ML הוא תכונה במחסן הנתונים BigQuery של Google Cloud, שמאפשרת למנתחי נתונים ולמדעני נתונים ליצור, לאמן ולפרוס מודלים של למידת מכונה ישירות ב-BigQuery באמצעות שאילתות SQL סטנדרטי. כך לא צריך להעביר נתונים לפלטפורמות נפרדות של ML, מה שמפשט את תהליך העבודה של למידת מכונה והופך את ה-ML לנגיש יותר למשתמשי SQL. מידע נוסף זמין במאמר יצירת מודלים של למידת מכונה ב-BigQuery ML.

‫Bigtable

שירות מנוהל של מסד נתונים NoSQL, מומלץ גם כאפשרות אחסון לנתוני אימון כשמשתמשים ב-Vertex AI. מידע נוסף זמין במאמר סקירה כללית על Bigtable.

Bilingual Evaluation Understudy (BLEU)

מדד פופולרי להערכת האיכות של אלגוריתם לתרגום מכונה, על ידי השוואת הפלט שלו לפלט של תרגום אנושי אחד או יותר.

תיבה תוחמת

אפשר לציין תיבת תוחמת לאובייקט בפריים של הסרטון באחת משתי דרכים: (1) באמצעות 2 קודקודים שמורכבים מקבוצה של קואורדינטות x,y אם הם נקודות מנוגדות באלכסון של המלבן. לדוגמה: x_relative_min, y_relative_min,,,x_relative_max,y_relative_max,, (ii) צריך להשתמש בכל 4 הקודקודים. מידע נוסף זמין במאמר בנושא הכנת נתוני וידאו.

bucket

תיקייה ברמה העליונה ב-Cloud Storage. שמות של קטגוריות חייבים להיות ייחודיים לכל המשתמשים ב-Cloud Storage. קטגוריות מכילות קבצים. מידע נוסף זמין במאמר סקירה כללית על המוצר Cloud Storage.

צ'אט

התוכן של דיאלוג הלוך ושוב עם מערכת למידת מכונה, בדרך כלל מודל שפה גדול. האינטראקציה הקודמת בצ'אט (מה הקלדתם ואיך מודל שפה גדול (LLM) הגיב) הופכת להקשר לחלקים הבאים של הצ'אט. צ'אטבוט הוא יישום של מודל שפה גדול.

נקודת ביקורת

נתונים שמתעדים את מצב הפרמטרים של מודל במהלך האימון או אחרי שהאימון מסתיים. לדוגמה, במהלך האימון, אתם יכולים: 1. להפסיק את האימון, אולי בכוונה או אולי כתוצאה משגיאות מסוימות. 2. מצלמים את נקודת הביקורת. 3. בשלב מאוחר יותר, טוענים מחדש את נקודת הבדיקה, אולי בחומרה אחרת. 4. להתחיל מחדש את ההדרכה. ב-Gemini, נקודת ביקורת מתייחסת לגרסה ספציפית של מודל Gemini שאומנה על מערך נתונים ספציפי.

מודל סיווג

מודל שההסקה שלו היא מחלקה. לדוגמה, אלה הם מודלים של סיווג: מודל שמנבא את השפה של משפט קלט (צרפתית? ספרדית? איטלקית?). מודל שמנבא את מיני העצים (אדר? אלון? באובב?). מודל שמנבא את הסיווג החיובי או השלילי של מצב רפואי מסוים.

מדדי סיווג

מדדי הסיווג הנתמכים ב-Vertex AI SDK ל-Python הם מטריצת בלבול ועקומת ROC.

Cloud Logging

‫Cloud Logging הוא שירות רישום ביומן בזמן אמת שמנוהל באופן מלא על ידי Google Cloud. השירות מאפשר לכם לאסוף, לאחסן, לנתח ולנטר יומנים מכל המשאבים שלכם ב-Google Cloud, מאפליקציות מקומיות ואפילו ממקורות מותאמים אישית. Cloud Logging מרכז את ניהול היומנים, וכך קל יותר לפתור בעיות, לבצע ביקורת ולהבין את ההתנהגות והתקינות של האפליקציות והתשתיות. מידע נוסף זמין במאמר סקירה כללית על Cloud Logging.

‫Cloud Monitoring

‫Cloud Monitoring היא פלטפורמת נראות מקיפה שמסופקת על ידי Google Cloud. היא אוספת ומציגה מדדים, יומנים ואירועים משירותי Google Cloud, מתשתית מקומית ומרכיבים של אפליקציות. הוא מאפשר למשתמשים לקבל תובנות לגבי הביצועים, הזמינות והתקינות הכללית של המערכות שלהם, וכך לזהות בעיות באופן יזום, לפתור אותן ולקבל התראות. מידע נוסף זמין במאמר בנושא מדדים של Cloud Monitoring ל-Vertex AI.

Cloud Network Address Translation (Cloud NAT)

‫Cloud NAT (תרגום כתובות רשת) הוא שירות מנוהל לחלוטין של Google Cloud שמאפשר למכונות וירטואליות ולמשאבים אחרים ללא כתובות IP חיצוניות להתחבר לאינטרנט. מידע נוסף זמין במאמרי העזרה בנושא Cloud NAT.

‫Cloud Profiler

‫Cloud Profiler הוא שירות פרופילים רציף שמוצע על ידי Google Cloud. הוא עוזר לכם לזהות ולנתח את צריכת המעבד והזיכרון, וגם את השימוש במשאבים אחרים (כמו heap, זמן בפועל, contention) באפליקציות שלכם. הכלי אוסף באופן אוטומטי נתונים ליצירת פרופיל מהאפליקציות שלכם בסביבת הייצור עם תקורה מינימלית, ומאפשר לכם להמחיש ולהבין את צווארי הבקבוק בביצועים בשירותים שונים, ולבצע אופטימיזציה של הקוד כדי לשפר את היעילות ולהפחית את העלויות. מידע נוסף זמין במאמר סקירה כללית על Cloud Profiler.

Cloud Router

‫Cloud Router הוא שירות מבוזר ומנוהל לחלוטין שמספק יכולות של רמקול ומשיב של פרוטוקול Border Gateway ‏ (BGP). ‫Cloud Router פועל עם Cloud Interconnect,‏ Cloud VPN,‏ Cloud NAT ומכשירי נתב כדי ליצור מסלולים דינמיים ברשתות VPC על סמך מסלולים שהתקבלו מ-BGP ומסלולים מותאמים אישית. מידע נוסף זמין במאמר סקירה כללית על מושגים ב-Cloud Router.

Cloud Storage

שירות אחסון האובייקטים של Google Cloud הוא שירות מאובטח וניתן להרחבה, ומומלץ לאחסון מערכי נתונים גדולים שמשמשים לאימון ולאימות עם Vertex AI כדי להשיג ביצועים אופטימליים. מידע נוסף זמין במסמכי Cloud Storage.

‫Cloud Storage Fuse

מתאם FUSE בקוד פתוח שמאפשר לטעון קטגוריות של Cloud Storage כמערכת קבצים במערכות Linux או macOS. מידע נוסף מופיע במאמר בנושא Cloud Storage Fuse.

Cloud TPU

שיפור המהירות באמצעות חומרה מיוחדת שנועד להאיץ עומסי עבודה של למידת מכונה ב-Google Cloud.

Colab Enterprise

‫Colab Enterprise היא סביבת Jupyter Notebook מנוהלת ושיתופית שמביאה את חוויית המשתמש הפופולרית של Google Colab אל Google Cloud, ומציעה יכולות אבטחה ותאימות ברמה הארגונית. ‫Colab Enterprise מספק חוויה שמתמקדת במחברות, ללא צורך בהגדרה, עם משאבי מחשוב שמנוהלים על ידי Vertex AI, ומשולב עם שירותים אחרים של Google Cloud כמו BigQuery. מידע נוסף זמין במאמר מבוא ל-Colab Enterprise.

consumer VPC

רשת ענן וירטואלי פרטי (VPC) של צרכן משמשת לגישה פרטית לשירותים מנוהלים מתוך רשת ה-VPC שלו. מידע נוסף זמין במאמר Private Service Connect.

קובץ אימג' של קונטיינר

קובץ אימג' של קונטיינר הוא חבילה שכוללת את הקוד הניתן להפעלה של הרכיב והגדרה של הסביבה שבה הקוד פועל. מידע נוסף זמין במאמר סקירה כללית על אימון ללא שרת ב-Vertex AI.

context

הקשר משמש לקיבוץ של פריטי מידע וביצועים יחד בקטגוריה אחת שאפשר להריץ עליה שאילתות ולסווג אותה. אפשר להשתמש בהקשרים כדי לייצג קבוצות של מטא-נתונים. דוגמה להקשר: הרצה של צינור עיבוד נתונים של למידת מכונה.

מטמון הקשר

מטמון הקשר ב-Vertex AI הוא כמות גדולה של נתונים שאפשר להשתמש בהם בכמה בקשות למודל Gemini. התוכן שנשמר במטמון מאוחסן באזור שבו מתבצעת הבקשה ליצירת המטמון. זה יכול להיות כל סוג MIME שנתמך על ידי מודלים של Gemini multimodal, כמו טקסט, אודיו או וידאו. מידע נוסף זמין במאמר סקירה כללית על שמירת הקשר במטמון.

חלון ההקשר

מספר הטוקנים שמודל יכול לעבד בהנחיה נתונה. ככל שחלון ההקשר גדול יותר, המודל יכול להשתמש ביותר מידע כדי לספק תשובות עקביות וקוהרנטיות להנחיה.

מפתחות הצפנה בניהול הלקוח (CMEK)

מפתחות הצפנה בניהול הלקוח (CMEK) הם שילובים שמאפשרים ללקוחות להצפין נתונים בשירותי Google קיימים באמצעות מפתח שהם מנהלים ב-Cloud KMS (שנקרא גם Storky). המפתח ב-Cloud KMS הוא המפתח להצפנת מפתחות הצפנה שמגן על הנתונים שלהם. מידע נוסף מופיע במאמר בנושא מפתחות הצפנה בניהול הלקוח (CMEK).

רשת VPC של צרכן

רשת VPC של צרכן היא ענן וירטואלי פרטי (VPC) ב-Google Cloud, שמקבל גישה פרטית לשירות שמארח ב-VPC אחר (שנקרא VPC של ספק). מידע נוסף זמין במאמר Private Service Connect.

CustomJob

‫CustomJob הוא אחד משלושת המשאבים של Vertex AI שמשתמש יכול ליצור כדי לאמן מודלים בהתאמה אישית ב-Vertex AI. משימות אימון בלי שרת (serverless) הן הדרך הבסיסית להפעיל קוד אימון מותאם אישית של למידת מכונה (ML) ב-Vertex AI. מידע נוסף מופיע במאמר יצירת משימת אימון ללא שרת.

קובץ אימג' של קונטיינר בהתאמה אישית

קובץ אימג' מותאם אישית של קונטיינר הוא חבילה עצמאית שניתנת להרצה וכוללת את קוד האפליקציה של המשתמש, את זמן הריצה שלה, את הספריות, את יחסי התלות ואת הגדרות הסביבה. בהקשר של Google Cloud, ובמיוחד של Vertex AI, הוא מאפשר למשתמש לארוז את קוד האימון של למידת המכונה או את אפליקציית ההצגה עם התלות המדויקת שלה, וכך להבטיח שחזור ולאפשר למשתמש להריץ עומס עבודה בשירותים מנוהלים באמצעות גרסאות תוכנה ספציפיות או הגדרות ייחודיות שלא מסופקות על ידי סביבות סטנדרטיות. מידע נוסף זמין במאמר בנושא דרישות של קונטיינרים בהתאמה אישית להסקת מסקנות.

אימון בהתאמה אישית

ב-Vertex AI יש שני מצבים עיקריים להרצת קוד האימון בהתאמה אישית: סביבה לפי דרישה ללא שרתים או אשכול ייעודי שמור. מידע נוסף מופיע במאמר בנושא אימון מודלים משלכם ושימוש בהם.

Dask

‫Dask היא פלטפורמת מחשוב מבוזרת שמשמשת לעיתים קרובות עם TensorFlow,‏ Pytorch ומסגרות ML אחרות לניהול משימות אימון מבוזרות. מידע נוסף זמין ב-Wikipedia.

ניתוח נתונים

הבנת הנתונים על ידי בחינת דוגמאות, מדידה והמחשה. ניתוח נתונים יכול להיות שימושי במיוחד כשמקבלים מערך נתונים בפעם הראשונה, לפני שבונה המודל הראשון. הוא גם חיוני להבנת ניסויים ולניפוי באגים במערכת.

הגדלת מערך הנתונים

הגדלה מלאכותית של טווח הדוגמאות לאימון ומספרן על ידי שינוי דוגמאות קיימות כדי ליצור דוגמאות נוספות. לדוגמה, נניח שתמונות הן אחת מהתכונות שלכם, אבל מערך הנתונים לא מכיל מספיק דוגמאות של תמונות כדי שהמודל יוכל ללמוד שיוכים שימושיים. מומלץ להוסיף למערך הנתונים מספיק תמונות מתויגות כדי לאפשר אימון תקין של המודל. אם זה לא אפשרי, אפשר להשתמש בהגדלת מערך הנתונים כדי לסובב, למתוח ולשקף כל תמונה וליצור הרבה וריאציות של התמונה המקורית. יכול להיות שזה יניב מספיק נתונים מתויגים כדי לאפשר אימון מצוין.

Data Center GPU manager (DCGM )

חבילת כלים של NVIDIA לניהול ולניטור של כרטיסי GPU של NVIDIA בסביבת מרכז נתונים. מידע נוסף זמין במאמר בנושא NVIDIA Data Center GPU Manager (DCGM).

DataFrame

סוג נתונים פופולרי של pandas לייצוג מערכי נתונים בזיכרון. אובייקט DataFrame דומה לטבלה או לגיליון אלקטרוני. לכל עמודה ב-DataFrame יש שם (כותרת), וכל שורה מזוהה באמצעות מספר ייחודי. כל עמודה ב-DataFrame מובנית כמו מערך דו-ממדי, אלא שלכל עמודה אפשר להקצות סוג נתונים משלה.

מערך נתונים (dataset)

הגדרה רחבה של מערך נתונים היא אוסף של רשומות נתונים מובְנים או לא מובְנים. אוסף של נתונים גולמיים, בדרך כלל (אבל לא רק) מאורגנים באחד מהפורמטים הבאים: גיליון אלקטרוני או קובץ בפורמט CSV (ערכים מופרדים בפסיקים). מידע נוסף זמין במאמר יצירת מערך נתונים.

decoder

באופן כללי, כל מערכת ML שמבצעת המרה מייצוג מעובד, צפוף או פנימי לייצוג גולמי, דליל או חיצוני יותר. מפענחים הם לרוב רכיב של מודל גדול יותר, ולעתים קרובות הם משולבים עם מקודד. במשימות של רצף לרצף, מפענח מתחיל עם המצב הפנימי שנוצר על ידי המקודד כדי לחזות את הרצף הבא.

רשת עצבית עמוקה (DNN)

רשת נוירונים עם כמה שכבות מוסתרות, שבדרך כלל מתוכנתת באמצעות טכניקות של למידה עמוקה.

עומק

סכום הערכים הבאים ברשת נוירונים: 1. מספר השכבות הנסתרות 2. מספר שכבות הפלט, שבדרך כלל הוא אחד 3. מספר שכבות ההטמעה. לדוגמה, לרשת נוירונים עם חמש שכבות נסתרות ושכבת פלט אחת יש עומק של 6. שימו לב ששכבת הקלט לא משפיעה על העומק.

DevOps

‫DevOps היא חבילה של מוצרי Google Cloud Platform, לדוגמה, Artifact Registry ו-Cloud Deploy.

עצירה מוקדמת

שיטה לרגולריזציה שכוללת סיום של האימון לפני שההפסד של האימון מפסיק לרדת. בשיטת העצירה המוקדמת, עוצרים בכוונה את אימון המודל כשההפסד במערך נתוני אימות מתחיל לעלות, כלומר כשביצועי ההכללה מתדרדרים.

הטמעה

ייצוגים מספריים של מילים או של חלקי טקסט. המספרים האלה משקפים את המשמעות הסמנטית וההקשר של הטקסט. למילים או לטקסט דומים או קשורים יש בדרך כלל הטמעות דומות, כלומר הם קרובים יותר זה לזה במרחב הווקטורי הרב-ממדי.

מרחב הטמעה (מרחב סמוי)

ב-AI גנרטיבי, מרחב הטמעה הוא ייצוג מספרי של טקסט, תמונות או סרטונים, שמתעד את הקשרים בין נתוני הקלט. מודלים של למידת מכונה, ובמיוחד מודלים של AI גנרטיבי, מצטיינים ביצירת ההטמעות האלה על ידי זיהוי דפוסים במערכי נתונים גדולים. אפליקציות יכולות להשתמש בהטמעות כדי לעבד ולייצר שפה, ולזהות משמעויות מורכבות וקשרים סמנטיים שספציפיים לתוכן.

וקטור הטמעה

ייצוג וקטורי צפוף, ולעתים קרובות דו-ממדי, של פריט. אם שני פריטים דומים מבחינה סמנטית, ההטמעות שלהם ממוקמות קרוב זו לזו במרחב וקטורי ההטמעה.

encoder

באופן כללי, כל מערכת ML שמבצעת המרה מייצוג גולמי, דליל או חיצוני לייצוג מעובד יותר, צפוף יותר או פנימי יותר. מקודדים הם בדרך כלל רכיב של מודל גדול יותר, ולעתים קרובות הם משולבים עם מפענח. חלק מהטרנספורמציות משלבות מקודדים ומפענחים, אבל טרנספורמציות אחרות משתמשות רק במקודד או רק במפענח. יש מערכות שמשתמשות בפלט של המקודד כקלט לרשת סיווג או רגרסיה. במשימות של רצף לרצף, מקודד מקבל רצף קלט ומחזיר מצב פנימי (וקטור). לאחר מכן, המפענח משתמש במצב הפנימי הזה כדי לחזות את הרצף הבא.

נקודת קצה

משאבים שאפשר לפרוס אליהם מודלים מאומנים כדי להציג מסקנות. מידע נוסף זמין במאמר בחירת סוג נקודת קצה.

ensemble

קבוצה של מודלים שאומנו באופן עצמאי, והמסקנות שלהם מחושבות כממוצע או כסכום. במקרים רבים, קבוצת מודלים מניבה מסקנות טובות יותר ממודל יחיד. לדוגמה, יער אקראי הוא אנסמבל שנבנה מכמה עצי החלטה. חשוב לזכור שלא כל יערות ההחלטה הם קבוצות.

environment

בשיטת הלמידה באמצעות חיזוקים, העולם שמכיל את ה-Agent ומאפשר לו לצפות במצב של העולם הזה. לדוגמה, העולם המיוצג יכול להיות משחק כמו שחמט, או עולם פיזי כמו מבוך. כשהסוכן מבצע פעולה בסביבה, הסביבה עוברת בין מצבים.

הערכה (eval)

הערכה היא סוג של ניסוי שבו שאילתות מתועדות או סינתטיות נשלחות דרך שתי מערכות של חיפוש Google – מערכת ניסיונית שכוללת את השינוי שלכם ומערכת בסיסית בלי השינוי. ההערכות יוצרות הבדלים ומדדים שמאפשרים לכם להעריך את ההשפעה, האיכות והשפעות אחרות של השינוי על תוצאות החיפוש ועל חלקים אחרים בחוויית המשתמש ב-Google. ההערכות משמשות במהלך ההתאמה או האיטרציות של השינוי. הן משמשות גם כחלק מהשקת שינוי בתנועת משתמשים פעילה.

event

אירוע מתאר את הקשר בין ארטיפקטים לבין הפעלות. כל ארטיפקט יכול להיווצר על ידי הפעלה ולהיצרך על ידי הפעלות אחרות. אירועים עוזרים לקבוע את מקור הארטיפקטים בתהליכי העבודה של למידת המכונה (ML) על ידי שרשור של ארטיפקטים וביצועים.

execution

הרצה היא רשומה של שלב מסוים בתהליך העבודה של למידת מכונה, בדרך כלל עם הערות של פרמטרים של זמן הריצה. דוגמאות לביצועים כוללות קליטת נתונים, אימות נתונים, אימון מודלים, הערכת מודלים ופריסת מודלים.

ניסוי

ניסוי הוא הקשר שיכול להכיל קבוצה של n הרצות של ניסויים בנוסף להרצות של צינורות, שבהן משתמש יכול לבדוק, כקבוצה, הגדרות שונות כמו פריטי קלט או היפרפרמטרים.

הרצת ניסוי

ביצוע ספציפי שאפשר לעקוב אחריו במסגרת ניסוי ב-Vertex AI, שמתעד קלטים (כמו אלגוריתם, פרמטרים וערכות נתונים) ופלטים (כמו מודלים, נקודות ביקורת ומדדים) כדי לעקוב אחרי איטרציות של פיתוח למידת מכונה ולהשוות ביניהן. מידע נוסף זמין במאמר בנושא יצירה וניהול של הרצות ניסויים.

AI ניתן להסברה

תכונה של Vertex AI שמספקת כלים ויכולות להבנה ולפרשנות של מסקנות שנובעות ממודלים של למידת מכונה, ומציעה תובנות לגבי חשיבות התכונות והתנהגות המודל. מידע נוסף זמין במאמר מבוא ל-Vertex AI ניתן להסברה.

ניתוח נתונים ראשוני

בסטטיסטיקה, ניתוח נתונים ראשוני (EDA) הוא גישה לניתוח של מערכי נתונים כדי לסכם את המאפיינים העיקריים שלהם, לרוב באמצעות שיטות ויזואליות. אפשר להשתמש במודל סטטיסטי או לא, אבל בעיקר EDA נועד להראות לנו מה הנתונים יכולים לספר לנו מעבר למשימת המידול הפורמלית או בדיקת ההשערות.

ציון F1

ציון F1 הוא מדד שמשמש להערכת הדיוק של הפלט של מודל. המדד הזה שימושי במיוחד להערכת הביצועים של מודלים במשימות שבהן גם הדיוק וגם ההחזרה חשובים, כמו חילוץ מידע. במודלים של AI גנרטיבי, אפשר להשתמש בציון F1 כדי להשוות בין ההסקות של המודל לבין נתוני האמת הבסיסית, וכך לקבוע את רמת הדיוק של המודל. עם זאת, למשימות גנרטיביות כמו סיכום ויצירת טקסט, יכול להיות שיהיה מתאים יותר להשתמש במדדים אחרים כמו ציון Rough-L.

תכונה

בלמידת מכונה (ML), תכונה היא מאפיין של מופע או ישות שמשמש כקלט לאימון מודל ML או להסקת מסקנות.

הנדסת פיצ'רים (feature engineering)

הנדסת פיצ'רים (feature engineering) היא תהליך של שינוי נתונים גולמיים של למידת מכונה (ML) לפיצ'רים שאפשר להשתמש בהם כדי לאמן מודלים של למידת מכונה או כדי להסיק מסקנות.

קבוצת תכונות

קבוצת תכונות היא משאב במאגר התכונות שתואם לטבלה או לתצוגה של מקור ב-BigQuery שמכילים נתוני תכונות. תצוגת תכונות עשויה להכיל תכונות, ואפשר לחשוב עליה כקיבוץ לוגי של עמודות תכונות במקור הנתונים.

רשומת תכונה

רשומת תכונה היא צבירה של כל ערכי התכונות שמתארים את המאפיינים של ישות ייחודית בנקודת זמן מסוימת.

מאגר תכונות

מאגר תכונות הוא ממשק מרכזי לתיעוד מקורות נתונים של תכונות שרוצים להשתמש בהן להסקת מסקנות אונליין. מידע נוסף מופיע במאמר בנושא הגדרת Feature Registry.

feature serving

ייצוא מאפיינים הוא תהליך של ייצוא או אחזור של ערכי מאפיינים לצורך אימון או היקש. ב-Vertex AI יש שני סוגים של ייצוא מאפיינים: מילוי בקשה באופן מיידי וייצוא אופליין. מילוי בקשה באופן מיידי מאחזר את הערכים העדכניים ביותר של תכונות מתוך קבוצת משנה של מקור נתוני התכונות לצורך הסקת מסקנות באופן מיידי. ייצוא אופליין או שליפת נתונים ב-batch מאפשר לייצא כמויות גדולות של נתוני תכונות – כולל נתונים היסטוריים – לעיבוד אופליין, כמו אימון מודלים של למידת מכונה.

חותמת זמן של תכונה

חותמת זמן של תכונה מציינת מתי נוצר מערך ערכי התכונות ברשומה ספציפית של תכונה עבור ישות.

ערך התכונה

ערך של תכונה תואם לערך בפועל ולערך הניתן למדידה של תכונה (מאפיין) של מופע או ישות. אוסף של ערכי תכונות עבור הישות הייחודית מייצג את רשומת התכונות שמתאימה לישות.

תצוגת תכונות

תצוגת תכונות היא אוסף לוגי של תכונות שנוצרו ממקור נתונים ב-BigQuery למופע של חנות וירטואלית. תצוגת תכונות מאחסנת את נתוני התכונות של הלקוח ומרעננת אותם מעת לעת. הנתונים מתרעננים מעת לעת ממקור BigQuery. תצוגת תכונה משויכת לאחסון נתוני התכונה באופן ישיר או באמצעות שיוכים למשאבי מרשם התכונות.

‫Filestore

שירות אחסון קבצים מנוהל לחלוטין עם ביצועים גבוהים מ-Google Cloud, שמשמש לעיתים קרובות לאפליקציות שנדרשת בהן מערכת קבצים משותפת. מידע נוסף מופיע במאמר סקירה כללית על Filestore.

מודל בסיסי (FM)

מודלים שעברו אימון על נתונים רחבים, כך שאפשר להתאים אותם (לדוגמה, לכוונן אותם) למגוון רחב של משימות downstream.

תפעול של מודלים בסיסיים (FMOPs)

‫FMOps מרחיב את היכולות של MLOps ומתמקד בהעברה יעילה לייצור של מודלים בסיסיים שאומנו מראש (מאפס) או בהתאמה אישית (כוונון עדין).

Google Cloud pipeline components SDK

‫Google Cloud pipeline components (GCPC) SDK מספק קבוצה של רכיבי Kubeflow Pipelines מוכנים מראש, באיכות של מוצר, עם ביצועים טובים ונוחים לשימוש. אתם יכולים להשתמש ברכיבי צינור עיבוד נתונים של Google Cloud כדי להגדיר ולהפעיל צינורות עיבוד נתונים של ML ב-Vertex AI Pipelines ובקצה העורפי של הפעלת צינורות עיבוד נתונים אחרים של ML שתואמים ל-Kubeflow Pipelines. מידע נוסף זמין במאמר מבוא לרכיבי צינורות ב-Google Cloud.

‫Compute Engine

‫Compute Engine הוא רכיב של Google Cloud Platform, והוא פתרון של תשתית כשירות (IaaS) שמאפשר למשתמשים להריץ מכונות וירטואליות בתשתית של Google. מידע נוסף זמין במאמר סקירה כללית על Compute Engine.

מכונה ב-Compute Engine

מכונה ב-Compute Engine היא מכונה וירטואלית (VM) שפועלת בתשתית של Google. אתם יכולים לבחור את המפרט שלה, להריץ עליה אפליקציות ולהתחבר אליה דרך האינטרנט, אבל אתם לא צריכים לנהל את החומרה הפיזית. מידע נוסף זמין במאמר מכונות וירטואליות לכל עומס עבודה.

Google Embedded Modem System (GEMS)

‫GEMS הוא שלד תוכנה מוטמע שמיועד למודמים, וכולל קבוצה של תהליכי עבודה ותשתית לפיתוח. החזון המרכזי של GEMS הוא לספק קוד מערכת מודם באיכות גבוהה עם יכולת שימוש חוזר גבוהה במכשירים רבים של Google שמכילים מודמים. כדי להגשים את החזון הרחב הזה, GEMS מספקת סביבה מקיפה למפתחים, שכוללת את אבני הבניין העיקריות שמוצגות בהמשך.

gradient

הווקטור של הנגזרות החלקיות ביחס לכל המשתנים הבלתי תלויים. בלמידת מכונה, הגרדיאנט הוא וקטור של נגזרות חלקיות של פונקציית המודל. השיפוע מצביע על הכיוון של העלייה התלולה ביותר.

תרשים

בהקשר של Vertex AI, גרף הוא מבנה נתונים שמייצג את הקשרים בין ישויות לבין המאפיינים שלהן. הוא משמש ליצירת מודלים ולניתוח של נתונים מורכבים, כמו גרפים של ידע, רשתות חברתיות ותהליכים עסקיים. מידע נוסף זמין במאמר מבוא ל-Vertex ML Metadata.

נתוני אמת (GT)

המונח 'אמת בסיסית' משמש בתחומים שונים כדי להתייחס לאמת המוחלטת של בעיה מסוימת שקשורה להחלטה או למדידה, בניגוד להערכה של מערכת מסוימת. בלמידת מכונה, המונח 'אמת קרקע (ground truth)' מתייחס לקבוצת נתונים לאימון של שיטות למידה מפוקחת.

היוריסטיקה

פתרון פשוט לבעיה שאפשר ליישם במהירות. לדוגמה, "באמצעות היוריסטיקה, הגענו לרמת דיוק של 86%. כשעברנו לרשת נוירונים עמוקה, רמת הדיוק עלתה ל-98%".

שכבה מוסתרת

שכבה ברשת נוירונים בין שכבת הקלט (התכונות) לבין שכבת הפלט (היקש). כל שכבה סמויה מורכבת מנוירון אחד או יותר. רשת עצבית עמוקה מכילה יותר משכבה נסתרת אחת.

היסטוגרמה

הצגה גרפית של השונות בקבוצת נתונים באמצעות עמודות. היסטוגרמה מאפשרת לראות דפוסים שקשה לזהות בטבלה פשוטה של מספרים.

hyperparameter

היפר-פרמטר הוא משתנה ששולט בתהליך האימון של מודל למידת מכונה. המשתנים האלה יכולים לכלול שיעורי למידה, ערכי מומנטום באופטימיזציה ומספר היחידות בשכבה הנסתרת האחרונה של מודל. מידע נוסף זמין במאמר סקירה כללית על אופטימיזציה של היפרפרמטרים.

כוונון היפר-פרמטרים

התאמה של היפרפרמטרים ב-Vertex AI כוללת הפעלה של כמה ניסויים של אפליקציית אימון עם ערכים שונים להיפרפרמטרים שנבחרו, שמוגדרים במסגרת מגבלות שצוינו. המטרה היא לבצע אופטימיזציה של הגדרות ההיפרפרמטרים כדי למקסם את דיוק החיזוי של המודל. מידע נוסף זמין במאמר סקירה כללית על אופטימיזציה של היפרפרמטרים.

הרשאות של ניהול זהויות והרשאות גישה (IAM)

הרשאות בניהול זהויות והרשאות גישה (IAM) הן יכולות פרטניות ספציפיות שמגדירות למי יש אפשרות לבצע פעולות מסוימות במשאבים מסוימים ב-Google Cloud. הם מוקצים לישויות מורשות (כמו משתמשים, קבוצות או חשבונות שירות) באמצעות תפקידים, ומאפשרים שליטה מדויקת בגישה לשירותים ולנתונים בתוך פרויקט בענן או ארגון ב-Google Cloud. מידע נוסף זמין במאמר בקרת גישה באמצעות IAM.

זיהוי תמונות

זיהוי תמונות הוא תהליך של סיווג אובייקטים, דפוסים או מושגים בתמונה. היא נקראת גם סיווג תמונות. זיהוי תמונות הוא תחום משנה של למידת מכונה וראייה ממוחשבת.

index

אוסף של וקטורים שמוצבים יחד לחיפוש דמיון. אפשר להוסיף וקטורים לאינדקס או להסיר אותם ממנו. שאילתות של חיפוש דמיון מופנות לאינדקס ספציפי ומחפשות את הווקטורים באינדקס הזה.

הסקת מסקנות

בהקשר של פלטפורמת Vertex AI, הסקה מתייחסת לתהליך של הפעלת נקודות נתונים דרך מודל של למידת מכונה כדי לחשב פלט, כמו ציון מספרי יחיד. התהליך הזה נקרא גם "הפעלת מודל למידת מכונה" או "העברת מודל למידת מכונה לייצור". הסקת מסקנות היא שלב חשוב בתהליך העבודה של למידת מכונה, כי היא מאפשרת להשתמש במודלים כדי להסיק מסקנות לגבי נתונים חדשים. ב-Vertex AI, אפשר לבצע הסקה בדרכים שונות, כולל הסקה באצווה והסקה אונליין. הסקת מסקנות באצווה כוללת הפעלה של קבוצת בקשות להסקת מסקנות והפקת התוצאות בקובץ אחד, בעוד שהסקת מסקנות אונליין מאפשרת להסיק מסקנות בזמן אמת לגבי נקודות נתונים בודדות.

אחזור מידע (IR)

אחזור מידע (IR) הוא רכיב מרכזי בחיפוש מבוסס-Vertex AI. זהו תהליך של חיפוש ואחזור מידע רלוונטי מתוך אוסף גדול של נתונים. בהקשר של Vertex AI, מערכת IR משמשת לאחזור מסמכים ממאגר מידע על סמך שאילתה של משתמש. ‫Vertex AI מציע חבילה של ממשקי API שיעזרו לכם לבנות אפליקציות משלכם של Retrieval Augmented Generation (יצירה משולבת-אחזור, RAG) או לבנות מנוע חיפוש משלכם. מידע נוסף זמין במאמר שימוש בחיפוש מבוסס-Vertex AI כקצה עורפי לאחזור באמצעות RAG Engine.

תשתית כקוד (IaC)

תשתית כקוד. גישה לניהול תשתית IT שבה צוותים יכולים לנהל שירותים ולספק אותם באמצעות קוד. עם IaC, נוצרים קובצי תצורה שמכילים את מפרטי התשתית, וכך קל יותר ליצור ולערוך תשתית בהיקף גדול.

תשתית כקוד (IaC)

תשתית כקוד. גישה לניהול תשתית IT שבה צוותים יכולים לנהל שירותים ולספק אותם באמצעות קוד. עם IaC, נוצרים קובצי תצורה שמכילים את מפרטי התשתית, וכך קל יותר ליצור ולערוך תשתית בהיקף גדול.

מיצוי של כתובות IP

מיצוי של כתובות IP מתרחש כשכתובות ה-IP הזמינות בטווח מוגדר מוצו. מידע נוסף זמין במאמר בנושא שיטות מומלצות לשימוש ברשת ב-Cloud Run.

מיקום

מיקום הוא המקום הפיזי בעולם שבו מתארחים משאבי הענן שלכם. הקונספט הזה מחולק לשני חלקים עיקריים: אזורים ותחומים. מידע נוסף זמין במאמר אזורים ותחומים.

מיקום

מיקום הוא המקום הפיזי בעולם שבו מתארחים משאבי הענן שלכם. הקונספט הזה מחולק לשני חלקים עיקריים: אזורים ותחומים. מידע נוסף זמין במאמר אזורים ותחומים.

login node

צומת התחברות הוא נקודת הכניסה הראשית של משתמש כדי לגשת לאשכול, לשלוח עבודות ולנהל קבצים. מידע נוסף זמין במאמר מהו מחשוב עתיר ביצועים?

מטא-נתונים של למידת מכונה

ML Metadata ‏ (MLMD) היא ספרייה לתיעוד ולאחזור של מטא-נתונים שמשויכים לזרימות עבודה של מפתחי למידת מכונה ומדעני נתונים. ‫MLMD הוא חלק בלתי נפרד מ-TensorFlow Extended‏ (TFX), אבל הוא מתוכנן כך שאפשר להשתמש בו באופן עצמאי. כחלק מפלטפורמת TFX הרחבה יותר, רוב המשתמשים מקיימים אינטראקציה עם MLMD רק כשהם בודקים את התוצאות של רכיבי צינור, למשל במחברות או ב-TensorBoard.

מערך נתונים מנוהל

אובייקט של מערך נתונים שנוצר ב-Vertex AI ומארח אותו.

רישום ידני ביומן

התהליך של הוספת קוד באופן מפורש (לדוגמה, באמצעות Vertex AI SDK ל-Python) לסקריפט אימון כדי לעקוב אחרי פרמטרים, מדדים וארטיפקטים מותאמים אישית ולרשום אותם ביומן של הרצת ניסוי ב-Vertex AI Experiments. מידע נוסף זמין במאמר סקירה כללית על ניהול יומנים וניטור.

‫Managed Lustre

מערכת קבצים מקבילית ומבוזרת שמיועדת למחשוב עתיר ביצועים. ‫Managed Lustre של Google Cloud מספק מערכת קבצים עם תפוקה גבוהה לעומסי עבודה תובעניים. מידע נוסף מופיע במאמר סקירה כללית על Managed Lustre.

אימון מנוהל באשכולות שמורים

אימון מנוהל באשכולות שמורים הוא שירות של Google Cloud שנועד לפשט ולהאיץ את עומסי העבודה הגדולים והמורכבים ביותר של AI/ML. השירות מספק חוויה מנוהלת לחלוטין בחומרה ייעודית ושמורה. הוא נועד לפתור אתגרים נפוצים באימון מודלים בקנה מידה גדול, כולל הגדרה מורכבת של אשכולות, שחזור אחרי כשל בחומרה ואופטימיזציה של מסגרות. מידע נוסף מופיע במאמר סקירה כללית על אימון מנוהל באשכולות שמורים.

שינוי גודל ידני

הגדלה או הקטנה ידנית של הקיבולת מתייחסת לתהליך של שינוי מכוון ומפורש של מספר משאבי המחשוב (כמו מכונות וירטואליות, קונטיינרים או שרתים) שהוקצו לאפליקציה או לשירות על ידי משתמש או אדמין. בניגוד להתאמה אוטומטית לעומס, שמתאימה את המשאבים באופן אוטומטי לפי הביקוש, התאמה ידנית לעומס מחייבת התערבות ישירה כדי להקצות משאבים או לבטל את ההקצאה שלהם. כך אפשר לשלוט במשאבים בצורה מדויקת, אבל אין את הגמישות של פתרונות אוטומטיים. מידע נוסף זמין במאמר שינוי גודל של אשכולות Ray ב-Vertex AI: שינוי גודל ידני.

שינוי גודל ידני

הגדלה או הקטנה ידנית של הקיבולת מתייחסת לתהליך של שינוי מכוון ומפורש של מספר משאבי המחשוב (כמו מכונות וירטואליות, קונטיינרים או שרתים) שהוקצו לאפליקציה או לשירות על ידי משתמש או אדמין. בניגוד להתאמה אוטומטית לעומס, שמתאימה את המשאבים באופן אוטומטי לפי הביקוש, התאמה ידנית לעומס מחייבת התערבות ישירה כדי להקצות משאבים או לבטל את ההקצאה שלהם. כך אפשר לשלוט במשאבים בצורה מדויקת, אבל אין את הגמישות של פתרונות אוטומטיים. מידע נוסף זמין במאמר שינוי גודל של אשכולות Ray ב-Vertex AI: שינוי גודל ידני.

יחידת שידור מקסימלית (MTU)

הגודל המקסימלי של מנת נתונים שמכשיר שמחובר לרשת יכול לשדר. גדלים גדולים יותר של MTU (מסגרות ג'מבו) יכולים לשפר את ביצועי הרשת עבור עומסי עבודה מסוימים. מידע נוסף זמין במאמר בנושא יחידת שידור מקסימלית.

MetadataSchema

‫MetadataSchema מתאר את הסכימה של סוגים מסוימים של ארטיפקטים, הפעלות או הקשרים. משתמשים ב-MetadataSchemas כדי לאמת את צמדי המפתח/ערך במהלך היצירה של משאבי המטא-נתונים התואמים. אימות הסכימה מתבצע רק בשדות תואמים בין המשאב לבין MetadataSchema. סכימות של סוגים מיוצגות באמצעות אובייקטים של סכימת OpenAPI, שצריך לתאר באמצעות YAML.

MetadataStore

MetadataStore הוא הקונטיינר ברמה העליונה של משאבי מטא-נתונים. מאגר המטא-נתונים הוא אזורי ומשויך לפרויקט ספציפי ב-Google Cloud. בדרך כלל, ארגון משתמש במאגר MetadataStore משותף אחד למשאבי מטא-נתונים בכל פרויקט.

צינורות עיבוד נתונים של ML

צינורות עיבוד נתונים של למידת מכונה הם תהליכי עבודה ניידים וניתנים להרחבה של למידת מכונה שמבוססים על קונטיינרים.

model

כל מודל, שעבר אימון מראש או לא. באופן כללי, כל מבנה מתמטי שמבצע עיבוד של נתוני קלט ומחזיר פלט. במילים אחרות, מודל הוא קבוצת הפרמטרים והמבנה שנדרשים למערכת כדי להסיק מסקנות.

זיקוק מודלים (זיקוק ידע, מודלים של מורה-תלמיד)

זיקוק מודל הוא טכניקה שמאפשרת למודל תלמיד קטן יותר ללמוד ממודל מורה גדול יותר. המודל של התלמיד מאומן לחקות את הפלט של המודל של המורה, ואז אפשר להשתמש בו כדי ליצור נתונים חדשים או להסיק מסקנות. זיקוק מודלים משמש לעיתים קרובות כדי לשפר את היעילות של מודלים גדולים או כדי להפוך אותם לנגישים יותר למכשירים עם משאבים מוגבלים. אפשר להשתמש בו גם כדי לשפר את ההכללה של מודלים על ידי הפחתת התאמת יתר.

Model Evaluation

הכלי להערכת מודלים ב-Vertex AI הוא שירות מנוהל בפלטפורמת Vertex AI של Google Cloud, שעוזר למשתמשים להעריך את הביצועים והאיכות של המודלים ללמידת מכונה שלהם. הכלי מספק כלים ליצירת מדדי הערכה שונים והדמיות, שמאפשרים למשתמש להבין את רמת הביצועים של המודלים שלו, לזהות הטיה פוטנציאלית ולקבל החלטות מושכלות לגבי פריסת המודלים ושיפורם. מידע נוסף זמין במאמר הערכת מודלים ב-Vertex AI.

מעקב אחרי מודלים

שירות Vertex AI Model Monitoring מעריך באופן רציף את הביצועים של מודלים שנפרסו על ידי זיהוי של הטיה (skew) ותזוזה (drift) בתכונות בבקשות לחיזוי, וכך עוזר לשמור על איכות המודל לאורך זמן. מידע נוסף זמין במאמר מבוא ל-Vertex AI Model Monitoring.

שם המשאב של המודל

שם המשאב של model הוא: projects/<PROJECT_ID>/locations/<LOCATION_ID>/models/<MODEL_ID>. אפשר למצוא את מזהה המודל במסוף Cloud בדף מרשם המודלים.

Network File System ‏ (NFS)

מערכת לקוח/שרת שמאפשרת למשתמשים לגשת לקבצים ברשת ולטפל בהם כאילו הם נמצאים בספריית קבצים מקומית. מידע נוסף זמין במאמר בנושא הוספת שיתוף של מערכת קבצים ברשת.

NVIDIA Collective Communications Library (NCCL)

ספרייה שמספקת פרימיטיבים אופטימליים לתקשורת בין מעבדי GPU עבור מסגרות של למידה עמוקה, ומאפשרת אימון רב-מעבדי GPU עם ביצועים גבוהים. מידע נוסף זמין במאמר NVIDIA Collective Communications Library (NCCL).

node

מכונה וירטואלית אחת (מכונה וירטואלית של Compute Engine) באשכול. בהקשר של אימון מנוהל באשכולות שמורים, צומת מתייחס למכונה וירטואלית (VM) ספציפית שמשמשת כיחידת חישוב יחידה באשכול. אפשר לחשוב על זה כאחת ממכונות ה-worker הייעודיות שמריצות חלק ממשימת האימון הכוללת. כל צומת מצויד במשאבים ספציפיים כמו CPU, זיכרון ומאיצים (לדוגמה, GPU מסוג A3 או A4), וכולם פועלים יחד בצורה מתואמת כדי לטפל במשימות אימון מבוזרות בקנה מידה גדול.

offline store

המאגר במצב אופליין הוא מתקן אחסון שבו מאוחסנים נתונים של תכונות מהזמן האחרון ונתונים היסטוריים, שבדרך כלל משמשים לאימון מודלים של למידת מכונה. חנות אופליין מכילה גם את ערכי התכונות העדכניים ביותר, שאפשר להשתמש בהם להסקת מסקנות אונליין.

הסקת מסקנות אונליין

קבלת מסקנות לגבי מקרים ספציפיים באופן סינכרוני. מידע נוסף זמין במאמר בנושא הסקת מסקנות אונליין.

תחזית אונליין

קבלת חיזויים לגבי מקרים ספציפיים באופן סינכרוני. מידע נוסף זמין במאמר בנושא חיזוי אונליין.

חנות וירטואלית

בניהול התכונות, חנות וירטואלית היא מתקן אחסון של ערכי התכונות העדכניים ביותר שמוצגים להסקת מסקנות אונליין.

פרמטר

פרמטרים הם ערכי קלט עם מפתח שמגדירים הפעלה, מווסתים את ההתנהגות של ההפעלה ומשפיעים על התוצאות שלה. לדוגמה, קצב הלמידה, שיעור הנשירה ומספר שלבי האימון.

partition

ב-Slurm, קבוצה לוגית של צמתים, שמשמשת לעיתים קרובות להפרדה בין צמתים עם הגדרות חומרה שונות.

שכבת ביצועים

הגדרת תצורה של מופע Managed Lustre שמגדירה את מהירות התפוקה שלו (ב-MBps לכל TiB) ומשפיעה על הקיבולת המינימלית והמקסימלית שלו.

משאב קבוע

סוג של משאב מחשוב ב-Vertex AI, כמו אשכול Ray, שנשאר מוקצה וזמין עד למחיקה מפורשת. זה מועיל לפיתוח איטרטיבי ומצמצם את התקורה של ההפעלה בין משימות. מידע נוסף זמין במאמר קבלת מידע מתמשך על משאבים.

pipeline

צינורות עיבוד נתונים של למידת מכונה הם תהליכי עבודה ניידים וניתנים להרחבה של למידת מכונה שמבוססים על קונטיינרים. מידע נוסף זמין במאמר מבוא ל-Vertex AI Pipelines.

רכיב של צינור עיבוד נתונים

קבוצה עצמאית של קוד שמבצעת שלב אחד בתהליך העבודה של צינור עיבוד נתונים, כמו עיבוד מקדים של נתונים, שינוי נתונים ואימון מודל.

pipeline job

משימת צינור עיבוד נתונים או הרצה של צינור עיבוד נתונים תואמות למשאב PipelineJob ב-Vertex AI API. זוהי דוגמה להרצה של הגדרת צינור עיבוד נתונים של למידת מכונה, שמוגדרת כקבוצה של משימות למידת מכונה שמקושרות ביניהן באמצעות יחסי תלות של קלט-פלט.

הפעלת צינור עיבוד נתונים

אפשר לשייך ניסוי למשימה אחת או יותר של צינור עיבוד נתונים ב-Vertex, כאשר כל משימה של צינור עיבוד נתונים מיוצגת כהפעלה יחידה. בהקשר הזה, הפרמטרים של ההרצה נגזרים מהפרמטרים של PipelineJob. המדדים נגזרים מהמערכת.ארטיפקטים של מדדים שנוצרו על ידי PipelineJob. הארטיפקטים של הריצה נגזרים מארטיפקטים שנוצרו על ידי PipelineJob.

pipeline template

הגדרה של תהליך עבודה של למידת מכונה שמשתמש אחד או כמה משתמשים יכולים לעשות בה שימוש חוזר כדי ליצור כמה הרצות של צינורות.

positive class

'הסיווג החיובי' מתייחס לתוצאה או לקטגוריה שהמודל אומן לחזות. לדוגמה, אם מודל מנסה לחזות אם לקוח ירכוש מעיל, המחלקה החיובית תהיה 'הלקוח רוכש מעיל'. באופן דומה, במודל שמנבא הרשמה של לקוחות לפיקדון לזמן קצוב, הסיווג החיובי יהיה 'הלקוח נרשם'. ההפך הוא 'הסיווג השלילי'.

מאגר מוכן מראש

קובצי אימג' של קונטיינר שמסופקים על ידי Vertex AI ומגיעים עם מסגרות ותלויות נפוצות של למידת מכונה שמותקנות מראש, כדי לפשט את ההגדרה של משימות אימון והיקש. מידע נוסף זמין במאמר מאגרי תגים מוכנים מראש לאימון בלי שרת (serverless) .

גישה פרטית ל-Google‏ (PGA)

הגישה הפרטית ל-Google מאפשרת למכונות וירטואליות עם כתובות IP פנימיות (פרטיות) בלבד (ללא כתובות IP חיצוניות) להגיע לכתובות ה-IP הציבוריות של שירותים וממשקי API של Google. מידע נוסף זמין במאמר הגדרת גישה פרטית ל-Google.

גישה לשירותים פרטיים

גישה לשירותים פרטיים היא חיבור פרטי בין הרשת של הענן הווירטואלי הפרטי (VPC) שלכם לבין רשתות בבעלות Google או ספקי שירותים של צד שלישי. היא מאפשרת למכונות וירטואליות ברשת ה-VPC לתקשר עם השירותים האלה באמצעות כתובות IP פנימיות, וכך להימנע מחשיפה לאינטרנט הציבורי. מידע נוסף זמין במאמר גישה לשירותים פרטיים.

Private Service Connect‏ (PSC)

‫Private Service Connect היא טכנולוגיה שמאפשרת ללקוחות Compute Engine למפות כתובות IP פרטיות ברשת שלהם לרשת VPC אחרת או לממשקי API של Google. מידע נוסף זמין במאמר Private Service Connect.

ממשק Private Service Connect‏ (PSC-I)

ממשק Private Service Connect מאפשר לספקים ליזום חיבורים באופן פרטי לכל משאבי הרשת ב-VPC של הצרכן.

producer VPC

רשת VPC של ספק היא רשת של ענן וירטואלי פרטי (VPC) שמארחת שירות מנוהל ומאפשרת לרשתות VPC אחרות לגשת אליו.

quantization

קוונטיזציה היא טכניקה לאופטימיזציה של מודלים שמשמשת להפחתת הדיוק של המספרים שמשמשים לייצוג הפרמטרים של המודל. הדבר יכול להוביל למודלים קטנים יותר, לצריכת חשמל נמוכה יותר ולזמן אחזור מופחת של הסקת מסקנות.

Random Forest

Random Forest הוא אלגוריתם של למידת מכונה שמשמש לסיווג ולרגרסיה. הוא לא מודל AI גנרטיבי בעצמו, אבל הוא רכיב שאפשר להשתמש בו במערכת גדולה יותר של AI גנרטיבי. יער אקראי מורכב מכמה עצי החלטה, וההסקה שלו היא צבירה של ההסקות מהעצים הבודדים האלה. לדוגמה, במשימת סיווג, כל עץ 'מצביע' על מחלקה, והמסקנה הסופית היא המחלקה עם הכי הרבה הצבעות. מידע נוסף זמין במאמר בנושא יער החלטות.

‫Ray client API (Ray Client)

Ray client הוא API שמאפשר לסקריפט Python מקומי או למעטפת אינטראקטיבית (כמו Jupyter notebook) להתחבר לאשכול Ray מרוחק ולקיים איתו אינטראקציה. בעצם, לקוח Ray מאפשר למשתמשים לפתח ולהריץ קוד Ray כאילו הקוד רץ באופן מקומי, תוך ניצול כוח המחשוב המבוזר של אשכול מרוחק. מידע נוסף זמין במאמר סקירה כללית על Ray ב-Vertex AI.

Ray cluster on Vertex AI

קלאסטר Ray ב-Vertex AI הוא קלאסטר מנוהל של צמתי מחשוב שאפשר להשתמש בו כדי להריץ אפליקציות של למידת מכונה (ML) ושל Python מבוזרות. הוא מספק את התשתית לביצוע חישוב מבוזר ועיבוד מקבילי בתהליך העבודה של למידת המכונה. אשכולות Ray מובנים ב-Vertex AI כדי להבטיח זמינות של קיבולת לעומסי עבודה קריטיים של ML או בעונות שיא. בניגוד למשימות בהתאמה אישית, שבהן שירות ההדרכה משחרר את המשאב אחרי שהמשימה מסתיימת, קלאסטרים של Ray נשארים זמינים עד שהם נמחקים. מידע נוסף זמין במאמר סקירה כללית על Ray ב-Vertex AI.

‫Ray on Vertex AI (RoV)

‫Ray ב-Vertex AI מתוכנן כך שתוכלו להשתמש באותו קוד Ray בקוד פתוח כדי לכתוב תוכניות ולפתח אפליקציות ב-Vertex AI עם שינויים מינימליים. מידע נוסף זמין במאמר סקירה כללית על Ray ב-Vertex AI.

‫Ray on Vertex AI SDK ל-Python

‫Ray on Vertex AI SDK for Python היא גרסה של Vertex AI SDK ל-Python שכוללת את הפונקציונליות של Ray Client,‏ Ray BigQuery connector,‏ Ray cluster management ב-Vertex AI והסקת מסקנות ב-Vertex AI. מידע נוסף זמין במאמר מבוא ל-Vertex AI SDK ל-Python.

recall

אחוז השכנים הקרובים האמיתיים שמוחזרים על ידי האינדקס. לדוגמה, אם שאילתת שכנים קרובים ל-20 שכנים קרובים החזירה 19 מהשכנים הקרובים של 'האמת הבסיסית', הזיכרון הוא 19/20x100 = 95%.

מתכון

בהקשר של Managed Training, מתכון הוא חבילה מקיפה וניתנת לשימוש חוזר שמכילה את כל מה שצריך כדי להריץ עומס עבודה ספציפי של אימון בקנה מידה גדול.

שרת צמצום

שרת Reduction הוא תכונה או רכיב שזמינים ב-Vertex AI, והוא מיועד במיוחד לאופטימיזציה של אימון GPU מבוזר. שרת ההפחתה פועל כאלגוריתם all-reduce שעוזר להגדיל את התפוקה ולהפחית את זמן האחזור באימון מודלים של למידת מכונה בקנה מידה גדול. מידע נוסף זמין במאמר בנושא קיצור זמן האימון באמצעות Reduction Server.

רגולריזציה

רגולריזציה היא טכניקה שמשמשת למניעת התאמת יתר במודלים של למידת מכונה. התאמת יתר מתרחשת כשמודל לומד את נתוני האימון בצורה טובה מדי, וכתוצאה מכך הביצועים שלו על נתונים שלא נראו לו קודם נמוכים. סוג ספציפי של רגולריזציה שמוזכר הוא עצירה מוקדמת, שבה האימון מופסק לפני שההפסד במערך נתוני אימות מתחיל לעלות, מה שמצביע על ירידה בביצועי ההכללה. מידע נוסף מופיע במאמר בנושא Overfitting: L2 regularization (התאמת יתר: רגולריזציה מסוג L2).

למידת חיזוק (RL)

סוג של למידת מכונה שבה סוכן לומד לקבל החלטות על ידי ביצוע פעולות בסביבה כדי למקסם את התגמול המצטבר. למידע נוסף, ראו שיפור ביצועים באמצעות RLHF ב-Vertex AI.

מגביל

פונקציונליות ל'הגבלת' חיפושים לקבוצת משנה של האינדקס באמצעות כללים בוליאניים. הגבלה נקראת גם "סינון". בעזרת חיפוש וקטורי, אפשר להשתמש בסינון מספרי ובסינון של מאפייני טקסט.

חשבון שירות

חשבונות שירות הם חשבונות מיוחדים ב-Google Cloud שאפליקציות או מכונות וירטואליות משתמשות בהם כדי לבצע קריאות מורשות ל-API של שירותי Google Cloud. בניגוד לחשבונות משתמשים, הם לא משויכים לאדם פרטי, אלא משמשים כזהות לקוד שלכם, ומאפשרים גישה מאובטחת ותוכנתית למשאבים בלי לדרוש אישורים של בני אדם. מידע נוסף מופיע במאמר סקירה כללית על חשבונות שירות.

סוכן שירות

סוכן שירות הוא חשבון שירות בניהול Google. הוא משמש כששירות מסוים צריך גישה למשאבים שנוצרו על ידי שירות אחר. לדוגמה, כששירותי Dataflow או Dataproc צריכים ליצור מופעים במהלך זמן הריצה, או כשפונקציית Cloud Functions רוצה להשתמש בשירות לניהול מפתחות (KMS) כדי להגן על פונקציית Cloud Functions. סוכני שירות נוצרים אוטומטית על ידי Google Cloud כששירות מסוים דורש אותם. בדרך כלל משתמשים בהם כדי לנהל את הגישה למשאבים ולבצע משימות שונות בשם השירות. מידע נוסף מופיע במאמר סוכני שירות.

Simple Linux Utility for Resource Management (SLURM)

‫Slurm הוא מנהל עומסי עבודה ומתזמן משימות חזק ופופולרי בקוד פתוח לליבות של Linux ו-Unix, במיוחד בסביבות של מחשוב עתיר ביצועים (HPC). מידע נוסף זמין במאמר הכלי לניהול עומסי עבודה Slurm.

אשכול Slurm

אוסף של מופעי Compute Engine שמנוהלים על ידי Slurm, שכולל צומת כניסה וכמה צמתים של עובדים שהוגדרו להרצת משימות אימון. מידע נוסף זמין במאמר הכלי לניהול עומסי עבודה Slurm.

מדדי סיכום

מדדי הסיכום הם ערך יחיד לכל מפתח מדד בהרצת ניסוי. לדוגמה, דיוק הבדיקה של ניסוי הוא הדיוק שמחושב ביחס למערך נתוני בדיקה בסוף האימון, שאפשר לתעד אותו כמדד סיכום של ערך יחיד.

כוונון עדין מפוקח (SFT)

טכניקה של למידת מכונה שבה מודל שאומן מראש עובר אימון נוסף על מערך נתונים קטן יותר ומתויג, כדי להתאים אותו למשימה ספציפית.

TensorBoard

‫TensorBoard היא חבילה של אפליקציות אינטרנט להמחשה ולהבנה של הפעלות ומודלים של TensorFlow. מידע נוסף זמין במאמר בנושא TensorBoard.

מכונת TensorBoard

מופע TensorBoard הוא משאב אזורי שבו מאוחסנים ניסויים של Vertex AI TensorBoard שמשויכים לפרויקט. אפשר ליצור כמה מופעים של TensorBoard בפרויקט, למשל אם רוצים כמה מופעים עם הפעלה של CMEK. זהה למשאב TensorBoard ב-API.

שם המשאב של TensorBoard

שם משאב של TensorBoard משמש לזיהוי מלא של מופע TensorBoard של Vertex AI. הפורמט הוא: projects/PROJECT_ID_OR_NUMBER/locations/REGION/tensorboards/TENSORBOARD_INSTANCE_ID.

‫TensorFlow Extended ‏ (TFX)

‫TensorFlow extended‏ (TFX) היא פלטפורמה מקצה לקצה לפריסת צינורות של למידת מכונה לייצור, שמבוססים על פלטפורמת TensorFlow.

TensorFlow Serving container

קובץ אימג' של קונטיינר ייעודי שנועד להפעיל מודלים של TensorFlow להסקת מסקנות בצורה יעילה. משתמשים בו כשפורסים מודלים טבלאיים בהתאמה אישית באמצעות Vertex AI Model Monitoring.

הזמן שחלף

הזמן שחלף הוא יחסי לתחילת הסרטון.

פלח זמן

פלח זמן מזוהה לפי היסטים של זמן התחלה וזמן סיום.

מדדים של סדרות עיתיות

מדדים של סדרות עיתיות הם ערכים של מדדים לאורך זמן, שכל ערך מייצג שלב בחלק של שגרת האימון בהרצה. מדדים של סדרות עיתיות מאוחסנים ב-Vertex AI TensorBoard. ב-Vertex AI Experiments מאוחסן הפניה למשאב Vertex TensorBoard.

token

טוקן במודל שפה הוא היחידה האטומית שהמודל מתאמן עליה ומסיק ממנה מסקנות, כלומר מילים, מורפמות ותווים. בדומיינים מחוץ למודלי שפה, טוקנים יכולים לייצג סוגים אחרים של יחידות אטומיות. לדוגמה, בראייה ממוחשבת, טוקן יכול להיות קבוצת משנה של תמונה. מידע נוסף זמין במאמר רשימה וספירה של אסימונים.

אשכול אימון

אשכול אימון הוא קבוצה של משאבי מחשוב מחוברים (כמו מכונות וירטואליות, מעבדי GPU ואחסון משויך) שהוגדרו במיוחד לביצוע עומסי עבודה של אימון מודלים של למידת מכונה באופן מבוזר. האשכולות האלה נועדו לספק את כוח המחשוב והמדרגיות שנדרשים לאימון מודלים מורכבים בצורה יעילה, ולרוב הם מנצלים עיבוד מקביל בכמה צמתים. מידע נוסף מופיע במאמר בנושא המבנה של אשכול האימון.

קבוצת נתונים לאימון

ב-Vertex AI, קבוצת הנתונים לאימון היא החלק הכי גדול בנתונים (בדרך כלל 80%) שמשמש לאימון מודל של למידת מכונה. המודל לומד את הדפוסים והקשרים בנתונים האלה כדי להסיק מסקנות. קבוצת נתונים לאימון שונה מקבוצות האימות וקבוצות נתונים לבדיקה, שמשמשות להערכת הביצועים של המודל במהלך האימון ואחריו.

מסלול

'מסלול' מתייחס לרצף של שלבים או פעולות שמבצע סוכן או מודל. המדד הזה משמש לעיתים קרובות להערכת מודלים גנרטיביים, שבהם נבדקת היכולת של המודל ליצור טקסט, קוד או תוכן אחר. יש כמה סוגים של מדדי מסלול שאפשר להשתמש בהם כדי להעריך מודלים גנרטיביים, כולל התאמה מדויקת של מסלול, התאמה של מסלול לפי סדר, התאמה של מסלול בכל סדר ודיוק של מסלול. המדדים האלה מודדים את הדמיון בין הפלט של המודל לבין קבוצה של פלטים לדוגמה שנוצרו על ידי בני אדם.

שנאי

'טרנספורמר' הוא ארכיטקטורת רשת נוירונים שעומדת בבסיס רוב המודלים הגנרטיביים החדשניים. הוא משמש ביישומים שונים של מודלי שפה, כולל תרגום. מודלים של טרנספורמרים מורכבים ממקודד ומפענח. המקודד ממיר טקסט קלט לייצוג ביניים, והמפענח ממיר את הייצוג הזה לפלט שימושי. הם משתמשים במנגנון של קשב עצמי כדי לאסוף הקשר מהמילים שמקיפות את המילה שעוברת עיבוד. הדרכה של מודל Transformer דורשת משאבים משמעותיים, אבל כוונון עדין של מודל Transformer שאומן מראש עבור אפליקציות ספציפיות הוא יעיל יותר.

חיובי אמיתי

'חיובי אמיתי' מתייחס להיקש שבו המודל מזהה נכון מחלקה חיובית. לדוגמה, אם מודל אומן לזהות לקוחות שירכשו מעיל, חיובי אמיתי יהיה חיזוי נכון שלקוח יבצע רכישה כזו.

פריטי מידע שנוצרו בתהליך פיתוח (Artifact) לא מנוהלים

ארטיפקט שקיים מחוץ להקשר של Vertex AI.

וקטור

וקטור הוא ייצוג מספרי של טקסט, תמונות או סרטונים, שמתעד את הקשרים בין נתוני הקלט. מודלים של למידת מכונה מתאימים ליצירת הטמעות על ידי זיהוי דפוסים בתוך קבוצות נתונים גדולות. אפליקציות יכולות להשתמש בהטמעות כדי לעבד ולייצר שפה, ולזהות משמעויות מורכבות וקשרים סמנטיים שספציפיים לתוכן. מידע נוסף מופיע במאמר סקירה כללית על ממשקי Embeddings API.

Vertex AI Agent Engine

‫Vertex AI Agent Engine, חלק מהפלטפורמה AI Platform, הוא קבוצה של שירותים שמאפשרים למפתחים לפרוס, לנהל ולבצע התאמה לעומס (scaling) של סוכני AI בסביבת ייצור. ‫Agent Engine מטפל בתשתית כדי להרחיב את השימוש בסוכנים בסביבת הייצור, כך שתוכלו להתמקד ביצירת אפליקציות. מידע נוסף זמין במאמר סקירה כללית על Vertex AI Agent Engine.

סוג הנתונים של Vertex AI

סוגי הנתונים ב-Vertex AI הם image,‏ text,‏ tabular ו-video.

Vertex AI Experiments

באמצעות Vertex AI Experiments, המשתמשים יכולים לעקוב אחרי הפעולות הבאות: 1. שלבים בהרצת ניסוי (לדוגמה, עיבוד מקדים ואימון). 2. נתוני קלט (לדוגמה, אלגוריתם, פרמטרים ומערכי נתונים). 3. פלט של השלבים האלה (לדוגמה, מודלים, נקודות ביקורת ומדדים).

Vertex AI Feature Store

שירות מנוהל לאחסון, להצגה ולניהול של תכונות למידת מכונה. מידע נוסף זמין במאמר מידע על Vertex AI Feature Store.

Vertex AI Inference

שירות Vertex AI שמאפשר להשתמש במודל מאומן של למידת מכונה (ML) כדי להסיק מסקנות מנתונים חדשים שלא נראו קודם. ‫Vertex AI מספק שירותים לפריסת מודלים לצורך הסקת מסקנות. מידע נוסף זמין במאמר קבלת מסקנות ממודל שאומן בהתאמה אישית.

Vertex ML Metadata

מערכת למעקב ולניתוח של מטא-נתונים מתהליכי עבודה של למידת מכונה. מידע נוסף זמין במאמר מבוא ל-Vertex ML Metadata.

מרשם המודלים של Vertex AI

מרשם המודלים של Vertex AI הוא מאגר מרכזי שבו אפשר לנהל את מחזור החיים של מודלים של למידת מכונה. במרשם המודלים של Vertex AI, תוכלו לראות סקירה כללית של המודלים שלכם כדי לארגן אותם טוב יותר, לעקוב אחריהם ולאמן גרסאות חדשות. אם יש לכם גרסת מודל שאתם רוצים לפרוס, אתם יכולים להקצות אותה לנקודת קצה ישירות מהמאגר, או לפרוס מודלים לנקודת קצה באמצעות שמות חלופיים. מידע נוסף זמין במאמר מבוא למרשם המודלים של Vertex AI.

‫Vertex AI SDK ל-Python

‫Vertex AI SDK ל-Python מספק פונקציונליות דומה לזו של ספריית הלקוח של Vertex AI Python, אבל ה-SDK הוא ברמה גבוהה יותר ופחות מפורט.

Vertex AI TensorBoard

‫Vertex AI TensorBoard הוא שירות מנוהל וניתן להרחבה ב-Google Cloud, שמאפשר למדעני נתונים ולמהנדסי ML להמחיש את הניסויים שלהם בלמידת מכונה, לנפות באגים באימון המודלים ולעקוב אחרי מדדי הביצועים באמצעות הממשק המוכר של TensorBoard בקוד פתוח. הוא משתלב בצורה חלקה עם Vertex AI Training ושירותים אחרים, ומספק אחסון מתמיד לנתוני ניסויים ומאפשר ניתוח משותף של פיתוח מודלים. מידע נוסף זמין במאמר מבוא ל-Vertex AI TensorBoard.

Vertex AI Vizier

שירות אופטימיזציה של קופסה שחורה להתאמת היפר-פרמטרים ופרמטרים אחרים. מידע נוסף זמין במאמר סקירה כללית על Vertex AI Vizier.

Vertex AI Workbench

‫Vertex AI Workbench היא סביבת פיתוח מאוחדת שמבוססת על מחברת Jupyter, ותומכת בכל תהליך העבודה של מדעי הנתונים, החל מחיפוש וניתוח נתונים ועד לפיתוח, לאימון ולפריסה של מודלים. ‫Vertex AI Workbench מספק תשתית מנוהלת וניתנת להרחבה עם שילובים מובנים לשירותים אחרים של Google Cloud, כמו BigQuery ו-Cloud Storage. כך מדעני נתונים יכולים לבצע את משימות למידת המכונה שלהם ביעילות בלי לנהל את התשתית הבסיסית. מידע נוסף זמין במאמר מבוא ל-Vertex AI Workbench.

פלח סרטון

קטע וידאו מזוהה לפי ההיסט של זמן ההתחלה וזמן הסיום של הסרטון.

מכונה וירטואלית (VM)

מכונה וירטואלית (VM) היא מערכת מחשב שלמה שמודמת לחלוטין בתוכנה. היא פועלת כ'אורחת' עצמאית במכונה פיזית 'מארחת'. למידע נוסף, ראו מכונות Compute Engine.

ענן וירטואלי פרטי (VPC)

ענן פרטי מאובטח ומבודד שמתארח בענן ציבורי, ומאפשר להגדיר רשת וירטואלית שמבודדת באופן לוגי מרשתות וירטואליות אחרות ב-Google Cloud. מידע נוסף זמין במאמר בנושא ענן וירטואלי פרטי.

קישור בין רשתות VPC שכנות (peering)

חיבור רשת שמאפשר לשתי רשתות VPC לתקשר באופן פרטי. בהקשר של Managed Training באשכולות שמורים, קישור בין רשתות VPC שכנות (peering) הוא רכיב קריטי לשילוב שירותים חיוניים. לדוגמה, זו השיטה הנדרשת לחיבור ה-VPC של האשכול למופע Filestore, שמספק את ספריית ה-‎/home המשותפת הנדרשת לכל הצמתים באשכול.

VPC Service Controls

VPC Service Controls הוא אמצעי אבטחה ב-Google Cloud שמאפשר לארגונים ליצור גבולות גזרה מאובטחים מסביב למידע אישי רגיש ולמשאבים, כדי לצמצם את הסיכון לזליגת נתונים. התכונה VPC Service Controls עושה זאת על ידי הגבלת הגישה לשירותים ולנתונים ספציפיים ב-Google Cloud מרשתות לא מורשות, ומניעת העברת נתונים מחוץ למתחמים המוגדרים האלה. כך היא מספקת הגנה חזקה מפני איומים פנימיים וזליגת נתונים מקרית. מידע נוסף זמין במאמר VPC Service Controls.

צומת עובד

צומת עובד הוא מכונה או מופע חישובי בתוך אשכול, שאחראי להפעלת משימות או לביצוע עבודה. במערכות כמו אשכולות Kubernetes או Ray, הצמתים הם יחידות המחשוב הבסיסיות. מידע נוסף זמין במאמר מהו מחשוב עתיר ביצועים (HPC)?

מאגר של Workers

רכיבים של אשכול Ray שמריצים משימות מבוזרות. אפשר להגדיר מאגרי עובדים עם סוגי מכונות ספציפיים, והם תומכים גם בהתאמה אוטומטית לעומס וגם בהרחבה ידנית. מידע נוסף מופיע במאמר בנושא המבנה של אשכול האימון.

zone

אזור פריסה ספציפי בתוך אזור Google Cloud. במסגרת Managed Training באשכולות שמורים, כדי לקבל את הביצועים הכי טובים, צריך ליצור את כל הרכיבים של השירות (האשכול, Filestore והמכונות ב-Managed Lustre) באותו אזור.

מילון מונחים של Vertex AI קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.

annotation set

נקודת קצה ל-API

Application Default Credentials ‏ (ADC)

שכן קרוב משוער (ANN)

artifact

Artifact Registry

בינה מלאכותית (AI)

אימות

הצגה אוטומטית זו לצד זו (AutoSxS)

AutoML

רישום אוטומטי ביומן

autorater

התאמה אוטומטית לעומס

baseline

batch

גודל אצווה

הסקת מסקנות בקבוצות

הטיה

bidrectional

ייצוגים דו-כיווניים של מקודד מטרנספורמרים (BERT)

BigQuery

BigQuery ML

‫Bigtable

Bilingual Evaluation Understudy (BLEU)

תיבה תוחמת

bucket

צ'אט

נקודת ביקורת

מודל סיווג

מדדי סיווג

Cloud Logging

‫Cloud Monitoring

Cloud Network Address Translation (Cloud NAT)

‫Cloud Profiler

Cloud Router

Cloud Storage

‫Cloud Storage Fuse

Cloud TPU

Colab Enterprise

consumer VPC

קובץ אימג' של קונטיינר

context

מטמון הקשר

חלון ההקשר

מפתחות הצפנה בניהול הלקוח (CMEK)

רשת VPC של צרכן

CustomJob

קובץ אימג' של קונטיינר בהתאמה אישית

אימון בהתאמה אישית

Dask

ניתוח נתונים

הגדלת מערך הנתונים

Data Center GPU manager (DCGM )

DataFrame

מערך נתונים (dataset)

decoder

רשת עצבית עמוקה (DNN)

עומק

DevOps

עצירה מוקדמת

הטמעה

מרחב הטמעה (מרחב סמוי)

וקטור הטמעה

encoder

נקודת קצה

ensemble

environment

הערכה (eval)

event

execution

ניסוי

הרצת ניסוי

AI ניתן להסברה

ניתוח נתונים ראשוני

ציון F1

תכונה

הנדסת פיצ'רים (feature engineering)

קבוצת תכונות

רשומת תכונה