‫Google משתמשת בטכנולוגיית AI כדי לתרגם תוכן לשפה המועדפת עליך. בתרגומים כאלו עשויות להיות שגיאות.

מידע על כוונון מפוקח (SFT) של מודלים של Gemini

כדאי להשתמש בשיטת כוונון מפוקח (SFT) כשמגדירים משימה ברורה עם נתונים מסומנים זמינים. היא יעילה במיוחד ליישומים ספציפיים לתחום שבהם השפה או התוכן שונים באופן משמעותי מהנתונים שעליהם אומן המודל הגדול במקור. אפשר לשפר את איכות הנתונים של טקסט, תמונות, אודיו, סרטונים ומסמכים. אפשר גם ליצור אפליקציות וסוכנים מבוססי Gemini שיכולים ליצור אינטראקציה עם מידע ושירותים בזמן אמת, כמו מסדי נתונים, מערכות לניהול קשרי לקוחות (CRM) ומאגרי מסמכים.

כוונון מפוקח (SFT) משנה את התנהגות המודל באמצעות מערך נתונים עם תוויות. במהלך התהליך הזה, המערכת משנה את המשקלים של המודל כדי לצמצם את ההבדל בין התחזיות שלו לבין התוויות בפועל. לדוגמה, היא יכולה לשפר את ביצועי המודל בסוגי המשימות הבאים:

סיווג
סיכום
מענה לשאלות על סמך מידע שחולץ
צ'אט

בפוסט בבלוג Hundreds of organizations are fine-tuning Gemini models. ריכזנו כאן את תרחישי השימוש המועדפים עליהם.

מידע נוסף זמין במאמר מתי כדאי להשתמש בכוונון מפוקח (SFT) ל-Gemini.

מודלים נתמכים

המודלים הבאים של Gemini תומכים בכוונון מפוקח (SFT):

לחצו כדי להרחיב את רשימת המודלים הנתמכים

מגבלות

כוונון מפוקח (SFT) אינו שירות מכוסה והוא אינו נכלל ביעד רמת השירות (SLO) של אף הסכם רמת שירות (SLA).

בטבלה הבאה מוצגות המגבלות על קבוצות נתונים של כוונון מפוקח (SFT):

Gemini 3.5 Flash

מפרט	ערך
מספר מקסימלי של טוקנים בקלט ובפלט לכל דוגמה לאימון	131,072
מספר מקסימלי של טוקנים בקלט ובפלט	זהה למודל Gemini הבסיסי
מספר הדוגמאות המקסימלי במערך נתונים של אימות	‫5,000 דוגמאות או 30% ממספר הדוגמאות לאימון, אם יש יותר מ-1,000 דוגמאות לאימות
גודל קובץ מקסימלי של מערך נתונים לאימון	‫1GB ל-JSONL
גודל מקסימלי של מערך נתונים לאימון	‫10 מיליון דוגמאות של טקסט בלבד או 300,000 דוגמאות של multi-modal
גודל המתאם	הערכים הנתמכים הם 1,‏ 2,‏ 4,‏ 8 ו-16
נקודת קצה נתמכת לכוונון מודל	`us-central1` וגם `europe-west4`
נקודת קצה נתמכת לפרסום מודל שעבר התאמה	נקודות קצה עם מספר אזורים ב-`us` וב-`eu` בלבד
תמיכה ב-CMEK	לא נתמך

Gemini 3.1 Flash-Lite

מפרט	ערך
מספר מקסימלי של טוקנים בקלט ובפלט לכל דוגמה לאימון	131,072
מספר מקסימלי של טוקנים בקלט ובפלט	זהה למודל Gemini הבסיסי
מספר הדוגמאות המקסימלי במערך נתונים של אימות	‫5,000 דוגמאות או 30% ממספר הדוגמאות לאימון, אם יש יותר מ-1,000 דוגמאות לאימות
גודל קובץ מקסימלי של מערך נתונים לאימון	‫1GB ל-JSONL
גודל מקסימלי של מערך נתונים לאימון	‫10 מיליון דוגמאות של טקסט בלבד או 300,000 דוגמאות של multi-modal
גודל המתאם	הערכים הנתמכים הם 1,‏ 2,‏ 4,‏ 8 ו-16
נקודת קצה נתמכת לכוונון מודל	`us-central1` וגם `europe-west4`
נקודת קצה נתמכת לפרסום מודל שעבר התאמה	נקודות קצה עם מספר אזורים ב-`us` וב-`eu` בלבד
תמיכה ב-CMEK	לא נתמך

Gemini 2.5 Flash
Gemini 2.5 Flash-Lite

מפרט	ערך
מספר מקסימלי של טוקנים בקלט ובפלט לכל דוגמה לאימון	131,072
מספר מקסימלי של טוקנים בקלט ובפלט	זהה למודל Gemini הבסיסי
מספר הדוגמאות המקסימלי במערך נתונים של אימות	‫5,000 דוגמאות או 30% ממספר הדוגמאות לאימון, אם יש יותר מ-1,000 דוגמאות לאימות
גודל קובץ מקסימלי של מערך נתונים לאימון	‫1GB ל-JSONL
גודל מקסימלי של מערך נתונים לאימון	‫10 מיליון דוגמאות של טקסט בלבד או 300,000 דוגמאות של multi-modal
גודל המתאם	הערכים הנתמכים הם 1,‏ 2,‏ 4,‏ 8 ו-16

Gemini ‎2.5 Pro

מפרט	ערך
מספר מקסימלי של טוקנים של קלט ופלט לאימון	131,072
מספר מקסימלי של טוקנים בקלט ובפלט	זהה למודל Gemini הבסיסי
גודל מקסימלי של מערך הנתונים לאימות	‫5,000 דוגמאות או 30% ממספר הדוגמאות לאימון, אם יש יותר מ-1,000 דוגמאות לאימות
גודל קובץ מקסימלי של מערך נתונים לאימון	‫1GB ל-JSONL
גודל מקסימלי של מערך נתונים לאימון	‫10 מיליון דוגמאות של טקסט בלבד או 300,000 דוגמאות של multi-modal
גודל המתאם	הערכים הנתמכים הם 1,‏ 2,‏ 4 ו-8

בעיות מוכרות

החלת יצירה מבוקרת כששולחים בקשות להסקת מסקנות למודלים של Gemini שעברו התאמה יכולה להוביל לירידה באיכות המודל בגלל חוסר התאמה של הנתונים במהלך ההתאמה ובזמן ההסקה. במהלך ההתאמה, לא מופעלת יצירה מבוקרת, ולכן המודל המותאם לא יכול להתמודד היטב עם יצירה מבוקרת בזמן ההסקה. כוונון מפוקח (SFT) מאפשר להתאים אישית את המודל כדי ליצור פלט מובנה. לכן, אין צורך להחיל יצירה מבוקרת כשמבצעים בקשות הסקה במודלים שעברו כוונון.

תרחישי שימוש בכוונון מפוקח (SFT)

מודלים בסיסיים פועלים בצורה טובה כשאפשר להגדיר בבירור ובצורה תמציתית את הפלט או המשימה הצפויים בהנחיה, וההנחיה יוצרת באופן עקבי את הפלט הצפוי. אם רוצים שהמודל ילמד משהו נישתי או ספציפי שחורג מדפוסים כלליים, כדאי לשקול לבצע התאמה של המודל. לדוגמה, אתם יכולים להשתמש בכוונון מודל כדי ללמד את המודל את הדברים הבאים:

מבנים או פורמטים ספציפיים ליצירת פלט.
התנהגויות ספציפיות, כמו מתי לספק פלט תמציתי או מפורט.
פלט מותאם אישית ספציפי לסוגים ספציפיים של קלט.

הדוגמאות הבאות הן תרחישי שימוש שקשה לתעד רק באמצעות הוראות להנחיה:

סיווג: התשובה הצפויה היא מילה או ביטוי ספציפיים.

הנחיה: סווג את הטקסט הבא לאחת מהקטגוריות הבאות: [עסקים, בידור]. טקסט: כדאי לגוון את תיק ההשקעות

תשובה: business

כוונון המודל יכול לעזור למנוע מהמודל ליצור תשובות מפורטות מדי.

סיכום: הסיכום הוא בפורמט מסוים. לדוגמה, יכול להיות שתצטרכו להסיר פרטים אישיים מזהים (PII) מסיכום של צ'אט.

הנחיה: תסכם: Jessica: That sounds great! נתראה בטיימס סקוור! אלכסנדר: נתראה ב-10!

תשובה: #Person1 ו-#Person2 מסכימים להיפגש בטיימס סקוור בשעה 10:00.

קשה לתאר את הפורמט הזה של החלפת שמות הדוברים ב-#Person1 וב-#Person2, ויכול להיות שהמודל הבסיסי לא יפיק תגובה כזו באופן טבעי.

מענה לשאלות על סמך מידע שחולץ: השאלה היא על הקשר מסוים והתשובה היא מחרוזת משנה של ההקשר.

הנחיה: הקשר: יש הוכחות לכך שחלו שינויים משמעותיים בצמחייה של יער האמזונס במהלך 21,000 השנים האחרונות, דרך תקופת הקרח האחרונה (LGM) וההפשרה שלאחריה. שאלה: מה פירוש ראשי התיבות LGM?

תשובה: הקרחון האחרון שהגיע לשיא הגודל

התשובה 'הקרחון האחרון' היא ביטוי ספציפי מההקשר.

צ'אט: צריך להתאים אישית את התשובה של המודל כדי שתתאים לאישיות, לתפקיד או לדמות מסוימת.

הנחיה: משתמש: מה מזג האוויר היום?

תשובה: Assistant: בתור המוכר הווירטואלי של Example Organization, אני יכול לעזור לך רק בנוגע לרכישות ולמשלוחים.

אפשר גם לכוונן מודל במצבים הבאים:

ההנחיות לא מניבות את התוצאות הרצויות באופן עקבי.
המשימה מורכבת מדי ואי אפשר להגדיר אותה בהנחיה. לדוגמה, אתם רוצים שהמודל ישכפל התנהגות שקשה להגדיר בהנחיה.
יש לכם אינטואיציות מורכבות לגבי משימה שקשה לנסח בהנחיה.
רוצים לצמצם את חלון ההקשר על ידי הסרת הדוגמאות של פרומפט עם כמה דוגמאות (few-shot).

הגדרת אזור גיאוגרפי לעבודת אופטימיזציה

נתוני המשתמשים, כמו מערך הנתונים שעבר טרנספורמציה והמודל המשופר, מאוחסנים באזור של משימת השיפור. במהלך ההתאמה, יכול להיות שהחישוב יועבר לאזורי US או EU אחרים כדי להשתמש במאיצים זמינים. ההעברה מתבצעת בצורה שקופה למשתמשים.

אם משתמשים ב-Vertex AI SDK, אפשר לציין את האזור בהפעלה הראשונית. לדוגמה:
```
import vertexai
vertexai.init(project='myproject', location='us-central1')
```
אם יוצרים משימת כוונון עדין מפוקחת על ידי שליחת בקשת POST באמצעות השיטה tuningJobs.create, צריך להשתמש בכתובת ה-URL כדי לציין את האזור שבו משימת הכוונון תפעל. לדוגמה, בכתובת ה-URL הבאה, כדי לציין אזור צריך להחליף את שני המקרים של TUNING_JOB_REGION באזור שבו מופעלת העבודה.
```
 https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs
```
אם משתמשים בGoogle Cloud מסוף, אפשר לבחור את שם האזור בשדה הנפתח אזור בדף פרטי המודל. זה אותו הדף שבו בוחרים את מודל הבסיס ואת שם המודל המותאם.

הערכה של מודלים שעברו התאמה

אפשר להעריך מודלים שעברו התאמה בדרכים הבאות:

מדדי כוונון ואימות: אחרי שמשימת הכוונון מסתיימת, אפשר להעריך את המודל המכוונן באמצעות מדדי כוונון ואימות.
הערכה משולבת באמצעות שירות ההערכה של AI גנרטיבי (גרסת Preview): אפשר להגדיר משימות של שיפור המודל כך שההערכות יבוצעו באופן אוטומטי באמצעות שירות ההערכה של AI גנרטיבי במהלך השיפור. הממשקים, המודלים והאזורים הבאים נתמכים בשילוב של כוונון עם שירות ההערכה של AI גנרטיבי:
- ממשקים נתמכים: Google Gen AI SDK ו-API בארכיטקטורת REST.
- מודלים נתמכים: gemini-2.5-pro,‏ gemini-2.5-flash ו-gemini-2.5-flash-lite.
- אזורים נתמכים: רשימת האזורים הנתמכים מופיעה כאן.

מכסה

המכסה נאכפת על מספר משימות ההתאמה האישית שמתבצעות בו-זמנית. כל פרויקט מגיע עם מכסה שמאפשר להריץ לפחות משימת התאמה אחת. זו מכסה גלובלית שמשותפת לכל האזורים הזמינים ולכל המודלים הנתמכים. אם אתם רוצים להריץ יותר משימות בו-זמנית, אתם צריכים לבקש מכסה נוספת ל-Global concurrent tuning jobs.

אם הגדרתם את שירות ההערכה של AI גנרטיבי להפעלת הערכות באופן אוטומטי במהלך ההתאמה, כדאי לעיין במיכסות של שירות ההערכה של AI גנרטיבי.

תמחור

כאן אפשר למצוא את התמחור של Gemini supervised fine-tuning (כוונון עדין מפוקח של Gemini).

מספר טוקני האימון מחושב על ידי הכפלת מספר הטוקנים במערך נתוני האימון במספר התקופות של זמן המערכת. אחרי הכוונון, עדיין חלות עלויות על הסקת מסקנות (בקשת חיזוי) עבור המודל המכוונן. התמחור של הסקת מסקנות זהה לכל גרסה יציבה של Gemini. מידע נוסף זמין במאמר בנושא גרסאות יציבות זמינות של מודלים של Gemini.

אם מגדירים את שירות ההערכה של AI גנרטיבי להפעלה אוטומטית במהלך ההתאמה, החיוב על ההערכות מתבצע כעל משימות של חיזוי באצווה. מידע נוסף על תמחור