מידע על כוונון מפוקח (SFT) של מודלים של Gemini

כדאי להשתמש בשיטת כוונון מפוקח (SFT) כשמגדירים משימה ברורה ויש נתונים מסומנים זמינים. האפשרות הזו יעילה במיוחד לאפליקציות ספציפיות לתחום שבהן השפה או התוכן שונים באופן משמעותי מהנתונים שהמודל הגדול אומן עליהם במקור. אפשר לשפר את התוצאות של סוגי הנתונים הבאים: טקסט, תמונה, אודיו, סרטון ומסמך. אתם יכולים גם ליצור אפליקציות וסוכנים מבוססי Gemini שיכולים ליצור אינטראקציה עם מידע ושירותים בזמן אמת, כמו מסדי נתונים, מערכות לניהול קשרי לקוחות ומאגרי מסמכים.

כוונון מפוקח (SFT) מתאים את התנהגות המודל באמצעות מערך נתונים עם תוויות. במהלך התהליך הזה, המערכת משנה את המשקלים של המודל כדי לצמצם את ההבדל בין התחזיות שלו לבין התוויות בפועל. לדוגמה, היא יכולה לשפר את ביצועי המודל בסוגי המשימות הבאים:

  • סיווג
  • סיכום
  • מענה לשאלות על סמך מידע שחולץ
  • צ'אט

בפוסט בבלוג Hundreds of organizations are fine-tuning Gemini models. מפורטים תרחישי השימוש העיקריים בהתאמה. אלה תרחישי השימוש המועדפים עליהם.

מידע נוסף זמין במאמר מתי כדאי להשתמש בכוונון מפוקח (SFT) של Gemini.

מודלים נתמכים

המודלים הבאים של Gemini תומכים בכוונון מפוקח (SFT):

במודלים שתומכים בחשיבה, מומלץ להגדיר את תקציב החשיבה כלא פעיל או כערך הנמוך ביותר. כך אפשר לשפר את הביצועים ולהפחית את העלויות של משימות מותאמות. במהלך כוונון מפוקח (SFT), המודל לומד מנתוני האימון ומשמיט את תהליך החשיבה. לכן, המודל המכוונן שמתקבל יכול לבצע משימות מכווננות ביעילות בלי תקציב חשיבה.

מגבלות

כוונון מפוקח (SFT) אינו שירות מכוסה והוא אינו נכלל ביעדי רמת השירות (SLO) של הסכם רמת שירות כלשהו.

בטבלה הבאה מוצגות המגבלות על קבוצות נתונים של כוונון מפוקח (SFT):

‫Gemini 2.5 Flash
Gemini 2.5 Flash-Lite

מפרט ערך
מספר הטוקנים המקסימלי של הקלט והפלט לכל דוגמה לאימון 131,072
מספר האסימונים המקסימלי של הקלט והפלט זהה למודל הבסיסי של Gemini
מספר הדוגמאות המקסימלי במערך נתונים של אימות ‫5,000 דוגמאות או 30% ממספר הדוגמאות לאימון, אם יש יותר מ-1,000 דוגמאות לאימות
גודל קובץ מקסימלי של מערך נתונים לאימון ‫1GB ל-JSONL
גודל מקסימלי של מערך נתונים לאימון ‫10 מיליון דוגמאות של טקסט בלבד או 300,000 דוגמאות של מולטי-מודאלי
גודל המתאם הערכים הנתמכים הם 1,‏ 2,‏ 4,‏ 8 ו-16

Gemini ‎2.5 Pro

מפרט ערך
מספר מקסימלי של טוקנים לאימון קלט ופלט 131,072
מספר האסימונים המקסימלי של הקלט והפלט זהה למודל הבסיסי של Gemini
גודל מקסימלי של מערך הנתונים לאימות ‫5,000 דוגמאות או 30% ממספר הדוגמאות לאימון, אם יש יותר מ-1,000 דוגמאות לאימות
גודל קובץ מקסימלי של מערך נתונים לאימון ‫1GB ל-JSONL
גודל מקסימלי של מערך נתונים לאימון ‫10 מיליון דוגמאות של טקסט בלבד או 300,000 דוגמאות של מולטי-מודאלי
גודל המתאם הערכים הנתמכים הם 1, 2, 4 ו-8

‫Gemini 2.0 Flash
Gemini 2.0 Flash-Lite

מפרט ערך
מספר מקסימלי של טוקנים לאימון קלט ופלט 131,072
מספר האסימונים המקסימלי של הקלט והפלט זהה למודל הבסיסי של Gemini
גודל מקסימלי של מערך הנתונים לאימות ‫5,000 דוגמאות או 30% ממספר הדוגמאות לאימון, אם יש יותר מ-1,000 דוגמאות לאימות
גודל קובץ מקסימלי של מערך נתונים לאימון ‫1GB ל-JSONL
גודל מקסימלי של מערך נתונים לאימון ‫10 מיליון דוגמאות של טקסט בלבד או 300,000 דוגמאות של מולטי-מודאלי
גודל המתאם הערכים הנתמכים הם 1, 2, 4 ו-8

בעיות מוכרות

  • החלת יצירה מבוקרת כששולחים בקשות להסקת מסקנות למודלים של Gemini שעברו התאמה יכולה להוביל לירידה באיכות המודל בגלל חוסר התאמה של הנתונים במהלך ההתאמה ובזמן ההסקה. במהלך ההתאמה, לא מופעלת יצירה מבוקרת, ולכן המודל המותאם לא יכול להתמודד היטב עם יצירה מבוקרת בזמן ההסקה. כוונון מפוקח (SFT) מאפשר להתאים אישית את המודל כדי ליצור פלט מובנה. לכן, אין צורך להחיל יצירה מבוקרת כשמבצעים בקשות הסקה במודלים שעברו כוונון.

תרחישי שימוש בכוונון מפוקח (SFT)

מודלים בסיסיים פועלים היטב כשאפשר להגדיר בבירור ובאופן תמציתי את הפלט או המשימה הצפויים בהנחיה, וההנחיה יוצרת באופן עקבי את הפלט הצפוי. אם רוצים שהמודל ילמד משהו נישתי או ספציפי שחורג מהדפוסים הכלליים, כדאי לשקול כוונון של המודל. לדוגמה, אפשר להשתמש בכוונון מודל כדי ללמד את המודל את הדברים הבאים:

  • מבנים או פורמטים ספציפיים ליצירת פלט.
  • התנהגויות ספציפיות, כמו מתי לספק פלט תמציתי או מפורט.
  • פלט מותאם אישית ספציפי לסוגים ספציפיים של קלט.

הדוגמאות הבאות הן תרחישי שימוש שקשה לתעד רק באמצעות הוראות בהנחיה:

  • סיווג: התשובה הצפויה היא מילה או ביטוי ספציפיים.

    כוונון המודל יכול לעזור למנוע מהמודל ליצור תשובות מפורטות מדי.

  • סיכום: הסיכום הוא בפורמט מסוים. לדוגמה, יכול להיות שתצטרכו להסיר פרטים אישיים מזהים (PII) מסיכום של צ'אט.

    קשה לתאר את הפורמט הזה של החלפת שמות הדוברים ב-#Person1 וב-#Person2, ויכול להיות שמודל הבסיס לא ייצור באופן טבעי תשובה כזו.

  • מענה לשאלות על סמך מידע שחולץ: השאלה היא לגבי הקשר והתשובה היא מחרוזת משנה של ההקשר.

    התשובה 'הקרחון האחרון' היא ביטוי ספציפי מההקשר.

  • צ'אט: צריך להתאים אישית את התשובה של המודל כדי שתתאים לאישיות, לתפקיד או לדמות מסוימת.

אפשר גם לכוונן מודל במצבים הבאים:

  • ההנחיות לא מניבות את התוצאות הרצויות באופן עקבי.
  • המשימה מסובכת מדי ואי אפשר להגדיר אותה בהנחיה. לדוגמה, אתם רוצים שהמודל ישכפל התנהגות שקשה להגדיר בהנחיה.
  • יש לכם אינטואיציות מורכבות לגבי משימה שקשה לנסח בהנחיה.
  • רוצים לצמצם את חלון ההקשר על ידי הסרת הדוגמאות של הלמידה עם מעט דוגמאות.

הגדרת אזור של משימת אופטימיזציה

נתוני המשתמשים, כמו מערך הנתונים שעבר טרנספורמציה והמודל שעבר התאמה, מאוחסנים באזור של משימת ההתאמה. במהלך ההתאמה, יכול להיות שהחישוב יועבר לאזורי US או EU אחרים כדי להשתמש במאיצים זמינים. ההעברה מתבצעת בצורה שקופה למשתמשים.

  • אם משתמשים ב-Vertex AI SDK, אפשר לציין את האזור בזמן האתחול. לדוגמה:

    import vertexai
    vertexai.init(project='myproject', location='us-central1')
    
  • אם יוצרים משימת התאמה עדינה מפוקחת על ידי שליחת בקשת POST באמצעות השיטה tuningJobs.create, צריך להשתמש בכתובת ה-URL כדי לציין את האזור שבו משימת ההתאמה תפעל. לדוגמה, בכתובת ה-URL הבאה, כדי לציין אזור צריך להחליף את שני המקרים של TUNING_JOB_REGION באזור שבו מופעלת העבודה.

     https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs
    
  • אם משתמשים בGoogle Cloud מסוף, אפשר לבחור את שם האזור בשדה הנפתח אזור בדף פרטי המודל. זה אותו הדף שבו בוחרים את מודל הבסיס ואת השם של המודל המותאם.

הערכה של מודלים שעברו התאמה

אפשר להעריך מודלים שעברו התאמה בדרכים הבאות:

  • מדדי כוונון ואימות: מעריכים את המודל המכוונן באמצעות מדדי כוונון ואימות אחרי שהכוונון מסתיים.

  • הערכה משולבת באמצעות שירות ההערכה של AI גנרטיבי (גרסת Preview): הגדרת משימות התאמה להפעלת הערכות באופן אוטומטי באמצעות שירות ההערכה של AI גנרטיבי במהלך ההתאמה. הממשקים, המודלים והאזורים הבאים נתמכים בשילוב של כוונון עם שירות ההערכה של AI גנרטיבי:

    • ממשקים נתמכים: Google Gen AI SDK ו-API בארכיטקטורת REST.

    • מודלים נתמכים: gemini-2.5-pro,‏ gemini-2.5-flash ו-gemini-2.5-flash-lite.

    • אזורים נתמכים: רשימת האזורים הנתמכים מופיעה כאן.

מכסה

המכסה נאכפת על מספר משימות ההתאמה האישית שמתבצעות בו-זמנית. כל פרויקט מגיע עם מכסה ברירת מחדל להרצת לפחות משימת כוונון אחת. זו מכסה גלובלית שמשותפת לכל האזורים הזמינים ולכל המודלים הנתמכים. אם אתם רוצים להריץ יותר משימות בו-זמנית, אתם צריכים לבקש מכסה נוספת ל-Global concurrent tuning jobs.

אם הגדרתם את שירות ההערכה של AI גנרטיבי להפעלת הערכות באופן אוטומטי במהלך ההתאמה, כדאי לעיין במכסות של שירות ההערכה של AI גנרטיבי.

תמחור

כאן אפשר למצוא את המחירים של כוונון מפוקח (SFT) של Gemini.

מספר טוקני האימון מחושב על ידי הכפלת מספר הטוקנים במערך נתוני האימון במספר התקופות של זמן המערכת. אחרי הכוונון, עדיין חלות עלויות על הסקת מסקנות (בקשת חיזוי) עבור המודל המכוונן. התמחור של הסקת מסקנות זהה לכל גרסה יציבה של Gemini. מידע נוסף זמין במאמר בנושא גרסאות יציבות זמינות של מודלים של Gemini.

אם מגדירים את שירות ההערכה של ה-AI הגנרטיבי להפעלה אוטומטית במהלך ההתאמה, החיוב על ההערכות מתבצע כעל משימות של חיזוי אצווה. מידע נוסף מפורט בקטע תמחור.

המאמרים הבאים