רישום של מודלים של AI מרחוק והפעלתם באמצעות ניהול נקודות קצה של מודלים

בדף הזה מוסבר איך להפעיל חיזויים או ליצור הטמעות באמצעות מודל, ואז לרשום את נקודת הקצה של המודל בניהול נקודות קצה של מודלים.

מידע נוסף על הפונקציה mysql.ml_create_model_registration() זמין במאמר הסבר על ניהול נקודות קצה של מודלים.

לפני שמתחילים

  • מגדירים אימות בהתאם לספק המודל.

מגדירים אימות

בקטעים הבאים מוסבר איך להגדיר אימות לפני שמוסיפים נקודת קצה של מודל Vertex AI או נקודות קצה של מודלים שמתארחים ב- Google Cloud.

הגדרת אימות ל-Vertex AI

כדי להשתמש בנקודות הקצה של מודל Google Vertex AI, צריך להוסיף הרשאות Vertex AI לחשבון השירות של Cloud SQL שמבוסס על IAM, שמשמש לחיבור למסד הנתונים. מידע נוסף על שילוב עם Vertex AI זמין במאמר שילוב של Cloud SQL עם Vertex AI.

הגדרת אימות למודלים שמתארחים בהתאמה אישית

בקטע הזה מוסבר איך להגדיר אימות אם אתם משתמשים ב-Secret Manager. בכל המודלים חוץ מנקודות הקצה של מודלים ב-Vertex AI, אפשר לאחסן את מפתחות ה-API או את טוקני ה-Bearer ב-Secret Manager.

אם נקודת הקצה של המודל לא מטפלת באימות באמצעות Secret Manager, הקטע הזה הוא אופציונלי. לדוגמה, אם נקודת הקצה של המודל משתמשת בכותרות HTTP כדי להעביר פרטי אימות או לא משתמשת באימות בכלל, אל תבצעו את השלבים שבקטע הזה.

כדי ליצור מפתח API או אסימון מסוג bearer ולהשתמש בהם, צריך לבצע את השלבים הבאים:

  1. יוצרים סוד ב-Secret Manager. מידע נוסף זמין במאמר בנושא יצירת סוד וגישה לגרסה של סוד.

    שם הסוד ונתיב הסוד משמשים בפונקציית ה-SQL‏ mysql.ml_create_sm_secret_registration().

  2. נותנים הרשאות למכונת Cloud SQL לגשת לסוד.

      gcloud secrets add-iam-policy-binding SECRET_ID \
          --member="serviceAccount:SERVICE_ACCOUNT_EMAIL" \
          --role="roles/secretmanager.secretAccessor"
    

    מחליפים את מה שכתוב בשדות הבאים:

    • SECRET_ID: מזהה הסוד ב-Secret Manager.
    • SERVICE_ACCOUNT_EMAIL: כתובת האימייל של חשבון השירות של Cloud SQL שמבוסס על IAM. כדי למצוא את כתובת האימייל הזו, משתמשים בפקודה gcloud sql instances describe INSTANCE_NAME ומחליפים את INSTANCE_NAME בשם המכונה. הערך שמופיע לצד הפרמטר serviceAccountEmailAddress הוא כתובת האימייל.

מודלים להטמעת טקסט עם תמיכה מובנית

בקטע הזה מוסבר איך לרשום נקודות קצה של מודלים לניהול נקודות קצה של מודלים.

מודלים של הטמעה ב-Vertex AI

ניהול נקודות קצה של מודלים מספק תמיכה מובנית בכל הגרסאות של המודלים text-embedding-gecko,‏ text-embedding ו-gemini-embedding של Vertex AI. משתמשים בשם המלא כדי להגדיר את גרסת המודל ל-textembedding-gecko@001 או ל-textembedding-gecko@002.

מזהי נקודות הקצה של מודלים להטמעה ב-Vertex AI נתמכים כברירת מחדל בניהול נקודות קצה של מודלים, ולכן אפשר להשתמש בכל אחד מהם ישירות כמזהה המודל. במודלים האלה, פונקציית ההטמעה מבצעת באופן אוטומטי טרנספורמציה של הקלט והפלט.

מוודאים שגם מכונת Cloud SQL וגם מודל Vertex AI שאתם שולחים אליו שאילתה נמצאים באותו אזור.

כדי לרשום את נקודת הקצה של מודל gemini-embedding-001, קוראים לפונקציה ml_create_model_registration:

  CALL
    mysql.ml_create_model_registration(
      'gemini-embedding-001',
      'publishers/google/models/gemini-embedding-001',
      'google','text_embedding', 'gemini-embedding-001',
      'AUTH_TYPE_CLOUDSQL_SERVICE_AGENT_IAM',
       NULL,
      'mysql.cloudsql_ml_text_embedding_input_transform',
      'mysql.cloudsql_ml_text_embedding_output_transform', NULL);

מודלים של הטמעת טקסט שמתארחים בהתאמה אישית

בקטע הזה מוסבר איך לרשום נקודות קצה של מודלים בהתאמה אישית שמארחים ברשתות בתוך Google Cloud.

הוספה של נקודות קצה (endpoints) של מודלים להטמעת טקסט באירוח מותאם אישית כוללת יצירה של פונקציות טרנספורמציה, ואופציונלית, כותרות HTTP מותאמות אישית. לעומת זאת, כדי להוסיף נקודות קצה של מודלים גנריים באירוח מותאם אישית, אפשר ליצור כותרות HTTP מותאמות אישית ולהגדיר את כתובת ה-URL של בקשת המודל.

בדוגמה הבאה מוסיפים את נקודת הקצה של מודל הטמעת הטקסט custom-embedding-model שמארח Cymbal, שמתארח ב- Google Cloud. פונקציות הטרנספורמציה cymbal_text_input_transform ו-cymbal_text_output_transform משמשות לשינוי פורמט הקלט והפלט של המודל לפורמט הקלט והפלט של פונקציית החיזוי.

כדי לרשום נקודות קצה של מודל הטמעת טקסט בהוסטינג בהתאמה אישית, מבצעים את השלבים הבאים:

  1. קוראים לסוד שמאוחסן ב-Secret Manager:

    CALL
      mysql.ml_create_sm_secret_registration(
        'SECRET_ID',
        'projects/project-id/secrets/SECRET_MANAGER_SECRET_ID/versions/VERSION_NUMBER');
    

    מחליפים את מה שכתוב בשדות הבאים:

    • SECRET_ID: מזהה הסוד שהגדרתם ומשמש בהמשך לרישום של נקודת קצה של מודל, לדוגמה key1.
    • SECRET_MANAGER_SECRET_ID: מזהה הסוד שהוגדר ב-Secret Manager כשיוצרים את הסוד.
    • PROJECT_ID: מזהה הפרויקט ב- Google Cloud .
    • VERSION_NUMBER: מספר הגרסה של מזהה הסוד.
  2. יוצרים את פונקציות ההמרה של הקלט והפלט על סמך החתימה הבאה של פונקציית החיזוי עבור נקודות קצה של מודלים להטמעת טקסט. מידע נוסף על יצירת פונקציות טרנספורמציה זמין במאמר דוגמה לפונקציות טרנספורמציה.

    אלה דוגמאות לפונקציות טרנספורמציה שספציפיות לנקודת הקצה של מודל הטמעת הטקסט custom-embedding-model:

    -- Input Transform Function corresponding to the custom model endpoint
    DELIMITER $$
    CREATE FUNCTION IF NOT EXISTS cymbal_text_input_transform(model_id VARCHAR(100), input_text TEXT)
    RETURNS JSON
    DETERMINISTIC
    
    BEGIN
      RETURN JSON_OBJECT('prompt', JSON_ARRAY(input_text));
    END $$
    
    -- Output Transform Function corresponding to the custom model endpoint
    CREATE FUNCTION IF NOT EXISTS cymbal_text_output_transform(model_id VARCHAR(100), response_json JSON)
    RETURNS BLOB
    DETERMINISTIC
    
    BEGIN
      RETURN STRING_TO_VECTOR(
             JSON_EXTRACT(
                  content,
                  '$.predictions[0].embeddings.values'
                )
         );
    
    END $$
    DELIMITER ;
    
  3. קוראים לפונקציה ליצירת מודל כדי לרשום את נקודת הקצה של מודל ההטמעה המותאם אישית:

   CALL
      mysql.ml_create_model_registration(
        'MODEL_ID',
        'REQUEST_URL',
        'custom',
        'text_embedding',
        'MODEL_QUALIFIED_NAME',
        'auth_type_secret_manager',
        'SECRET_ID'
        'database_name.cymbal_text_input_transform',
        'database_name.cymbal_text_output_transform', NULL);

מחליפים את מה שכתוב בשדות הבאים:

  • MODEL_ID: שדה חובה. מזהה ייחודי לנקודת הקצה של המודל שאתם מגדירים (לדוגמה, custom-embedding-model). המזהה הזה משמש כהפניה למטא-נתונים שנקודת הקצה של המודל צריכה כדי ליצור הטמעות או להפעיל תחזיות.
  • REQUEST_URL: שדה חובה. נקודת הקצה הספציפית למודל כשמוסיפים הטמעת טקסט בהתאמה אישית ונקודות קצה של מודלים גנריים – לדוגמה, https://cymbal.com/models/text/embeddings/v1. מוודאים שאפשר לגשת לנקודת הקצה של המודל דרך כתובת IP פנימית. ניהול נקודות קצה של מודלים לא תומך בכתובות IP חיצוניות.
  • MODEL_QUALIFIED_NAME: חובה אם נקודת הקצה של המודל משתמשת בשם מלא. השם המוגדר במלואו אם לנקודת הקצה של המודל יש כמה גרסאות.
  • SECRET_ID: מזהה הסוד שבו השתמשתם קודם בmysql.ml_create_sm_secret_registration()הליך.

מודלים גנריים

בקטע הזה מוסבר איך לרשום נקודת קצה של מודל gemini-flash כללי מ-Vertex AI Model Garden, שרשום מראש בקטלוג כברירת מחדל. אפשר לרשום כל נקודת קצה של מודל גנרי שמארחת בתוך Google Cloud.

‫Cloud SQL תומך רק בנקודות קצה של מודלים שזמינות דרך Vertex AI Model Garden ובנקודות קצה של מודלים שמארחים ברשתות בתוך Google Cloud.

מודל Gemini

בדוגמה הבאה נעשה שימוש בנקודת הקצה של מודל gemini-2.5-flash מ-Vertex AI Model Garden.

כדי לרשום את נקודת הקצה של מודל gemini-2.5-flash, קוראים לפונקציה mysql.ml_create_model_registration:

    CALL
      mysql.ml_create_model_registration(
        'MODEL_ID',
        'https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/gemini-2.5-flash:streamGenerateContent',
        'google',
        'auth_type_cloudsql_service_agent_iam',
        NULL, NULL, NULL, NULL);

מחליפים את מה שכתוב בשדות הבאים:

  • MODEL_ID: מזהה ייחודי לנקודת הקצה של המודל שאתם מגדירים (לדוגמה,
    gemini-1). המזהה הזה משמש כהפניה למטא-נתונים שנקודת הקצה של המודל צריכה כדי ליצור הטמעות או להפעיל תחזיות.
  • PROJECT_ID: מזהה הפרויקט ב- Google Cloud .

מידע נוסף זמין במאמר בנושא הפעלת תחזיות לנקודות קצה של מודלים גנריים.

המאמרים הבאים