סנכרון מ-Cloud SQL

כדי להטמיע נתונים מ-Cloud SQL, צריך לבצע את השלבים הבאים כדי להגדיר גישה ל-Cloud SQL, ליצור מאגר נתונים ולהטמיע נתונים.

הגדרת גישה לקטגוריית אחסון זמני למכונות Cloud SQL

כשמבצעים המרה של נתונים מ-Cloud SQL, הנתונים עוברים קודם לקטגוריה של Cloud Storage. כדי לתת למופע Cloud SQL גישה לקטגוריות של Cloud Storage, מבצעים את השלבים הבאים.

  1. נכנסים לדף SQL במסוף Google Cloud .

    SQL

  2. לוחצים על המכונה של Cloud SQL שממנה רוצים לייבא.

  3. מעתיקים את המזהה של חשבון השירות של המופע, שנראה כמו כתובת אימייל – לדוגמה, p9876-abcd33f@gcp-sa-cloud-sql.iam.gserviceaccount.com.

  4. עוברים לדף IAM & Admin.

    IAM & Admin

  5. לוחצים על הענקת גישה.

  6. בשדה New principals (חשבונות משתמשים חדשים), מזינים את המזהה של חשבון השירות של המופע ובוחרים בתפקיד Cloud Storage > Storage Admin.

  7. לוחצים על Save.

השלב הבא:

הגדרת גישה ל-Cloud SQL מפרויקט אחר

כדי להעניק ל-Gemini Enterprise גישה לנתוני Cloud SQL שנמצאים בפרויקט אחר, פועלים לפי השלבים הבאים:

  1. מחליפים את המשתנה PROJECT_NUMBER במספר הפרויקט של Gemini Enterprise, ואז מעתיקים את התוכן של בלוק הקוד. זה המזהה של חשבון השירות שלך ב-Gemini Enterprise:

    service-PROJECT_NUMBER@gcp-sa-discoveryengine.iam.gserviceaccount.com
    
  2. עוברים לדף IAM & Admin.

    IAM & Admin

  3. עוברים לפרויקט Cloud SQL בדף IAM & Admin ולוחצים על Grant Access.

  4. בשדה New principals (חשבונות משתמשים חדשים), מזינים את המזהה של חשבון השירות ובוחרים בתפקיד Cloud SQL > Cloud SQL Viewer.

  5. לוחצים על Save.

לאחר מכן, עוברים אל ייבוא נתונים מ-Cloud SQL.

ייבוא נתונים מ-Cloud SQL

המסוף

כדי להשתמש במסוף להעברת נתונים מ-Cloud SQL, פועלים לפי השלבים הבאים:

  1. נכנסים לדף Gemini Enterprise במסוף Google Cloud .

    Gemini Enterprise

  2. עוברים לדף מאגרי נתונים.

  3. לוחצים על יצירת מאגר נתונים.

  4. בדף Select a data source, בוחרים באפשרות Cloud SQL.

  5. מציינים את מזהה הפרויקט, מזהה המכונה, מזהה מסד הנתונים ומזהה הטבלה של הנתונים שרוצים לייבא.

  6. לוחצים על Browse, בוחרים מיקום ביניים ב-Cloud Storage לייצוא הנתונים ולוחצים על Select. אפשר גם להזין את המיקום ישירות בשדה gs://.

  7. בוחרים אם להפעיל ייצוא בלי שרת (serverless). ייצוא בלי שרת (serverless) כרוך בעלות נוספת. מידע על ייצוא בלי שרת (serverless) מופיע במאמר מזעור ההשפעה של הייצוא על הביצועים במאמרי העזרה של Cloud SQL.

  8. לוחצים על Continue.

  9. בוחרים אזור למאגר הנתונים.

  10. מזינים שם למאגר הנתונים.

  11. לוחצים על יצירה.

  12. כדי לבדוק את סטטוס ההטמעה, עוברים לדף מאגרי נתונים ולוחצים על השם של מאגר הנתונים כדי לראות את הפרטים שלו בדף נתונים. ההטמעה מסתיימת כשהסטטוס בעמודה סטטוס בכרטיסייה פעילות משתנה מבתהליך להייבוא הושלם.

    בהתאם לגודל הנתונים, תהליך ההטמעה יכול להימשך כמה דקות או כמה שעות.

REST

כדי ליצור מאגר נתונים ולהטמיע נתונים מ-Cloud SQL באמצעות שורת הפקודה, פועלים לפי השלבים הבאים:

  1. יוצרים מאגר נתונים.

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" \
    -H "X-Goog-User-Project: PROJECT_ID" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores?dataStoreId=DATA_STORE_ID" \
    -d '{
      "displayName": "DISPLAY_NAME",
      "industryVertical": "GENERIC",
      "solutionTypes": ["SOLUTION_TYPE_SEARCH"],
    }'
    

    מחליפים את מה שכתוב בשדות הבאים:

    • PROJECT_ID: מזהה הפרויקט.
    • DATA_STORE_ID: המזהה של מאגר הנתונים. המזהה יכול להכיל רק אותיות קטנות, ספרות, קווים תחתונים ומקפים.
    • DISPLAY_NAME: השם המוצג של מאגר הנתונים. יכול להיות שההודעה תוצג במסוף. Google Cloud
  2. ייבוא נתונים מ-Cloud SQL.

      curl -X POST \
      -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/documents:import" \
      -d '{
        "cloudSqlSource": {
          "projectId": "SQL_PROJECT_ID",
          "instanceId": "INSTANCE_ID",
          "databaseId": "DATABASE_ID",
          "tableId": "TABLE_ID",
          "gcsStagingDir": "STAGING_DIRECTORY"
        },
        "reconciliationMode": "RECONCILIATION_MODE",
        "autoGenerateIds": "AUTO_GENERATE_IDS",
        "idField": "ID_FIELD",
      }'
    

    מחליפים את מה שכתוב בשדות הבאים:

    • PROJECT_ID: המזהה של פרויקט Gemini Enterprise.
    • DATA_STORE_ID: המזהה של מאגר הנתונים. המזהה יכול להכיל רק אותיות קטנות, ספרות, קווים תחתונים ומקפים.
    • SQL_PROJECT_ID: מזהה הפרויקט של Cloud SQL.
    • INSTANCE_ID: המזהה של מופע Cloud SQL.
    • DATABASE_ID: המזהה של מסד הנתונים של Cloud SQL.
    • TABLE_ID: המזהה של טבלת Cloud SQL.
    • STAGING_DIRECTORY: אופציונלי. ספרייה ב-Cloud Storage – לדוגמה, gs://<your-gcs-bucket>/directory/import_errors.
    • RECONCILIATION_MODE: אופציונלי. הערכים הם FULL ו-INCREMENTAL. ברירת המחדל היא INCREMENTAL. הגדרה של INCREMENTAL גורמת לרענון מצטבר של נתונים מ-Cloud SQL למאגר הנתונים. הפעולה הזו מבצעת upsert, שמוסיפה מסמכים חדשים ומחליפה מסמכים קיימים במסמכים מעודכנים עם אותו מזהה. הגדרת FULL גורמת לשינוי בסיס מלא של המסמכים במאגר הנתונים. במילים אחרות, מסמכים חדשים ומעודכנים מתווספים למאגר הנתונים, ומסמכים שלא נמצאים ב-Cloud SQL מוסרים ממאגר הנתונים. מצב FULL שימושי אם רוצים למחוק באופן אוטומטי מסמכים שכבר לא צריך.

השלבים הבאים

  • כדי לצרף את מאגר הנתונים לאפליקציה, יוצרים אפליקציה ובוחרים את מאגר הנתונים לפי השלבים שמפורטים במאמר יצירת אפליקציה לחיפוש.

  • כדי לראות תצוגה מקדימה של תוצאות החיפוש אחרי שמגדירים את האפליקציה ואת מאגר הנתונים, אפשר לעיין במאמר בנושא תצוגה מקדימה של תוצאות החיפוש.