כדי להטמיע נתונים מ-Cloud SQL, צריך לבצע את השלבים הבאים כדי להגדיר גישה ל-Cloud SQL, ליצור מאגר נתונים ולהטמיע נתונים.
הגדרת גישה לקטגוריית אחסון זמני למכונות Cloud SQL
כשמבצעים המרה של נתונים מ-Cloud SQL, הנתונים עוברים קודם לקטגוריה של Cloud Storage. כדי לתת למופע Cloud SQL גישה לקטגוריות של Cloud Storage, מבצעים את השלבים הבאים.
נכנסים לדף SQL במסוף Google Cloud .
SQL
לוחצים על המכונה של Cloud SQL שממנה רוצים לייבא.
מעתיקים את המזהה של חשבון השירות של המופע, שנראה כמו כתובת אימייל – לדוגמה,
p9876-abcd33f@gcp-sa-cloud-sql.iam.gserviceaccount.com.עוברים לדף IAM & Admin.
לוחצים על הענקת גישה.
בשדה New principals (חשבונות משתמשים חדשים), מזינים את המזהה של חשבון השירות של המופע ובוחרים בתפקיד Cloud Storage > Storage Admin.
לוחצים על Save.
השלב הבא:
אם הנתונים של Cloud SQL נמצאים באותו פרויקט כמו Gemini Enterprise: עוברים אל ייבוא נתונים מ-Cloud SQL.
אם הנתונים שלכם ב-Cloud SQL נמצאים בפרויקט אחר ולא בפרויקט של Gemini Enterprise: עוברים אל הגדרה של גישה ל-Cloud SQL מפרויקט אחר.
הגדרת גישה ל-Cloud SQL מפרויקט אחר
כדי להעניק ל-Gemini Enterprise גישה לנתוני Cloud SQL שנמצאים בפרויקט אחר, פועלים לפי השלבים הבאים:
מחליפים את המשתנה
PROJECT_NUMBERבמספר הפרויקט של Gemini Enterprise, ואז מעתיקים את התוכן של בלוק הקוד. זה המזהה של חשבון השירות שלך ב-Gemini Enterprise:service-PROJECT_NUMBER@gcp-sa-discoveryengine.iam.gserviceaccount.comעוברים לדף IAM & Admin.
עוברים לפרויקט Cloud SQL בדף IAM & Admin ולוחצים על Grant Access.
בשדה New principals (חשבונות משתמשים חדשים), מזינים את המזהה של חשבון השירות ובוחרים בתפקיד Cloud SQL > Cloud SQL Viewer.
לוחצים על Save.
לאחר מכן, עוברים אל ייבוא נתונים מ-Cloud SQL.
ייבוא נתונים מ-Cloud SQL
המסוף
כדי להשתמש במסוף להעברת נתונים מ-Cloud SQL, פועלים לפי השלבים הבאים:
נכנסים לדף Gemini Enterprise במסוף Google Cloud .
עוברים לדף מאגרי נתונים.
לוחצים על יצירת מאגר נתונים.
בדף Select a data source, בוחרים באפשרות Cloud SQL.
מציינים את מזהה הפרויקט, מזהה המכונה, מזהה מסד הנתונים ומזהה הטבלה של הנתונים שרוצים לייבא.
לוחצים על Browse, בוחרים מיקום ביניים ב-Cloud Storage לייצוא הנתונים ולוחצים על Select. אפשר גם להזין את המיקום ישירות בשדה
gs://.בוחרים אם להפעיל ייצוא בלי שרת (serverless). ייצוא בלי שרת (serverless) כרוך בעלות נוספת. מידע על ייצוא בלי שרת (serverless) מופיע במאמר מזעור ההשפעה של הייצוא על הביצועים במאמרי העזרה של Cloud SQL.
לוחצים על Continue.
בוחרים אזור למאגר הנתונים.
מזינים שם למאגר הנתונים.
לוחצים על יצירה.
כדי לבדוק את סטטוס ההטמעה, עוברים לדף מאגרי נתונים ולוחצים על השם של מאגר הנתונים כדי לראות את הפרטים שלו בדף נתונים. ההטמעה מסתיימת כשהסטטוס בעמודה סטטוס בכרטיסייה פעילות משתנה מבתהליך להייבוא הושלם.
בהתאם לגודל הנתונים, תהליך ההטמעה יכול להימשך כמה דקות או כמה שעות.
REST
כדי ליצור מאגר נתונים ולהטמיע נתונים מ-Cloud SQL באמצעות שורת הפקודה, פועלים לפי השלבים הבאים:
יוצרים מאגר נתונים.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -H "X-Goog-User-Project: PROJECT_ID" \ "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores?dataStoreId=DATA_STORE_ID" \ -d '{ "displayName": "DISPLAY_NAME", "industryVertical": "GENERIC", "solutionTypes": ["SOLUTION_TYPE_SEARCH"], }'מחליפים את מה שכתוב בשדות הבאים:
-
PROJECT_ID: מזהה הפרויקט. -
DATA_STORE_ID: המזהה של מאגר הנתונים. המזהה יכול להכיל רק אותיות קטנות, ספרות, קווים תחתונים ומקפים. -
DISPLAY_NAME: השם המוצג של מאגר הנתונים. יכול להיות שההודעה תוצג במסוף. Google Cloud
-
ייבוא נתונים מ-Cloud SQL.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/documents:import" \ -d '{ "cloudSqlSource": { "projectId": "SQL_PROJECT_ID", "instanceId": "INSTANCE_ID", "databaseId": "DATABASE_ID", "tableId": "TABLE_ID", "gcsStagingDir": "STAGING_DIRECTORY" }, "reconciliationMode": "RECONCILIATION_MODE", "autoGenerateIds": "AUTO_GENERATE_IDS", "idField": "ID_FIELD", }'מחליפים את מה שכתוב בשדות הבאים:
-
PROJECT_ID: המזהה של פרויקט Gemini Enterprise. -
DATA_STORE_ID: המזהה של מאגר הנתונים. המזהה יכול להכיל רק אותיות קטנות, ספרות, קווים תחתונים ומקפים. -
SQL_PROJECT_ID: מזהה הפרויקט של Cloud SQL. -
INSTANCE_ID: המזהה של מופע Cloud SQL. -
DATABASE_ID: המזהה של מסד הנתונים של Cloud SQL. -
TABLE_ID: המזהה של טבלת Cloud SQL. -
STAGING_DIRECTORY: אופציונלי. ספרייה ב-Cloud Storage – לדוגמה,gs://<your-gcs-bucket>/directory/import_errors. -
RECONCILIATION_MODE: אופציונלי. הערכים הםFULLו-INCREMENTAL. ברירת המחדל היאINCREMENTAL. הגדרה שלINCREMENTALגורמת לרענון מצטבר של נתונים מ-Cloud SQL למאגר הנתונים. הפעולה הזו מבצעת upsert, שמוסיפה מסמכים חדשים ומחליפה מסמכים קיימים במסמכים מעודכנים עם אותו מזהה. הגדרתFULLגורמת לשינוי בסיס מלא של המסמכים במאגר הנתונים. במילים אחרות, מסמכים חדשים ומעודכנים מתווספים למאגר הנתונים, ומסמכים שלא נמצאים ב-Cloud SQL מוסרים ממאגר הנתונים. מצבFULLשימושי אם רוצים למחוק באופן אוטומטי מסמכים שכבר לא צריך.
-
השלבים הבאים
כדי לצרף את מאגר הנתונים לאפליקציה, יוצרים אפליקציה ובוחרים את מאגר הנתונים לפי השלבים שמפורטים במאמר יצירת אפליקציה לחיפוש.
כדי לראות תצוגה מקדימה של תוצאות החיפוש אחרי שמגדירים את האפליקציה ואת מאגר הנתונים, אפשר לעיין במאמר בנושא תצוגה מקדימה של תוצאות החיפוש.