ייבוא וייצוא של נתונים
בדף הזה מפורטות השיטות הזמינות לייבוא נתונים אל Bigtable וממנו.
ייבוא נתונים ל-Bigtable
אפשר לייבא נתונים ל-Bigtable באחת מהדרכים הבאות:
- BigQuery
- כדי לייבא נתונים מ-BigQuery ל-Bigtable, אפשר לעיין במאמר ייצוא נתונים ל-Bigtable (תהליך ETL הפוך) במסמכי BigQuery.
- אפשר להריץ שאילתות רציפות על הנתונים ב-BigQuery ולייצא את התוצאות ל-Bigtable בזמן אמת באמצעות ETL הפוך. מידע נוסף זמין במאמר מבוא לשאילתות רציפות במאמרי העזרה של BigQuery.
- Pub/Sub
- אפשר להזרים הודעות מ-Pub/Sub ישירות לטבלת Bigtable באמצעות מינויים ל-Pub/Sub Bigtable (גרסת Preview). בשיטה הזו אתם יכולים לכתוב הודעות בסטרימינג ל-Bigtable בלי להשתמש במנוי נפרד כמו Dataflow.
העברה או העתקה של נתונים באמצעות תבנית
אתם יכולים להשתמש בתבניות Dataflow הבאות כדי להעביר או להעתיק נתונים בין Bigtable לבין מקורות או יעדים אחרים.
BigQuery
התבנית הבאה של Dataflow מאפשרת לייצא נתונים מ-BigQuery ל-Bigtable.
Apache Cassandra ל-Bigtable
התבנית הבאה של Dataflow מאפשרת לייצא נתונים מ-Apache Cassandra ל-Bigtable.
קובצי Avro
התבניות הבאות של Dataflow מאפשרות לייצא נתונים מ-Bigtable כקובצי Avro, ואז לייבא את הנתונים בחזרה ל-Bigtable. אפשר להריץ את התבניות באמצעות Google Cloud CLI או מסוף Google Cloud . קוד המקור נמצא ב-GitHub.
קבצי Parquet
התבניות הבאות של Dataflow מאפשרות לייצא נתונים מ-Bigtable כקובצי Parquet, ואז לייבא את הנתונים בחזרה ל-Bigtable. אפשר להריץ את התבניות באמצעות ה-CLI של gcloud או מסוף Google Cloud . קוד המקור נמצא ב-GitHub.
SequenceFiles
התבניות הבאות של Dataflow מאפשרות לייצא נתונים מ-Bigtable כ-SequenceFiles ואז לייבא את הנתונים בחזרה ל-Bigtable. אפשר להריץ את התבניות באמצעות Google Cloud CLI או מסוף Google Cloud .
ייבוא מהדף Tables
אפשר להריץ רבות משיטות הייבוא שמתוארות בדף הזה באמצעות מסוףGoogle Cloud . אפשר לייבא את סוגי הנתונים הבאים מהדף Tables:
- נתונים בפורמט CSV
- נתונים ב-BigQuery
- נתונים שאפשר לייבא באמצעות הכלי ליצירת משימות Dataflow. היא כוללת את סוגי הנתונים הבאים:
- הודעות Pub/Sub
- נתונים בטבלה ב-BigQuery
- קובצי CSV, קובצי JSON וקובצי טקסט ב-Cloud Storage
- נתוני טבלה של PostgreSQL, MySQL, Oracle ו-SQL Server
נתונים שאפשר לייבא באמצעות תבנית Dataflow. הנתונים האלה כוללים, בין היתר:
- קובצי Avro
- טבלאות ומרחבי מפתח ב-Cassandra
- קבצי Parquet
- קבצים מסוג SequenceFile
המסוף
פותחים את רשימת מופעי Bigtable במסוף Google Cloud .
לוחצים על המופע שמכיל את הטבלה שרוצים לייבא.
בחלונית הימנית לוחצים על טבלאות.
בדף Tables מוצגת רשימה של טבלאות במופע.
לצד שם הטבלה שאליה רוצים לייבא נתונים, לוחצים על התפריט פעולות בטבלה.
לוחצים על ייבוא נתונים ובוחרים את סוג הנתונים שרוצים לייבא:
- אם בוחרים באפשרות CSV, ייפתח חלון הטרמינל של
cbtCLI. מידע נוסף זמין בקטע ייבוא נתוני CSV במסמך הזה. - אם בוחרים באפשרות BigQuery, BigQuery Studio נפתח. ממלאים את השאילתה של reverse ETL ומפעילים פתרונות חכמים.
- אם בוחרים באפשרות 'כלי ליצירת משימות Dataflow', הכלי ליצירת משימות ייפתח. מידע נוסף זמין במאמר סקירה כללית של ממשק המשתמש של כלי בניית המשימות.
- אם בוחרים באפשרות Avro, Parquet, SequenceFile או Cassandra, מוצגת ב-Console תבנית Dataflow שהושלמה באופן חלקי. ממלאים את תבנית העבודה ולוחצים על הפעלת העבודה.
- אם בוחרים באפשרות CSV, ייפתח חלון הטרמינל של
ייצוא מדף הטבלאות
אפשר להשתמש במסוףGoogle Cloud כדי להפעיל חלק משיטות הייצוא שמתוארות בדף הזה. אפשר לייצא את סוגי הנתונים הבאים מהדף טבלאות:
- קובצי Avro
- קבצי Parquet
קבצים מסוג SequenceFile
המסוף
פותחים את רשימת מופעי Bigtable במסוף Google Cloud .
לוחצים על המופע שמכיל את הטבלה שרוצים לייצא.
בחלונית הימנית לוחצים על טבלאות.
בדף Tables מוצגת רשימה של טבלאות במופע.
לצד שם הטבלה, לוחצים על התפריט פעולות בטבלה.
לוחצים על ייצוא נתונים ובוחרים את סוג הקובץ שרוצים לייצא.
בתבנית Dataflow מוצגים נתונים שהושלמו באופן חלקי.
ממלאים את תבנית העבודה ולוחצים על הפעלת העבודה.
ייבוא נתוני CSV
אפשר לייבא נתונים מקובץ CSV לטבלת Bigtable באמצעות cbtCLI. כדי לעשות זאת, צריך לוודא שלסביבה שלכם, כמו Cloud Shell, יש גישה לקובץ ה-CSV. אפשר להעביר את קובץ ה-CSV ל-Cloud Shell באחת מהדרכים הבאות:
העלאת קובץ CSV מקומי:
- ב-Cloud Shell, לוחצים על התפריט More ובוחרים באפשרות Upload.
- בוחרים את קובץ ה-CSV מהמחשב המקומי.
- אחרי שמעלים את הקובץ, מפנים אליו באמצעות השם שלו בפקודה של
cbtCLI.
העתקת קובץ CSV מ-Cloud Storage:
ב-cbt CLI אין תמיכה ישירה בייבוא מקטגוריית Cloud Storage. קודם צריך להעתיק את קובץ ה-CSV מ-Cloud Storage לסביבת Cloud Shell. מידע נוסף מופיע במאמר העלאת אובייקט לקטגוריה.
אחרי שקובץ ה-CSV זמין בסביבה שלכם, משתמשים בפקודה
cbt CLI
כדי לייבא את הנתונים. דוגמה לפקודה מופיעה במאמר בנושא כתיבה של הרבה שורות בבת אחת על סמך קובץ הקלט.
המאמרים הבאים
- יצירה, העתקה או שחזור מגיבוי של Bigtable.
- לגלות מושגים שקשורים לעיצוב סכימה של Bigtable.
- העברה ל-Bigtable.