BigtableSource

מקור Cloud Bigtable לייבוא נתונים.

ייצוג ב-JSON
{
  "projectId": string,
  "instanceId": string,
  "tableId": string,
  "bigtableOptions": {
    object (BigtableOptions)
  }
}
שדות
projectId

string

מזהה הפרויקט שמכיל את מקור הנתונים של Bigtable. האורך המקסימלי הוא 128 תווים. אם לא מציינים את מזהה הפרויקט, המערכת משתמשת במזהה הפרויקט של בקשת האב.

instanceId

string

חובה. מספר המכונה של Cloud Bigtable שצריך לייבא.

tableId

string

חובה. מזהה הטבלה ב-Cloud Bigtable שרוצים לייבא.

bigtableOptions

object (BigtableOptions)

חובה. אפשרויות Bigtable שמכילות מידע שנדרש כשמנתחים נתונים למבנים מוקלדים. לדוגמה, הערות לגבי סוג העמודה.

BigtableOptions

אובייקט האפשרויות של Bigtable שמכיל מידע לתמיכה בייבוא.

ייצוג ב-JSON
{
  "keyFieldName": string,
  "families": {
    string: {
      object (BigtableColumnFamily)
    },
    ...
  }
}
שדות
keyFieldName

string

שם השדה שמשמש לשמירת ערך מפתח השורה במסמך. השם צריך להתאים לתבנית [a-zA-Z0-9][a-zA-Z0-9-_]*.

families

map (key: string, value: object (BigtableColumnFamily))

המיפוי משמות משפחה לאובייקט שמכיל מידע ברמת משפחות העמודות עבור משפחת העמודות הנתונה. אם קבוצה משפחתית לא מופיעה במפה הזו, המערכת תתעלם ממנה.

BigtableColumnFamily

קבוצת העמודות של Bigtable.

ייצוג ב-JSON
{
  "fieldName": string,
  "encoding": enum (Encoding),
  "type": enum (Type),
  "columns": [
    {
      object (BigtableColumn)
    }
  ]
}
שדות
fieldName

string

שם השדה שבו רוצים להשתמש עבור קבוצת העמודות הזו במסמך. השם צריך להתאים לתבנית [a-zA-Z0-9][a-zA-Z0-9-_]*. אם לא מוגדר, המערכת מנסה לנתח אותו משם המשפחה. עם זאת, בגלל דפוסי שמות שונים, יכול להיות שיהיו התנגשויות בשמות השדות, והתנהגות הניתוח לא תהיה מוגדרת.

encoding

enum (Encoding)

מצב הקידוד של הערכים כשהסוג הוא לא STRING. ערכי הקידוד הקבילים הם:

  • TEXT: מציין שהערכים הם מחרוזות טקסט אלפאנומריות.
  • BINARY: מציין שהערכים מקודדים באמצעות משפחת הפונקציות HBase Bytes.toBytes. אפשר לבטל את ההגדרה הזו עבור עמודה ספציפית על ידי ציון העמודה ב-columns והגדרת קידוד עבורה.
type

enum (Type)

סוג הערכים במשפחת העמודות הזו. אם ערך הקידוד מוגדר ל-BINARY, הערכים צריכים להיות מקודדים באמצעות הפונקציה HBase Bytes.toBytes.

columns[]

object (BigtableColumn)

רשימת האובייקטים שמכילה מידע ברמת העמודה לכל עמודה. אם עמודה מסוימת לא מופיעה ברשימה הזו, המערכת תתעלם ממנה.

קידוד

מצב הקידוד של עמודה או קבוצת עמודות ב-Bigtable.

טיפוסים בני מנייה (enum)
ENCODING_UNSPECIFIED לא צוין קידוד.
TEXT קידוד טקסט.
BINARY קידוד בינארי.

סוג

סוג הערכים בעמודה או במשפחת עמודות ב-Bigtable. אם ערך הקידוד מוגדר ל-BINARY, המערכת מצפה שהערכים יקודדו באמצעות הפונקציה HBase Bytes.toBytes.

טיפוסים בני מנייה (enum)
TYPE_UNSPECIFIED הסוג לא צוין.
STRING סוג המחרוזת.
NUMBER סוג מספרי.
INTEGER סוג Integer.
VAR_INTEGER סוג מספר שלם באורך משתנה.
BIG_NUMERIC סוג BigDecimal.
BOOLEAN סוג בוליאני.
JSON סוג JSON.

BigtableColumn

העמודה ב-Bigtable.

ייצוג ב-JSON
{
  "qualifier": string,
  "fieldName": string,
  "encoding": enum (Encoding),
  "type": enum (Type)
}
שדות
qualifier

string (bytes format)

חובה. מגדיר העמודה. אם אי אפשר לפענח את המחרוזת באמצעות utf-8, צריך להשתמש במחרוזת בקידוד base-64.

מחרוזת בקידוד Base64.

fieldName

string

שם השדה שבו רוצים להשתמש בעמודה הזו במסמך. השם צריך להתאים לתבנית [a-zA-Z0-9][a-zA-Z0-9-_]*. אם לא מוגדר, המערכת מנתחת את הבייטים של התנאי כמיטב יכולתה. עם זאת, בגלל דפוסי שמות שונים, יכול להיות שיהיו התנגשויות בשמות השדות, והתנהגות הניתוח לא תהיה מוגדרת.

encoding

enum (Encoding)

מצב הקידוד של הערכים כשהסוג הוא לא STRING. ערכי הקידוד הקבילים הם:

  • TEXT: מציין שהערכים הם מחרוזות טקסט אלפאנומריות.
  • BINARY: מציין שהערכים מקודדים באמצעות משפחת הפונקציות HBase Bytes.toBytes. אפשר לבטל את ההגדרה הזו עבור עמודה ספציפית על ידי ציון העמודה ב-columns והגדרת קידוד עבורה.
type

enum (Type)

סוג הערכים במשפחת העמודות הזו. אם ערך הקידוד מוגדר ל-BINARY, הערכים צריכים להיות מקודדים באמצעות הפונקציה HBase Bytes.toBytes.