סוגי נתונים נתמכים של מאגר אחסון לפרוטוקולים ו-Arrow
במאמר הזה מפורטים סוגי הנתונים של מאגר אחסון לפרוטוקולים ו-Arrow שנתמכים לכל סוג נתונים תואם ב-BigQuery. לפני שקוראים את המסמך הזה, כדאי לקרוא את הסקירה הכללית של BigQuery Storage Write API.
סוגי נתונים נתמכים של מאגר אחסון לפרוטוקולים
בטבלה הבאה מוצגים סוגי הנתונים הנתמכים ב-Protocol Buffers והפורמט התואם של הקלט ב-BigQuery:
| סוג נתונים ב-BigQuery | סוגים נתמכים של מאגר אחסון לפרוטוקולים |
|---|---|
BOOL |
bool, int32, int64,
uint32, uint64, google.protobuf.BoolValue |
BYTES |
bytes, string, google.protobuf.BytesValue |
DATE |
int32 (מומלץ), int64, string
הערך הוא מספר הימים מאז ראשית זמן יוניקס (1970-01-01). הטווח התקין הוא |
DATETIME, TIME |
string
|
int64
משתמשים ב-
|
|
FLOAT |
double, float, google.protobuf.DoubleValue, google.protobuf.FloatValue |
GEOGRAPHY |
string
הערך הוא גיאומטריה בפורמט WKT או GeoJson. |
INTEGER |
int32, int64, uint32,
enum, google.protobuf.Int32Value,
google.protobuf.Int64Value,
google.protobuf.UInt32Value |
JSON |
string |
NUMERIC, BIGNUMERIC |
int32, int64, uint32,
uint64, double, float,
string |
bytes, google.protobuf.BytesValueמשתמשים במחלקה
|
|
STRING |
string, enum, google.protobuf.StringValue |
TIME |
string
הערך חייב להיות |
TIMESTAMP |
int64 (מומלץ), int32,
uint32, google.protobuf.Timestamp
הערך מצוין במיקרו-שניות מאז ראשית זמן יוניקס (1970-01-01). |
INTERVAL |
string, google.protobuf.Duration
ערך המחרוזת חייב להיות |
RANGE<T> |
message
סוג הודעה מקונן ב-proto עם שני שדות, |
REPEATED FIELD |
array
סוג מערך ב-proto תואם לשדה חוזר ב-BigQuery. |
RECORD |
message
סוג הודעה מקונן ב-proto תואם לשדה רשומה ב-BigQuery. |
סוגי נתונים נתמכים של Apache Arrow
בטבלה הבאה מוצגים סוגי הנתונים הנתמכים ב-Apache Arrow ופורמט הקלט התואם ב-BigQuery.
| סוג נתונים ב-BigQuery | סוגים נתמכים של Apache Arrow | פרמטרים נתמכים של סוגים |
|---|---|---|
BOOL |
Boolean |
|
BYTES |
Binary |
|
DATE |
Date |
יחידה = יום |
String, int32 |
||
DATETIME |
Timestamp |
unit = MICROSECONDS
אזור הזמן ריק |
FLOAT |
FloatingPoint |
Precision in {SINGLE, DOUBLE} |
GEOGRAPHY |
Utf8
הערך הוא גיאומטריה בפורמט WKT או GeoJson. |
|
INTEGER |
int |
bitWidth in {8, 16, 32, 64}
is_signed = false |
JSON |
Utf8 |
|
NUMERIC |
Decimal128 |
אפשר לספק ערך מספרי עם כל רמת דיוק או קנה מידה שקטנים מ הטווח הנתמך ב-BigQuery. |
BIGNUMERIC |
Decimal256 |
אפשר לספק ערך BIGNUMERIC עם דיוק או קנה מידה כלשהו שקטן מ הטווח הנתמך ב-BigQuery. |
STRING |
Utf8 |
|
TIMESTAMP |
Timestamp |
unit= MICROSECONDS
timezone = UTC |
INTERVAL |
Interval |
יחידה ב-{YEAR_MONTH, DAY_TIME, MONTH_DAY_NANO} |
Utf8 |
||
RANGE<T> |
Struct
ל-Struct של Arrow צריכים להיות שני שדות משנה בשמות בעמודה בעמודה בשביל ערך של |
|
REPEATED FIELD |
List |
הערך של NULL צריך להיות רשימה ריקה. |
RECORD |
Struct |