פקודות
bq export
מייצאים טבלה מ-BigQuery.
תקציר
bq export [options]
דגלים וארגומנטים
כדי להריץ את הפקודה הזו, צריך לספק שאילתת SQL (ראו את האפשרויות --sql ו-query_dsn) וקובץ copybook (ראו את האפשרות cobDsn). אפשר להריץ את הפקודה הזו במצב מקומי, במצב מרוחק ובמצב עצמאי. לגבי מצב מרחוק, אפשר לעיין בדגלים --bucket, --remoteHost, --remotePort ו---remoteUrl.
הפקודה bq export משתמשת בדגלים ובארגומנטים הבאים:
--project_id=ID- מציינים את הפרויקט שבו רוצים להשתמש כדי להפעיל את הפקודה הזו.
--allow_large_results- (אופציונלי) שימוש בגדלים גדולים של טבלאות יעד לשאילתות SQL מדור קודם.
--batch- (אופציונלי) מריצים את השאילתה במצב אצווה.
--bucket=BUCKET- (אופציונלי) מציינים מיקום ב-Cloud Storage לכתיבת הפלט של הפקודה. אם הערך של
run_modeהואgcsoutput, צריך להגדיר את הפרמטר הזה ל-URI של Cloud Storage בפורמטgs://example-bucket/example-prefix/example-filename.orc. אחרת, קובצי הפלט נכתבים בנתיב היעדgs://BUCKET/EXPORT/. הארגומנט הזה נדרש במצב מרוחק. --cobDsn=DSN- (אופציונלי) מציינים את ה-DSN של ה-copybook שרוצים להשתמש בו. אם לא מציינים ערך, Mainframe Connector קורא מ-DD COPYBOOK.
--dataset_id=ID- (אופציונלי) מציינים את מערך הנתונים שמוגדר כברירת מחדל לשימוש בפקודה. אפשר להגדיר את הערך ל-[PROJECT_ID]:[DATASET] או ל-[DATASET]. אם [PROJECT_ID] לא מופיע, המערכת משתמשת בפרויקט ברירת המחדל.
--destination_table=TABLE- (אופציונלי) מציינים את טבלת היעד שאליה רוצים לכתוב את תוצאות השאילתה.
--dry_run- (אופציונלי) מאמתים את השאילתה בלי להריץ אותה.
--encoding=ENCODING- (אופציונלי) מציינים את מערכת התווים שבה רוצים להשתמש לקידוד ולפענוח של שדות תווים. אם מציינים ערך, הוא מבטל את ברירת המחדל שמוגדרת על ידי משתנה הסביבה
ENCODING. --exporter_thread_count=COUNT- (אופציונלי) מגדירים את מספר השרשורים של הכלי לייצוא. ערך ברירת המחדל הוא 4.
-
--helpאו-h - הצגת טקסט העזרה הזה.
--keepAliveTimeInSeconds=SECONDS- (Optional) Specify the keep alive timeout in seconds for an HTTP channel. ערך ברירת המחדל הוא 480 שניות.
--location=LOCATION- (אופציונלי) מציינים אזור או מיקום במספר אזורים לביצוע הפקודה. ערך ברירת המחדל הוא US.
--max_read_queue=NUMBER
- (אופציונלי) מגדירים את הגודל המקסימלי של תור רשומות ה-Avro. ערך ברירת המחדל הוא כפול ממספר השרשורים.
--max_read_streams=NUMBER- (אופציונלי) מגדירים את המספר המקסימלי של שרשורים לקריאת נתונים. ערך ברירת המחדל הוא 4.
--maximum_bytes_billed=BYTES- (אופציונלי) מגבילים את מספר הבייטים של השאילתה שיתבצע עליהם חיוב.
--order_response- (אופציונלי) שומרים על הסדר של התגובה כפי שהיא מוחזרת מ-BigQuery.
--outDD=OUTPUT- (אופציונלי) כותבים את רשומות הפלט למערך הנתונים שצוין ב-z/OS. ערך ברירת המחדל הוא DD OUTFILE.
--parser_type=TYPE- (אופציונלי) מגדירים את מנתח ההגדרות ל-
legacy,copybookאוauto. ערך ברירת המחדל הואauto. --query_dsn=DSN
- (Optional) קריאת שאילתה ממערך הנתונים שצוין ב-z/OS. בפורמט HLQ.MEMBER או HLQ.PDS(MEMBER). אם לא מציינים ערך, Mainframe Connector קורא מ-DD QUERY.
--remoteHost=HOST- (אופציונלי) מציינים את כתובת ה-IP של המארח המרוחק. כדי להפעיל את Mainframe Connector במצב מרוחק, מגדירים את הסימון
--bucket. --remotePort=PORT- (אופציונלי) מציינים את היציאה המרוחקת. ערך ברירת המחדל הוא 51770. כדי להפעיל את Mainframe Connector במצב מרוחק, מגדירים את הסימון
--bucket. --remoteUrl=URL- (אופציונלי) מציינים את כתובת ה-URL המרוחקת. כדי להפעיל את Mainframe Connector במצב מרוחק, מגדירים את הסימון
--bucket. --run_mode=MODE- (אופציונלי) בוחרים את הטמעת הייצוא. אפשר להשתמש באחת מהאפשרויות הבאות:
-
directstorage: הקובץ הבינארי נשמר באופן מקומי (ברירת מחדל) -
gcsoutput: הקובץ הבינארי נשמר ב-Cloud Storage
-
--sql=SQL- (אופציונלי) מציינים את שאילתת ה-SQL של BigQuery להרצה.
--stats_table=TABLE- (אופציונלי) מציינים את הטבלה שאליה רוצים להוסיף את הנתונים הסטטיסטיים.
--timeOutMinutes=MINUTES- (אופציונלי) מגדירים את הזמן הקצוב לתפוגה בדקות לשיחת ה-gRPC מרחוק. ערך ברירת המחדל הוא 90 דקות.
--transcoding_buffer=BUFFER
- (אופציונלי) מגדיר את הגודל של מאגר הנתונים הזמני לקידוד מחדש לכל שרשור, במגה-בייט. ערך ברירת המחדל הוא 20.
--use_cache={true|false}- (אופציונלי) כדי לשמור במטמון את תוצאות השאילתה, מגדירים את הערך כ-true.
--use_legacy_sql- (אופציונלי) אפשר להשתמש ב-SQL מדור קודם במקום ב-SQL סטנדרטי.
bq load
טעינת נתונים לטבלה ב-BigQuery.
תקציר
bq load [options] tablespec path
דגלים וארגומנטים
הפקודה bq load משתמשת בדגלים ובארגומנטים הבאים:
- path
- מציינים רשימה מופרדת בפסיקים של מזהי URI של קובצי מקור. הפורמט הנתמך הוא
gs://bucket/path. דוגמה:gs://my-bucket/data.orc,gs://my-bucket/more-data.orc. - tablespec
- מציינים את טבלת היעד של הנתונים. הפורמט הנתמך הוא [PROJECT]:[DATASET].[TABLE]
--project_id=ID- מציינים את הפרויקט שבו רוצים להשתמש כדי להפעיל את הפקודה הזו.
--allow_jagged_rows- (אופציונלי) מאפשרים להשתמש בנתוני CSV גם אם חסרות עמודות אופציונליות בסוף.
--allow_quoted_newlines- (אופציונלי) מאפשרים מעברי שורה בתוך נתוני CSV.
--append_table- (אופציונלי) מוסיפים את הנתונים שנטענו לנתונים הקיימים בטבלת היעד.
--autodetect- (אופציונלי) מפעילים זיהוי אוטומטי של סכימה לנתוני CSV ו-JSON.
--clustering_fields=FIELDS- (אופציונלי) אם מציינים רשימה של עמודות שמופרדות באמצעות פסיקים, המערכת משתמשת בה כדי לאגד את טבלת היעד בשאילתה. חובה להשתמש בדגל הזה עם דגלי חלוקה למחיצות לפי זמן כדי ליצור טבלה מחולקת למחיצות לפי זמני כתיבת הנתונים או טבלה מחולקת למחיצות בעמודה
DATEאוTIMESTAMP. אם מציינים עמודות, הטבלה מחולקת למחיצות ואז מקובצת באמצעות העמודות שצוינו. --dataset_id=ID- (אופציונלי) מציינים את מערך הנתונים שמוגדר כברירת מחדל לשימוש בפקודה. אפשר להגדיר את הערך ל-[PROJECT_ID]:[DATASET] או ל-[DATASET]. אם [PROJECT_ID] לא מופיע, המערכת משתמשת בפרויקט ברירת המחדל.
--debug_mode={true|false}- (אופציונלי) מגדירים את רמת הרישום לניפוי באגים.
--destination_kms_key=KEY
- (אופציונלי) מפתח Cloud KMS להצפנה של נתוני טבלת היעד.
-
--encodingאו-E=ENCODING - (אופציונלי) מציינים את מערכת התווים שבה רוצים להשתמש לקידוד ולפענוח של שדות תווים. אם מציינים ערך, הוא מבטל את ברירת המחדל שמוגדרת על ידי משתנה הסביבה
ENCODING. -
--field_delimiterאו-F=FIELD - (אופציונלי) מציינים את התו שמפריד בין העמודות בנתוני ה-CSV. משתמשים ב-
\tאו ב-tabכדי להפריד בין עמודות. -
--helpאו-h - הצגת טקסט העזרה הזה.
--ignore_unknown_values=VALUES- (אופציונלי) התעלמות מערכים נוספים לא מוכרים בנתוני CSV או JSON.
--location=LOCATION- (אופציונלי) מציינים אזור או מיקום במספר אזורים לביצוע הפקודה. ערך ברירת המחדל הוא US.
--max_bad_records=RECORDS- (אופציונלי) מגדירים את המספר המקסימלי של רשומות לא תקינות שמותרות לפני שהעבודה נכשלת. מוחזרות לכל היותר חמש שגיאות מכל סוג, ללא קשר לערך של
--max_bad_records. הדגל הזה רלוונטי רק לטעינת נתונים בפורמטים CSV, JSON ו-Google Sheets. ערך ברירת המחדל הוא 0. --max_polling_interval_ms=MILLISECONDS
- (אופציונלי) זמן ההמתנה המקסימלי לעבודת BigQuery.
--null_marker=MARKER- (אופציונלי) מציינים מחרוזת בהתאמה אישית שמייצגת ערך
NULLבנתוני CSV. --projection_fields=FIELDS- (אופציונלי) אם מגדירים את
--source_formatלערךDATASTORE_BACKUP, הדגל הזה מציין את מאפייני הישות שצריך לטעון מייצוא של מאגר נתונים. מציינים את שמות הנכסים ברשימה מופרדת בפסיקים. השמות של הנכסים תלויי אותיות רישיות, והם צריכים להתייחס לנכסים ברמה העליונה. אפשר להשתמש בדגל הזה גם בייצוא של Firestore. --quote=QUOTE- (אופציונלי) מציינים תו מרכאות שיקיף את השדות בנתוני ה-CSV. אפשר לציין כל תו של בייט אחד כארגומנט. ערך ברירת המחדל הוא מירכאות כפולות ("). כדי לציין שאין תווי מירכאות, משתמשים במחרוזת ריקה.
--replace- (אופציונלי) מחליפים את הנתונים הקיימים בטבלת היעד בנתונים שנטענו.
--require_partition_filter={true|false}- (אופציונלי) כדי להגדיר מסנן מחיצה לשאילתות בטבלה שצוינה, מגדירים את הערך כ-true. הארגומנט הזה חל רק על טבלאות מחולקות למחיצות, ואם הדגל
--time_partitioning_fieldמוגדר כ-True. ערך ברירת המחדל הוא False. --schema=SCHEMA- (אופציונלי) מגדירים את הסכימה של טבלת היעד. מציינים את הערך כרשימה מופרדת בפסיקים של הגדרות עמודות, בפורמט [FIELD]:[DATA_TYPE]. דוגמה:
name:STRING,age:INTEGER,city:STRING --schema_update_option=OPTION- (אופציונלי) כשמוסיפים נתונים לטבלה (בטעינת נתונים או בשאילתה), או כשמחליפים מחיצה בטבלה, מציינים איך לעדכן את הסכימה של טבלת היעד. משתמשים באחד מהערכים הבאים:
ALLOW_FIELD_ADDITION: אפשר להוסיף שדות חדשים-
ALLOW_FIELD_RELAXATION: אפשר להרחיב את השדותREQUIREDעדNULLABLE
--skip_leading_rows=NUMBER- (אופציונלי) מציינים את מספר השורות שרוצים לדלג עליהן בתחילת קובץ המקור. ערך ברירת המחדל הוא 0.
--source_format=FORMAT- (אופציונלי) מציינים את הפורמט של נתוני המקור. אפשר להשתמש באחד מהערכים הבאים:
CSV,NEWLINE_DELIMITED_JSON,AVRO,DATASTORE_BACKUP(משתמשים בערך הזה בשביל Filestore),PARQUET,ORC. ערך ברירת המחדל הואORC. --stats_table=TABLE- (אופציונלי) מציינים את הטבלה שאליה רוצים להוסיף את הנתונים הסטטיסטיים.
--time_partitioning_expiration=SECONDS- (אופציונלי) מציינים מתי צריך למחוק מחיצה מבוססת-זמן, בשניות. מועד התפוגה הוא התאריך של המחיצה ב-UTC בתוספת הערך שצוין. אם תציינו מספר שלילי, המחיצה לפי זמן לא תפוג לעולם.
--time_partitioning_field=FIELD- (אופציונלי) מציינים את השדה שמשמש לקביעת אופן יצירת מחיצה לפי זמן. אם מופעלת חלוקה למחיצות לפי זמן בלי הערך הזה, הטבלה מחולקת למחיצות לפי זמן הטעינה.
--time_partitioning_type=TYPE- (אופציונלי) מפעילים חלוקה למחיצות לפי זמן בטבלה ומגדירים את סוג המחיצה באמצעות הערך הבא:
DAY. --use_avro_logical_types={true|false}- (אופציונלי) אם
--source_formatמוגדר ל-AVRO, צריך להגדיר את הדגל הזה כ-true כדי להמיר סוגים לוגיים לסוגים התואמים שלהם (כמוTIMESTAMP) במקום להשתמש רק בסוגים הגולמיים שלהם (כמוINTEGER). ערך ברירת המחדל הוא false.
bq mk
יוצרים משאבים ב-BigQuery, כמו טבלאות מובנות או טבלאות חיצוניות, שצריך להגדיר עבורם חלוקה למחיצות ואשכולות. אפשר גם להשתמש בפקודה bq mk כדי ליצור טבלה ב-BigQuery ישירות מניתוח של קובצי COBOL באמצעות הדגל --schema_from_copybook.
תקציר
bq mk [options]
דגלים וארגומנטים
הפקודה bq mk משתמשת בדגלים ובארגומנטים הבאים:
--project_id=ID- מציינים את הפרויקט שבו רוצים להשתמש כדי להפעיל את הפקודה הזו.
--tablespec=TABLE- מציינים את טבלת היעד של הנתונים. הפורמט הנתמך הוא [PROJECT]:[DATASET].[TABLE].
--clustering_fields=FIELDS- (אופציונלי) מציינים רשימה מופרדת בפסיקים של עד ארבעה שמות עמודות שמציינים את השדות שבהם יש להשתמש לאשכולות בטבלה.
--dataset_id=ID- (אופציונלי) מציינים את מערך הנתונים שמוגדר כברירת מחדל לשימוש בפקודה. אפשר להגדיר את הערך ל-[PROJECT_ID]:[DATASET] או ל-[DATASET]. אם [PROJECT_ID] לא מופיע, המערכת משתמשת בפרויקט ברירת המחדל.
--description=DESCRIPTION- (אופציונלי) מספקים תיאור למערך הנתונים או לטבלה.
--dry_run- (אופציונלי) מדפיסים את הצהרת שפת הגדרת הנתונים (DDL) של הטבלה.
--encoding=ENCODING- (אופציונלי) מציינים את מערכת התווים שבה רוצים להשתמש לקידוד ולפענוח של שדות תווים. אם מציינים ערך, הוא מבטל את ברירת המחדל שמוגדרת על ידי משתנה הסביבה
ENCODING. --expiration=EXPIRATION- (אופציונלי) מציינים את משך החיים של הטבלה. אם לא מציינים ערך, BigQuery יוצר את הטבלה עם משך החיים שמוגדר כברירת מחדל למערך הנתונים, או שהתוקף של הטבלה לא פג.
-
--external_table_definitionאו-e=TABLE - (אופציונלי) מציינים שם והגדרת סכימה כדי ליצור טבלה חיצונית. דוגמה:
ORC=gs://bucket/table_part1.orc/,gs://bucket/table_part2.orc/. -
--helpאו-h - הצגת טקסט העזרה הזה.
--location=LOCATION- (אופציונלי) מציינים אזור או מיקום במספר אזורים לביצוע הפקודה. ערך ברירת המחדל הוא US.
--parser_type=TYPE- (אופציונלי) מגדירים את מנתח ההגדרות ל-
legacy,copybookאוauto. ערך ברירת המחדל הואauto. --require_partition_filter={true|false}- (אופציונלי) כדי להגדיר מסנן מחיצה לשאילתות בטבלה שצוינה, מגדירים את הערך כ-true. הארגומנט הזה חל רק על טבלאות מחולקות למחיצות, ואם הדגל
--time_partitioning_fieldמוגדר כ-True. ערך ברירת המחדל הוא True. --schema=SCHEMA
- (אופציונלי) מציינים את הנתיב לקובץ סכימת JSON מקומי או רשימה מופרדת בפסיקים של הגדרות עמודות בפורמט FIELD:DATA_TYPE, FIELD:DATA_TYPE וכן הלאה.
--schema_from_copybook=SCHEMA- (אופציונלי) יוצרים את הסכימה מ-copybook.
-
--tableאו-t=TABLE - (אופציונלי) יוצרים טבלה.
--time_partitioning_expiration=SECONDS- (אופציונלי) מציינים מתי צריך למחוק מחיצה מבוססת-זמן, בשניות. מועד התפוגה הוא התאריך של המחיצה ב-UTC בתוספת הערך שצוין. אם תציינו מספר שלילי, המחיצה לפי זמן לא תפוג לעולם.
--time_partitioning_field=FIELD- (אופציונלי) מציינים את השדה שמשמש לקביעת אופן יצירת מחיצה לפי זמן. אם מופעלת חלוקה למחיצות לפי זמן בלי הערך הזה, הטבלה מחולקת למחיצות לפי זמן הטעינה.
--view- (אופציונלי) יוצרים תצוגה מפורטת.
bq query
מריצים שאילתה ב-BigQuery.
תקציר
bq query [options]
דגלים וארגומנטים
אפשר להריץ את הפקודה הזו במצב מקומי ובמצב מרחוק. לגבי מצב הפעלה מרחוק, ראו את הדגלים --remoteHost, --remotePort ו---remoteUrl, ואת משתנה הסביבה BQ_QUERY_REMOTE_EXECUTION.
הפקודה bq query משתמשת בדגלים ובארגומנטים הבאים:
--project_id=ID- מציינים את הפרויקט שבו רוצים להשתמש כדי להפעיל את הפקודה הזו.
--allow_large_results- (אופציונלי) שימוש בגדלים גדולים של טבלאות יעד לשאילתות SQL מדור קודם.
--append_table- (אופציונלי) מוסיפים את הנתונים שנטענו לנתונים הקיימים בטבלת היעד.
--batch- (אופציונלי) מריצים את השאילתה במצב אצווה.
--clustering_fields=FIELDS
- (אופציונלי) מציינים רשימה מופרדת בפסיקים של עד ארבעה שמות עמודות שמציינים את השדות שבהם יש להשתמש לצורך אשכול של הטבלה. אם מציינים את הערך הזה עם חלוקה למחיצות, הטבלה מחולקת למחיצות ואז כל מחיצה מקובצת באמצעות העמודות שסופקו.
--create_if_needed- (אופציונלי) יוצרים טבלת יעד אם היא לא קיימת.
--dataset_id=ID- (אופציונלי) מציינים את מערך הנתונים שמוגדר כברירת מחדל לשימוש בפקודה. אפשר להגדיר את הערך ל-[PROJECT_ID]:[DATASET] או ל-[DATASET]. אם [PROJECT_ID] לא מופיע, המערכת משתמשת בפרויקט ברירת המחדל.
--destination_table=TABLE- (אופציונלי) מציינים את טבלת היעד שאליה רוצים לכתוב את תוצאות השאילתה.
--dry_run- (אופציונלי) מאמתים את השאילתה בלי להריץ אותה.
--follow={true|false}- (אופציונלי) כדי לעקוב אחרי שלבים ספציפיים בשאילתה או אחרי הסקריפט כולו, מגדירים את הערך true. ערך ברירת המחדל הוא False.
-
--helpאו-h - הצגת טקסט העזרה הזה.
--location=LOCATION- (אופציונלי) מציינים אזור או מיקום במספר אזורים לביצוע הפקודה. ערך ברירת המחדל הוא US.
--maximum_bytes_billed=BYTES- (אופציונלי) מציינים את מגבלת הבייטים שיחויבו על השאילתה.
--parameters=PARAMETERS
- (Optional) מציינים פרמטרים של שאילתה מופרדים בפסיקים בתבנית [NAME]:[TYPE]:[VALUE]. שם ריק יוצר פרמטר מיקום. אפשר להשמיט את [TYPE] כדי להניח ערך של
STRINGבפורמט name::value או ::value. הפונקציהNULLמחזירה ערך null. --query_dsn=DSN- (אופציונלי) מציינים את ה-DSN לקריאת השאילתה, בפורמט HLQ.MEMBER או HLQ.PDS(MEMBER). אם לא מציינים את
query_dsn, נעשה שימוש ב-QUERY DD. --remoteHost=HOST- (אופציונלי) מציינים את כתובת ה-IP של המארח המרוחק. כדי להריץ את השאילתה במצב מרוחק, מגדירים את משתנה הסביבה
BQ_QUERY_REMOTE_EXECUTION. --remotePort=PORT- (אופציונלי) מציינים את היציאה המרוחקת. ערך ברירת המחדל הוא 51770. כדי להריץ את השאילתה במצב מרוחק, מגדירים את משתנה הסביבה
BQ_QUERY_REMOTE_EXECUTION. --remoteUrl=URL- (אופציונלי) מציינים את כתובת ה-URL המרוחקת. כדי להריץ את השאילתה במצב מרוחק, מגדירים את משתנה הסביבה
BQ_QUERY_REMOTE_EXECUTION. --replace- (אופציונלי) מחליפים את טבלת היעד בתוצאות השאילתה.
--report_row_limit=LIMIT- (אופציונלי) מציינים את מספר השורות המקסימלי להדפסה בדוח הביקורת. ערך ברירת המחדל הוא 30.
--require_partition_filter={true|false}- (אופציונלי) כדי להגדיר מסנן מחיצה לשאילתות בטבלה שצוינה, מגדירים את הערך כ-true. ערך ברירת המחדל הוא True.
--schema_update_option=OPTION- (אופציונלי) עדכון הסכימה של טבלת היעד כשמוסיפים נתונים. משתמשים בערכים הבאים:
-
ALLOW_FIELD_ADDITION: מאפשר להוסיף שדות חדשים. -
ALLOW_FIELD_RELAXATION: מאפשר להגדיר את השדותREQUIREDלערךNULLABLE.
-
--split_sql={true|false}- (אופציונלי) כדי לפצל סקריפט SQL של קלט לשאילתות נפרדות, מגדירים את הערך ל-true. ערך ברירת המחדל הוא True.
--stats_table=TABLE- (אופציונלי) מציינים את הטבלה שאליה רוצים להוסיף את הנתונים הסטטיסטיים.
--sync={true|false}- (אופציונלי) מריצים את הפקודה במצב סינכרוני.
--synchronous_mode={true|false}- (אופציונלי) חלופה ל-
--sync. --timeOutMinutes=MINUTES- (אופציונלי) מציינים את הזמן הקצוב לתפוגה בדקות לתגובה של משימת BigQuery. ערך ברירת המחדל הוא 240 דקות.
--time_partitioning_expiration=SECONDS- (אופציונלי) מציינים מתי צריך למחוק מחיצה מבוססת-זמן, בשניות. מועד התפוגה הוא התאריך של המחיצה ב-UTC בתוספת הערך שצוין. אם תציינו מספר שלילי, המחיצה לפי זמן לא תפוג לעולם.
--time_partitioning_field=FIELD- (אופציונלי) מציינים את השדה שמשמש לקביעת אופן יצירת מחיצה לפי זמן. אם מופעלת חלוקה למחיצות לפי זמן בלי הערך הזה, הטבלה מחולקת למחיצות לפי זמן הטעינה.
--time_partitioning_type=TYPE
- (Optional) מפעילים חלוקה למחיצות לפי זמן בטבלה ומגדירים את סוג המחיצה באמצעות אחד מהערכים הבאים:
DAY, HOUR, MONTH, YEAR. --use_cache={true|false}- (אופציונלי) כדי לשמור במטמון את תוצאות השאילתה, מגדירים את הערך כ-true. ערך ברירת המחדל הוא True.
--use_legacy_sql- (אופציונלי) אפשר להשתמש ב-SQL מדור קודם במקום ב-SQL סטנדרטי.
cloud run job cancel
ביטול של הרצה ספציפית של עבודה.
תקציר
cloud run job cancel [-h] --project=PROJECT
--region=REGION EXECUTION
דגלים וארגומנטים
הפקודה cloud run job cancel משתמשת בדגלים ובארגומנטים הבאים:
- EXECUTION
- מציינים את המזהה של הרצת משימה ב-Cloud Run.
-
--helpאו-h - (אופציונלי) הצגת הודעת העזרה הזו.
--project=PROJECT- מציינים את מזהה הפרויקט.
--region=REGION- מציינים את האזור שבו נמצא המשאב.
cloud run job execute
הפעלת משימה ספציפית.
תקציר
cloud run job execute [-h] [--async] [--tail-logs] [--wait]
[--dump-execution-id=EXECUTION-ID]
[--polling-interval=POLLINGINTERVAL]
--project=PROJECT
--region=REGION
[--task-timeout=TIMEOUT]
[--args=ARGS]...
[--update-env-vars=ENVVARS]...
JOB
דגלים וארגומנטים
הפקודה cloud run job execute משתמשת בדגלים ובארגומנטים הבאים:
- JOB
- מציינים את השם של עבודת Cloud Run להפעלה.
--args=ARGS- (אופציונלי) ארגומנטים מופרדים בפסיקים שמועברים לפקודה שמופעלת על ידי קובץ האימג' של הקונטיינר. אם מספקים ערכים, תיווצר הרצה עם ערכי הקלט.
--async- (אופציונלי) מציינים את הדגל הזה אם רוצים לחזור מיידית, בלי לחכות שהפעולה תסתיים.
-
--dump-execution-id=EXECUTION-ID : DataPath - (אופציונלי) מציינים את הקובץ שאליו ייכתב מזהה ההפעלה.
-
--helpאו-h - (אופציונלי) הצגת הודעת העזרה הזו.
--polling-interval=POLLINGINTERVAL
- (אופציונלי) מגדיר את מרווח הזמן בין בדיקות הזמינות להצגת יומנים כש-
--tail_logsמופעל. ערך ברירת המחדל הוא 60 שניות. --project=PROJECT- מציינים את מזהה הפרויקט.
--region=REGION- מציינים את האזור שבו נמצא המשאב.
--tail-logs- (אופציונלי) אם מריצים את הפקודה במצב סינכרוני על ידי ציון הדגל
--tail_logs, יומני ההתקדמות מוצגים במסך של Mainframe Connector. אם מציינים גם את הדגל--tail_logsוגם את הדגל--async, מוצגת הודעת שגיאה. Cloud Logging לא תומך ברישום ביומן בזמן אמת, ולכן הפקודה מציגה רק יומנים שכבר נרשמו ביומנים. לכן, יכול להיות שחלק מהיומנים יהיו חסרים כשמשתמשים בדגל--tail_logs. כדי לראות את יומני העבודה המלאים, משתמשים בפקודהcloud run job logאחרי שהעבודה מסתיימת. --task-timeout=TIMEOUT- (אופציונלי) מציג את הזמן המקסימלי הקיים (מועד אחרון) שבו אפשר להריץ ניסיון של משימת עבודה. אם לא מציינים ערך, המערכת משתמשת בערך ברירת המחדל של העבודה.
--update-env-vars=ENVVARS
- (Optional) רשימה של צמדי מפתח/ערך להגדרה כשינויים חריגים של משתני סביבה להרצה של משימה.
--wait- (אופציונלי) מציינים את הדגל הזה אם רוצים שהפקודה תמתין עד שההפעלה תסתיים לפני היציאה.
cloud run job log
הצגת יומנים של Cloud Run
תקציר
cloud run job log [-h] [--tail] [--log-filter=FILTER]
[--polling-interval=POLLINGINTERVAL]
--project=PROJECT
--region=REGION
[--timeout=TIMEOUT] EXECUTION-ID
דגלים וארגומנטים
הפקודה cloud run job log משתמשת בדגלים ובארגומנטים הבאים:
- EXECUTION-ID
- השם של מזהה הביצוע של משימת Cloud Run.
-
--helpאו-h - (אופציונלי) הצגת הודעת העזרה הזו.
--log-filter=FILTER- (אופציונלי) ביטוי סינון שמציין את רשומות היומן שיוחזרו.
--polling-interval=POLLINGINTERVAL
- (אופציונלי) מגדיר את מרווח הזמן בין בדיקות הזמינות להצגת יומנים כש-
--tail_logsמופעל. ערך ברירת המחדל הוא 60 שניות. --project=PROJECT- מציינים את מזהה הפרויקט.
--region=REGION- מציינים את האזור שבו נמצא המשאב.
--tail
- (אופציונלי) אם מגדירים את האפשרות הזו, מוצגים רק יומנים חדשים החל מהרגע הזה. אם לא מוגדרים ערכים, כל יומני העבודות יוצגו.
--timeout=TIMEOUT
- (אופציונלי) זמן קצוב לתפוגה, שאחריו הפקודה תצא. אם לא מוגדר, הפקודה תפסיק לפעול כשהביצוע יסתיים.
copy binary
העתקה של קבוצת נתונים בינארית מנתיב מקור לנתיב יעד.
תקציר
copy binary [-h] [--compress] [--buffer-size=BUFFERSIZE]
INPUT OUTPUT
דגלים וארגומנטים
הפקודה copy binary משתמשת בדגלים ובארגומנטים הבאים:
- INPUT : DataPath
- מציינים את נתיב הנתונים של קובץ הקלט שרוצים להעתיק.
- OUTPUT : DataPath
- מציינים את נתיב הנתונים של קובץ הפלט שרוצים להעתיק.
-
--buffer-size=BUFFERSIZE : DataSize - (אופציונלי) מציינים את גודל הקריאה של הזיכרון לכל נתח נתונים. ערך ברירת המחדל הוא 64MiB.
--compress- (אופציונלי) אם הערך הוא true, קובץ הפלט יידחס באמצעות GZIP.
-
--helpאו-h - (אופציונלי) מציגים את הודעת העזרה הזו.
copy text
מעתיקים מערך נתונים של טקסט.
תקציר
copy text [-h] [--buffer-size=BUFFERSIZE] INPUT
OUTPUT
דגלים וארגומנטים
הפקודה copy text משתמשת בדגלים ובארגומנטים הבאים:
- INPUT : DataPath
- מציינים את נתיב הנתונים של קובץ הקלט שרוצים להעתיק.
- OUTPUT : DataPath
- מציינים את נתיב הנתונים של קובץ הפלט שרוצים להעתיק ולקודד.
-
--buffer-size=BUFFERSIZE : DataSize - (אופציונלי) מציינים את גודל הקריאה של הזיכרון לכל נתח נתונים. ערך ברירת המחדל הוא 64MiB.
-
--helpאו-h - (אופציונלי) מציגים את הודעת העזרה הזו.
gsutil cp
קידוד מחדש של נתונים מהמחשב המרכזי לקטגוריה של Cloud Storage.
תקציר
gsutil cp [options] gcsUri [dest]
דגלים וארגומנטים
אפשר להשתמש בפקודה הזו למטרות שונות:
- העתקה וקידוד מחדש של קובץ מ-Mainframe או מסביבת Linux אל Cloud Storage.
- מקור:
--inDSN. אם לא מציינים את המאפיין, הוא מוגדר על ידי DD INFILE. - יעד:
gcsUri - העתקה וקידוד מחדש של קובץ ב-Cloud Storage
- מקור:
gcsUri - יעד:
--destPath - העתקת קובץ מ-Cloud Storage למחשב מרכזי.
- מקור:
gcsUri - יעד:
--destDSN - דגלים רלוונטיים:
--lrecl, --blksize, --recfm, --noseek. - העתקת קובץ מ-Cloud Storage לסביבת לינוקס.
- מקור:
gcsUri - יעד:
--destPath
--remote, --remoteHost, --remotePort ו---remoteUrl.
הפקודה gsutil cp משתמשת בדגלים ובארגומנטים הבאים:
- dest
- (אופציונלי) הנתיב המקומי או שם מקור הנתונים (DSN). דוגמאות לפורמטים:
/path/to/file, DATASET.MEMBER - gcsUri
- URI של Cloud Storage בפורמט
gs://bucket/path. יכול לייצג גם את מיקום המקור וגם את מיקום היעד, בהתאם לשימוש. --batchSize=SIZE
- (אופציונלי) מציינים את הבלוקים שבהם רוצים להשתמש לכל אצווה. ערך ברירת המחדל הוא 1,000.
--blksize=SIZE
- (אופציונלי) מציינים את גודל הבלוק של הקובץ להעתקה למחשב המרכזי. אם
blksize=0ו-recfmלא מוגדרים כ-U, המערכת המרכזית קובעת את גודל הבלוק האופטימלי לקובץ. --cobDsn=DSN- (אופציונלי) מציינים את ה-DSN של ה-copybook שרוצים להשתמש בו. אם לא מציינים ערך, Mainframe Connector קורא מ-DD COPYBOOK.
--connections=NUMBER- (אופציונלי) מציינים את מספר החיבורים שאפשר ליצור למקלט המרוחק. ערך ברירת המחדל הוא 10.
--dataset_id=ID- (אופציונלי) מציינים את מערך הנתונים שמוגדר כברירת מחדל לשימוש בפקודה. אפשר להגדיר את הערך ל-[PROJECT_ID]:[DATASET] או ל-[DATASET]. אם [PROJECT_ID] לא מופיע, המערכת משתמשת בפרויקט ברירת המחדל.
--destDSN=OUTPUT- (אופציונלי) מציינים את ה-DSN של היעד.
--destPath=OUTPUT- (אופציונלי) מציינים את נתיב היעד.
--dry_run- (אופציונלי) בודקים את הניתוח והפענוח של קובץ ה-QSAM.
--encoding=ENCODING- (אופציונלי) מציינים את מערכת התווים שבה רוצים להשתמש לקידוד ולפענוח של שדות תווים. אם מציינים ערך, הוא מבטל את ברירת המחדל שמוגדרת על ידי משתנה הסביבה
ENCODING. -
--helpאו-h - הצגת טקסט העזרה הזה.
--inDsn=DSN- (אופציונלי) מציינים את ה-DSN של קובץ הכניסה שרוצים להשתמש בו. אם לא מציינים ערך, Mainframe Connector קורא מ-DD INFILE.
--keepAliveTimeInSeconds=SECONDS- (Optional) Specify the keep alive timeout in seconds for an HTTP channel. ערך ברירת המחדל הוא 480 שניות.
--location=LOCATION- (אופציונלי) מציינים אזור או מיקום במספר אזורים לביצוע הפקודה. ערך ברירת המחדל הוא US.
--lowerCaseColumnNames- (אופציונלי) יוצרים שמות עמודות באותיות קטנות לשדות של ספר העתקה.
--lrecl=LRECL- (אופציונלי) מציינים את האורך הלוגי של הרשומה (lrecl) של הקובץ שרוצים להעתיק למחשב המרכזי.
--maxChunkSize=SIZE- (אופציונלי) מציינים את גודל החלק המקסימלי לכל אצווה. כדי לתאר את הגודל, צריך להשתמש ב-K, KiB, KB, M, MiB, MB, G, GiB, GB, T, TiB או TB. ערך ברירת המחדל הוא 128MiB.
--max_error_pct=PCT- (אופציונלי) מציינים את סף השגיאות של פענוח שורות שגורם לביטול העבודה. הערכים התקפים הם בטווח [0.0, 1.0]. ערך ברירת המחדל הוא 0.
--noseek- (אופציונלי) שיפור הביצועים של ההורדה מ-Cloud Storage למחשב המרכזי.
-
--parallelאו-m - (אופציונלי) מגדירים את מספר הכותבים בו-זמנית ל-4.
-
--parallelismאו-p=NUMBER - (אופציונלי) מציינים את מספר הכותבים בו-זמנית. ערך ברירת המחדל הוא 4.
--parser_type=TYPE- (אופציונלי) מגדירים את מנתח ההגדרות ל-
legacy,copybookאוauto. ערך ברירת המחדל הואauto. --preload_chunk_count=NUMBER- (אופציונלי) מציינים את מספר החלקים לטעינה מראש מהדיסקים בזמן שכל העובדים עסוקים. ערך ברירת המחדל הוא 2.
--project_id=ID- (אופציונלי) מציינים את הפרויקט שבו רוצים להשתמש כדי להפעיל את הפקודה הזו.
--recfm=REFCM- (אופציונלי) מציינים את recfm של הקובץ שרוצים להעתיק למחשב המרכזי. אפשר להשתמש באחד מהערכים הבאים: F, FB, V, VB, U. ערך ברירת המחדל הוא FB.
--remote- (אופציונלי) שימוש במפענח מרוחק.
--remoteHost=HOST- (אופציונלי) מציינים את כתובת ה-IP של המארח המרוחק. כדי להפעיל את Mainframe Connector במצב מרוחק, מגדירים את הסימון
--remote. --remotePort=PORT- (אופציונלי) מציינים את היציאה המרוחקת שבה רוצים להשתמש. ערך ברירת המחדל הוא 51770. כדי להפעיל את Mainframe Connector במצב מרוחק, מגדירים את הסימון
--remote. --remoteUrl=URL- (אופציונלי) מציינים את כתובת ה-URL המרוחקת. כדי להפעיל את Mainframe Connector במצב מרוחק, מגדירים את הסימון
--remote. --replace- (אופציונלי) מוחקים את היעד באופן רקורסיבי לפני ההעלאה.
--stats_table=TABLE- (אופציונלי) מציינים את הטבלה שאליה רוצים להוסיף את הנתונים הסטטיסטיים.
--tfDSN=DSN- (אופציונלי) מציינים את הטרנספורמציות מ-DSN, DATASET.MEMBER או PDS(MBR).
--tfGCS=GCS- (אופציונלי) מציינים את קובץ ההמרות מ-Cloud Storage.
--timeOutMinutes=MINUTES- (אופציונלי) מציינים את הזמן הקצוב לתפוגה בדקות לקריאת grpc מרחוק. ערך ברירת המחדל הוא 90 דקות ל-Cloud Storage ו-50 דקות למחשב מרכזי.
gsutil rm
הסרת אובייקטים מ-Cloud Storage.
תקציר
gsutil rm [-hR] URL...
דגלים וארגומנטים
הפקודה gsutil rm משתמשת בדגלים ובארגומנטים הבאים:
- URL
- מציינים את המיקום ב-Cloud Storage בפורמט
gs://bucket/prefix. -
--helpאו-h - (אופציונלי) הצגת הודעת העזרה הזו.
-
-Rאו-r - (אופציונלי) מוחקים באופן רקורסיבי את התוכן של ספריות או אובייקטים שתואמים לביטוי הנתיב. לא תקפיץ הודעת שגיאה אם הספרייה או האובייקט לא קיימים.
pubsub topics publish
מפרסמים הודעה בנושא Pub/Sub.
הפקודה הזו מאפשרת לשלוח נתוני הודעות ישירות באמצעות הדגל --data או דרך קובץ באמצעות הדגל --data-path. אפשר גם לכלול מאפיינים, מפתח הזמנה ולהחיל מאפייני הודעה. בנוסף, אפשר להחיל החלפות דינמיות של מחרוזות על תוכן ההודעה.
תקציר
pubsub topics publish [-h] [--data=DATA]
[--data-path=DATAPATH]
[--ordering-key=ORDERING-KEY]
[--attributes=NAME=VALUE[,
NAME=VALUE...]]...
[--message-property=KEY=VALUE]...
[--substitution=KEY=VALUE]...
TOPIC
דגלים וארגומנטים
הפקודה pubsub topics publish משתמשת בדגלים ובארגומנטים הבאים:
- TOPIC
- מציינים את שם הנושא בפורמט
projects/{project}/topics/{topic}. --attributes=NAME=VALUE
- (אופציונלי) מציינים רשימה מופרדת בפסיקים של מאפיינים. כל ATTRIBUTE הוא בפורמט
name=value. אפשר לציין עד 100 מאפיינים. רשימה מלאה של הנחיות לגבי מאפיינים מופיעה במאמר שימוש במאפיינים לפרסום הודעה. -
--data-path=DATAPATH : DataPath
- (אופציונלי) מציינים את הנתיב לקובץ שמכיל את נתוני ההודעה. צריך להגדיר את אחד מהדגלים
--dataאו--data-path, אבל לא את שניהם. מידע נוסף על עיצוב הודעות ומגבלות גודל מופיע במאמר פרסום הודעות בנושאים. --data=DATA- (אופציונלי) מציינים את תוכן ההודעה שרוצים לפרסם בשם הנושא שצוין. צריך להגדיר את אחד מהדגלים
--dataאו--data-path, אבל לא את שניהם. מידע נוסף על עיצוב הודעות ומגבלות גודל מופיע במאמר פרסום הודעות בנושאים. -
--helpאו-h - (אופציונלי) הצגת הודעת העזרה הזו.
--message-property=KEY=VALUE- (אופציונלי) מציינים מאפיינים להחלה על ההודעה. מפתח מאפיין תקין הוא
encoding. מפתח המאפיין הזה מציין את קידוד התווים שבו יש להשתמש עבור מחרוזת ההודעה. מחרוזת ההודעה מומרת לבייטים באמצעות הקידוד הזה לפני שהיא נשלחת לנושא Pub/Sub. רשימה של ערכי קידוד נתמכים מופיעה כאן. ערך ברירת המחדל הואUTF-8. --ordering-key=ORDERING-KEY- (אופציונלי) מציינים את המפתח למשלוח מסודר של הודעות למנויים. כל ההודעות עם אותו מפתח סדר נשלחות למנויים בסדר שבו הן מתקבלות ב-Pub/Sub.
--substitution=KEY=VALUE(אופציונלי) באמצעות
--dataאו--data-path, מציינים את צמדי מפתח/ערך שישמשו להחלפה הדינמית שתחול על נתוני ההודעה ב-Pub/Sub. Mainframe Connector סורק את נתוני ההודעות כדי למצוא פלייסהולדרים, ומחליף אותם בערכים התואמים. מגדירים את ערכי ה-placeholder בנתונים באמצעות התחביר ${KEY}, לדוגמה ${NAME}. מציינים כל החלפה כצמד מפתח/ערך בפורמטKEY=VALUE. כדי לציין כמה החלפות, חוזרים על האפשרות:--substitution key1=value1 --substitution key2=value2.לדוגמה, אם נתוני הקלט הם:
Hello, ${username}!ואתם משתמשים ב---substitution username=World, ההודעה שנשלחת ל-Pub/Sub תהיה:Hello, World!.
qsam decode
פענוח נתוני QSAM.
הפקודה הזו מפענחת רשומות מקובץ QSAM לפורמט שאתם מציינים באמצעות הארגומנט --output-format. קובץ ה-QSAM המקורי מפולח לחלקים על סמך הערך שמציינים בארגומנט --max-chunk-size. הפלט שעבר המרה נשמר בנתיב היעד כקבצים ממוינים לפי סדר מילוני.
תקציר
qsam decode [-h] [--replace] [--chunk-size=CHUNK-SIZE]
--copybook=COPYBOOK
[--max-error-percent=MAX_ERROR_PERCENT]
[--output-format=FORMAT]
[--parallelism=COUNT]
[--preload-chunk-count=PRELOAD_CHUNK_COUNT]
[--transcode-configuration=CONFIG]
[--input-parameter=KEY=VALUE]... INPUT
OUTPUT
דגלים וארגומנטים
הפקודה qsam decode משתמשת בדגלים ובארגומנטים הבאים:
- INPUT : DataPath
- מציינים את נתיב הנתונים של קובץ ה-QSAM שרוצים לפענח.
- OUTPUT : DataPath
- מציינים את נתיב הנתונים של קידומת הפלט. כל הפלט מאוחסן תחת הקידומת הזו.
-
--chunk-size=CHUNK-SIZE : DataSize - (אופציונלי) מציינים את כמות נתוני הקלט שרוצים לכלול בכל קובץ פלט. יכול להיות שגודל קובץ הפלט יהיה גדול או קטן יותר. גודל המקטע מעוגל כלפי מטה לכפולה הקרובה ביותר של אורך הרשומה הלוגית. ערך ברירת המחדל הוא 128MiB.
-
--copybook=COPYBOOK : DataPath - מציינים את נתיב הנתונים של הקובץ שמכיל את ה-copybook.
-
--helpאו-h - (אופציונלי) הצגת הודעת העזרה הזו.
--input-parameter=KEY=VALUE(אופציונלי) מציינים פרמטרים להגדרת הקלט. כל פרמטר מוגדר כ-
KEY=VALUE. אלה מפתחות פרמטר הקלט הנתמכים:-
csv-dialect: הגדרת ניתוח של קובץ CSV. הערך הואDataPathשמפנה אל קובץ הגדרות CSV. -
json-dialect: הגדרת ניתוח JSON. הערך הואDataPathשמצביע על קובץ הגדרות JSON. -
pubsub-publish-configuration: הגדרת ההודעות שנשלחות ל-Pub/Sub. הערך הואDataPathשמצביע על קובץ הגדרות של Pub/Sub. -
output-prefix: הוספת קידומת לקובצי הפלט.
-
--max-error-percent=MAX_ERROR_PERCENT(אופציונלי) מציינים את אחוז הרשומות המעובדות שיכולות להכיל שגיאות לפני שתהליך הקידוד נכשל. הערך יכול להיות בין 0.0 (ההמרה תיכשל אם יש שגיאות המרה) ל-1.0 (ההמרה לא תיכשל אם יש שגיאות המרה). ערך ברירת המחדל הוא 0.
-
--output-format=FORMAT : TranscodeFormat (אופציונלי) מציינים את הפורמט של קובץ הפלט. אם מספקים את
DataPathשל נושא Pub/Sub כערך שלOUTPUT, פורמט הפלט שמוגדר כברירת מחדל הואJSONL. לכל שארDataPaths, פורמט הפלט שמוגדר כברירת מחדל הואORC.--parallelism=COUNT(אופציונלי) מציינים את מספר השרשורים לעיבוד. הערך צריך להיות שווה למספר ליבות המעבד הזמינות או קטן ממנו. ערך ברירת המחדל הוא 1.
--preload-chunk-count=PRELOAD_CHUNK_COUNT(אופציונלי) מציינים את מספר חלקי הנתונים שייטענו מראש כשכל השרשורים פועלים. ערך ברירת המחדל הוא 1.
--replace(אופציונלי) אם מציינים נתיב פלט, הפקודה מוחקת אותו באופן רקורסיבי לפני כתיבת תוצאות הפענוח.
-
--transcode-configuration=CONFIG : DataPath (אופציונלי) מציינים את הקובץ שמכיל את הגדרות הקידוד מחדש. מידע נוסף על פורמט ההגדרה של המרת הקידוד זמין במאמר הגדרת המרת הקידוד.
qsam encode
קידוד נתוני QSAM.
הפקודה הזו לוקחת נתונים ממקור חיצוני וממירה אותם לקובץ QSAM. הקלט מוגדר על ידי הערך שמציינים באמצעות הארגומנט --input-format.
תקציר
qsam encode [-h] --copybook=COPYBOOK
--input-format=FORMAT
[--input-stream-count=COUNT]
[--max-error-percent=MAX_ERROR_PERCENT]
[--parallelism=COUNT]
[--spillover=SPILLOVER]
[--transcode-configuration=CONFIG]
[--input-parameter=KEY=VALUE]... INPUT
OUTPUT
דגלים וארגומנטים
הפקודה qsam encode משתמשת בדגלים ובארגומנטים הבאים:
- INPUT : DataPath
- מציינים את נתיב הנתונים של קובץ הקלט שרוצים לקודד לקובץ QSAM.
- OUTPUT : DataPath
- מציינים את נתיב הנתונים של קובץ ה-QSAM שרוצים לקודד.
-
--copybook=COPYBOOK : DataPath - מציינים את נתיב הנתונים של הקובץ שמכיל את ה-copybook.
-
--helpאו-h - (אופציונלי) הצגת הודעת העזרה הזו.
--input-format=FORMAT : TranscodeInputFormat- מציינים את פורמט הקלט.
--input-parameter=KEY=VALUE(אופציונלי) מציינים פרמטרים להגדרת הקלט. כל פרמטר מוגדר כ-
KEY=VALUE. אלה מפתחות פרמטר הקלט הנתמכים:-
csv-dialect: הגדרת ניתוח של קובץ CSV. הערך הואDataPathשמפנה אל קובץ הגדרות CSV. -
json-dialect: הגדרת ניתוח JSON. הערך הואDataPathשמצביע על קובץ הגדרות JSON. -
project-id: מזהה הפרויקט ב-Cloud Storage במקרה של ORC.
-
--input-stream-count=COUNT(אופציונלי) מציינים את מספר זרמי הקלט. זהו ערך מקסימלי, ובפועל יכול להיות שייעשה שימוש בפחות סטרימינג. ערך ברירת המחדל הוא 1.
--max-error-percent=MAX_ERROR_PERCENT(אופציונלי) מציינים את אחוז הרשומות המעובדות שיכולות להכיל שגיאות לפני שתהליך הקידוד נכשל. הערך יכול להיות בין 0.0 (ההמרה תיכשל אם יש שגיאות המרה) ל-1.0 (ההמרה לא תיכשל אם יש שגיאות המרה). ערך ברירת המחדל הוא 0.
--parallelism=COUNT(אופציונלי) מציינים את מספר השרשורים לעיבוד. הערך צריך להיות שווה למספר הליבות הזמינות או קטן ממנו. ערך ברירת המחדל הוא 1.
-
--spillover=SPILLOVER : DataPath (אופציונלי) מציינים נתיב נתונים למערך הנתונים של התנועה העודפת. אם לא תציינו את הפרטים האלה, פרטי השגיאה יימחקו.
-
--transcode-configuration=CONFIG : DataPath (אופציונלי) מציינים את הקובץ שמכיל את הגדרות הקידוד מחדש. מידע נוסף על פורמט ההגדרה של המרת הקידוד זמין במאמר הגדרת המרת הקידוד.
scp
העתקת קבצים ל-Cloud Storage.
תקציר
scp [options] [input] [output]
דגלים וארגומנטים
כדי להשתמש בפקודה הזו, צריך לוודא את הדברים הבאים:
- מגדירים ערך קלט ייחודי אחד באמצעות
input,--inDDאו--inDsn. - מגדירים ערך פלט ייחודי אחד באמצעות פלט או
--gcsOutUri.
הפקודה scp משתמשת בדגלים ובארגומנטים הבאים:
- input
- (אופציונלי) מציינים את ה-DD או ה-DSN שרוצים להעתיק. במקומה אפשר להשתמש ב-
--inDDאו ב---inDsn. - output
- (אופציונלי) מציינים את ה-URI של הפלט בפורמט gs://[BUCKET]/[PREFIX]. במקומה, אפשר להשתמש ב-
--gcsOutUri. --compress- (אופציונלי) דחיסת הפלט באמצעות gzip.
-
--countאו-n=RECORDS - (אופציונלי) מציינים את מספר הרשומות להעתקה. ברירת המחדל היא ללא הגבלה.
--encoding=ENCODING- (אופציונלי) מציינים את קידוד התווים של הקלט. ערך ברירת המחדל הוא CP037.
--gcsOutUri=URI- (אופציונלי) מציינים את URI של Cloud Storage של העותק של הקובץ.
-
--helpאו-h - הצגת טקסט העזרה הזה.
--inDD=INPUT- (אופציונלי) מציינים את קובץ ה-DD שרוצים להעתיק. ערך ברירת המחדל הוא DD INFILE.
--inDsn=INPUT- (אופציונלי) מציינים את ה-DSN שרוצים להעתיק.
--noConvert- (אופציונלי) השבתת ההמרה של קלט תווים ל-ASCII. המרת התווים מופעלת כברירת מחדל.
systemreport
שליחת דוח מערכת.
תקציר
systemreport [-h] [--available-security-providers] [--supported-ciphers]
דגלים וארגומנטים
הפקודה systemreport משתמשת בדגלים ובארגומנטים הבאים:
--available-security-providers- (אופציונלי) מדפיסים את ספקי האבטחה הנתמכים.
-
--helpאו-h - (אופציונלי) הצגת הודעת העזרה הזו.
--supported-ciphers- (אופציונלי) מדפיסים את הצפנים הנתמכים.
vsam decode
פענוח נתוני VSAM.
הפקודה הזו מפענחת רשומות מקובץ VSAM לפורמט שאתם מציינים באמצעות הארגומנט --output-format. קובץ ה-VSAM המקורי מפולח לחלקים על סמך הערך שמציינים בארגומנט --max-chunk-size. הפלט שעבר המרה נשמר בנתיב היעד כקבצים ממוינים לפי סדר מילוני.
תקציר
vsam decode [-h] [--replace] [--chunk-size=CHUNK-SIZE]
--copybook=COPYBOOK
[--max-error-percent=MAX_ERROR_PERCENT]
[--output-format=FORMAT]
[--parallelism=COUNT]
[--preload-chunk-count=PRELOAD_CHUNK_COUNT]
[--transcode-configuration=CONFIG]
[--input-parameter=KEY=VALUE]... INPUT
OUTPUT
דגלים וארגומנטים
הפקודה vsam decode משתמשת בדגלים ובארגומנטים הבאים:
- INPUT : DataPath
- מציינים את נתיב הנתונים של קובץ ה-VSAM שרוצים לפענח.
- OUTPUT : DataPath
- מציינים את נתיב הנתונים של קידומת הפלט. כל הפלט מאוחסן תחת הקידומת הזו.
-
--chunk-size=CHUNK-SIZE : DataSize - (אופציונלי) מציינים את כמות נתוני הקלט שרוצים לכלול בכל קובץ פלט. יכול להיות שגודל קובץ הפלט יהיה גדול או קטן יותר. גודל המקטע מעוגל כלפי מטה לכפולה הקרובה ביותר של אורך הרשומה הלוגית. ערך ברירת המחדל הוא 128MiB.
-
--copybook=COPYBOOK : DataPath - מציינים את נתיב הנתונים של הקובץ שמכיל את ה-copybook.
-
--helpאו-h - (אופציונלי) הצגת הודעת העזרה הזו.
--input-parameter=KEY=VALUE(אופציונלי) מציינים פרמטרים להגדרת הקלט. כל פרמטר מוגדר כ-
KEY=VALUE. אלה מפתחות פרמטר הקלט הנתמכים:-
csv-dialect: הגדרת ניתוח של קובץ CSV. הערך הואDataPathשמפנה אל קובץ הגדרות CSV. -
json-dialect: הגדרת ניתוח JSON. הערך הואDataPathשמצביע על קובץ הגדרות JSON. -
pubsub-publish-configuration: הגדרת ההודעות שנשלחות ל-Pub/Sub. הערך הואDataPathשמפנה אל קובץ הגדרות של Pub/Sub. -
output-prefix: הוספת קידומת לקובצי הפלט.
-
--max-error-percent=MAX_ERROR_PERCENT(אופציונלי) מציינים את אחוז הרשומות המעובדות שיכולות להכיל שגיאות לפני שתהליך הקידוד נכשל. הערך יכול להיות בין 0.0 (ההמרה תיכשל אם יש שגיאות המרה) ל-1.0 (ההמרה לא תיכשל אם יש שגיאות המרה). ערך ברירת המחדל הוא 0.
-
--output-format=FORMAT : TranscodeFormat (אופציונלי) מציינים את הפורמט של קובץ הפלט. אם מספקים את
DataPathשל נושא Pub/Sub כערך שלOUTPUT, פורמט הפלט שמוגדר כברירת מחדל הואJSONL. לכל שארDataPaths, פורמט הפלט שמוגדר כברירת מחדל הואORC.--parallelism=COUNT(אופציונלי) מציינים את מספר השרשורים לעיבוד. הערך צריך להיות שווה למספר ליבות המעבד הזמינות או קטן ממנו. ערך ברירת המחדל הוא 1.
--preload-chunk-count=PRELOAD_CHUNK_COUNT(אופציונלי) מציינים את מספר חלקי הנתונים שייטענו מראש כשכל השרשורים פועלים. ערך ברירת המחדל הוא 1.
--replace(אופציונלי) אם מציינים נתיב פלט, הפקודה מוחקת אותו באופן רקורסיבי לפני כתיבת תוצאות הפענוח.
-
--transcode-configuration=CONFIG : DataPath (אופציונלי) מציינים את הקובץ שמכיל את הגדרות הקידוד מחדש. מידע נוסף על פורמט ההגדרה של המרת הקידוד זמין במאמר הגדרת המרת הקידוד.
סוגי פרמטרים
אלה סוגים נפוצים שמשמשים בפקודות של Mainframe Connector.
DataPath
DataPath היא מחרוזת שמייצגת קלט או פלט. לכל סוג DataPath יש תחילית וארגומנטים משלו, כמו שמוצג בהמשך:
DD:– נתיבי נתונים עם הקידומת הזו מצביעים על הצהרת הגדרת נתונים (DD) כשמריצים אותם בעבודה של שפת בקרת עבודות (JCL). כדי לשנות את הקידוד של ה-DD, מוסיפיםencoding=ל-DD. לדוגמה,DD:DDNAMEאוDD:DDNAME?encoding=UTF-8. קידוד ברירת המחדל של DD הוא קידוד ברירת המחדל של מערכת ההפעלה.
DSN:– נתיבי נתונים עם התחילית הזו מצביעים על שם של מקור נתונים (DSN) כשמריצים אותם במחשב מרכזי. כדי לשנות את הקידוד של ה-DSN, מוסיפיםencoding=ל-DSN. אפשר לשנות את מצב הכתיבה של ה-DSN על ידי הוספתwritemode=OLD/MOD/SHRל-DSN.-
MOD:הוספת נתונים לסוף של קובץ קיים. אם הקובץ לא קיים, הוא נוצר. במצב הזה, גישת קריאה בו-זמנית (לוגיקה של DISP=SHR) מופעלת כברירת מחדל. -
OLD:מחליף את הקובץ החל מההתחלה. במצב הזה יש שליטה בלעדית; אף משימה אחרת לא יכולה לגשת ל-DSN בזמן שהוא פתוח. -
SHR:מחליף את הקובץ החל מההתחלה. במצב הזה יש גישת קריאה וכתיבה בו-זמנית, אבל צריך להשתמש בו בזהירות רבה כי הוא לא מציע סדרות.
לדוגמה,
DSN:HQ.FOO.BAR, DSN:HQ.FOO.BAR?encoding=cp037אוDSN:HQ.FOO.BAR?encoding=cp037&writemode=OLD.-
file:– נתיבי נתונים עם התחילית הזו מפנים לקובץ Unix. אפשר לציין את הפרטים הבאים בקובץ Unix:- אורך הרשומה הלוגית (LRECL) על ידי הוספת
#lreclלפני:. - פורמט הרשומה (RECFM) על ידי הוספת
&recfmלפני:. ערך ברירת המחדל של RECFM הואF. - הקידוד מתבצע על ידי הוספת
&encodingלפני:. קידוד ברירת המחדל הואUTF-8.
לדוגמה,
file:/path/to/file,file?80:/path/to/file,file?80&recfm=FB:/path/to/fileאוfile?80&recfm=FB&encoding=cp037:/path/to/file.- אורך הרשומה הלוגית (LRECL) על ידי הוספת
gs://– נתיבי נתונים עם הקידומת הזו מצביעים על קובץ ב-Cloud Storage. אפשר לציין בקובץ את הפרטים הבאים:- ה-LRECL על ידי הוספת
?lrecl=lreclאחרי הקידומת של הקטגוריה. - ה-RECFM על ידי הוספת
?recfm=recfmאחרי הקידומת של הקטגוריה. ערך ברירת המחדל של RECFM הואF. - הקידוד על ידי הוספת
?encoding=אחרי הקידומת של מאגר הנתונים. קידוד ברירת המחדל הואUTF-8.
לדוגמה,
gs://my_bucket/my/file.txt,gs://my_bucket/my/file.txt?encoding=cp037,gs://my_bucket/my/file.txt?recfm=fb&encoding=cp037אוgs://my_bucket/my/file.txt?lrecl=80&recfm=fb&encoding=cp037.- ה-LRECL על ידי הוספת
pubsub:– נתיבי נתונים עם הקידומת הזו מצביעים על משאב Pub/Sub. לדוגמה,pubsub:projects/projectId/topics/topicId.
בקבצים של Cloud Storage או Unix, אם RECFM מוגדר ל-V, Mainframe Connector קורא וכותב את הקבצים בפורמט LLzz באופן הבא:
- שני הבייטים הראשונים מייצגים את גודל הנתונים + 4 בייטים.
- שני הבייטים הבאים הם תמיד 0x0000.
- שאר הבייטים הם נתוני הרשומה בפועל.
בקבצים של Cloud Storage או Unix, אם RECFM מוגדר ל-VC, Mainframe Connector קורא וכותב את הקבצים בפורמט zzLL באופן הבא:
- שני הבייטים הראשונים הם תמיד 0x0000.
- שני הבייטים הבאים מייצגים את גודל הנתונים.
- שאר הבייטים הם נתוני הרשומה בפועל.
DataSize
DataSize מייצג גודל בצורה של כמות ויחידת מידה, לדוגמה 5 MiB. אפשר להשתמש ברווח לבן בין הכמות לבין סדר הגודל. ניתוח גודל הנתונים לא תלוי באותיות רישיות או קטנות, כך שאפשר לציין יחידות מידה באותיות רישיות או קטנות.
אפשר לציין את הערך בפורמטים הבאים:
- פורמט Java: b/k/m/g/t, ל-byte, kibibyte, mebibyte, gibibyte ו-tebibyte בהתאמה.
- פורמט בינלאומי: KiB/MiB/GiB/TiB, kibibyte, mebibyte, gibibyte ו-tebibyte בהתאמה.
- פורמט המדד: b/kb/mb/gb/tb, עבור קילו-בייט, מגה-בייט, ג'יגה-בייט וטרה-בייט בהתאמה.
TranscodeFormat
TranscodeFormat מייצג את הפורמט שבו יש להשתמש במהלך תהליך הקידוד מחדש.
הערכים החוקיים הם:
-
ORC– ORCהוא פורמט קובץ עמודתי עם מודעות לסוג, שמתאר את עצמו. -
CSV– CSVהוא פורמט של טקסט פשוט שבו מאוחסנים נתונים טבלאיים, כשכל שורה מייצגת שורה בטבלה. אפשר לציין את הפרמטרים של קובץ ה-CSV באמצעות פרמטר הקלטcsv-dialect. אפשר להגדיר אותו כ---input-parameter csv-dialect=DataPath, כאשר DataPath מציין את המיקום של הפרמטרים האלה. -
JSONL– JSONLהוא פורמט של טקסט פשוט שבו מאוחסנים נתונים טבלאיים, כשכל שורה מייצגת שורה בטבלה. אפשר לציין את פרמטרי ה-JSON באמצעות פרמטר הקלטjson-dialect. אפשר להגדיר אותו כ---input-parameter json-dialect=DataPath, כאשר DataPath מציין את המיקום של הפרמטרים האלה.
TranscodeInputFormat
הפורמט שבו יש להשתמש במהלך הקידוד מחדש.
הערכים החוקיים הם:
BIGQUERY– שולף נתונים ישירות מ-BigQuery. INPUTחייב להיות נתיב לקובץ שאילתה.פרמטרי הקלט הזמינים הם:
-
keep-order– לשימוש אם הסדר המדויק של הרשומות חשוב. חשוב לדעת שהפעולה הזו תגביל את זרם הקלט. -
project-id– מזהה הפרויקט לשימוש בזמן הפעלת העבודה. -
location– המיקום שבו יש להשתמש כשמבצעים את העבודה.
-
CSV– CSVהוא פורמט של טקסט פשוט שבו מאוחסנים נתונים טבלאיים, כשכל שורה מייצגת שורה בטבלה. אפשר לציין את הפרמטרים של קובץ ה-CSV באמצעות פרמטר הקלטcsv-dialect. אפשר להגדיר אותו כ---input-parameter csv-dialect=DataPath, כאשר DataPath מציין את המיקום של הפרמטרים האלה.
JSONL– JSONLהוא פורמט של טקסט פשוט שבו מאוחסנים נתונים טבלאיים, כשכל שורה מייצגת שורה בטבלה. אפשר לציין את פרמטרי ה-JSON באמצעות פרמטר הקלטjson-dialect. אפשר להגדיר אותו כ---input-parameter json-dialect=DataPath, כאשר DataPath מציין את המיקום של הפרמטרים האלה.
ORC– ORCהוא פורמט קובץ עמודתי עם מודעות לסוג, שמתאר את עצמו. כדי לבצע טרנסקוד לקובציORCמ-Cloud Storage, מגדירים את הערך שלproject-idלמזהה הפרויקט שבו נמצא Cloud Storage.