אפשר להגדיר את רכיב ה-transcoder של Mainframe Connector על ידי הוספת ההגדרה הנדרשת בקובץ JSON.
הקובץ הזה נקרא קובץ התצורה של הטרנסקודר. צריך להגדיר את ההגדרה כמו שמתואר בקטע הגדרה.
הפקודות qsam encode ו-qsam decode משתמשות בקובץ ההגדרות של הטרנסקודר כדי לבצע טרנסקוד של נתונים.
בדף הזה מתוארות הדרכים השונות שבהן אפשר להגדיר את רכיב הטרנסקודר של Mainframe Connector.
הגדרות אישיות
האובייקט Configuration הוא הבסיס של הגדרת המרת הקידוד.
הוא מכיל את כל אפשרויות ההגדרה של הטרנסקודר.
| ייצוג ב-JSON |
|---|
{ "defaults": object ( |
| שדות | |
|---|---|
defaults |
מציינים משנים של שדות ברירת מחדל לאב-טיפוסים של Cobol. |
field_suffixes |
מציינים סיומות לשדות. |
field_overrides |
מציינים שינויים בשדות. |
transformations |
מציינים את הטרנספורמציות של השדות. |
schema_validation_mode |
מציינים את מצב אימות הסכימה. |
header_records_to_skip |
מציינים את מספר הרשומות הראשונות שרוצים לדלג עליהן. |
record_filter_condition |
מציינים תנאי סינון לרשומות. המסנן תומך באופרטורים הבאים:
דוגמה:
|
DefaultsSection
אפשר להשתמש באובייקט DefaultsSection כדי לציין שינויים שמוגדרים כברירת מחדל לפי סוגי cobol.
השינויים האלה מוחלים לפני שינויים של סיומות או שינויים שנעשו כדי לעקוף את הגדרות ברירת המחדל.
| ייצוג ב-JSON |
|---|
{ "alpha_numeric_display": object ( |
| שדות | |
|---|---|
alpha_numeric_display |
מציינים ערכי ברירת מחדל לשדות אלפאנומריים (PIC X). |
numeric_display |
מציינים ערכי ברירת מחדל לשדות של תצוגה מספרית (עשרוני אזורי). |
binary |
מציינים ערכי ברירת מחדל לשדות של מספרים בינאריים (COMP). |
packed_decimal |
מציינים ערכי ברירת מחדל לשדות של מספרים עשרוניים דחוסים (COMP-3). |
national |
מציינים ערכי ברירת מחדל לשדות לאומיים (PIC N). |
utf8 |
מציינים את ברירות המחדל לשדות UTF-8 (PIC U). |
dbcs |
ברירת המחדל לשדות dbcs (DISPLAY-1). |
hexadecimal_floating_point |
ברירת המחדל של שדות הקסדצימליים של נקודה צפה (COMP-1, COMP-2). |
FieldSuffix
סיומות השדות חלות על כל השדות שיש להם סיומת.
ההתאמה בין השדות מתבצעת אם הם מסתיימים במקף (-) או בקו תחתון (_) ואחריהם הסיומת.
הסיומות הן לא תלויות-רישיות.
המשנה FieldSuffix מוחל אחרי המשנה FieldOverride.
לדוגמה, השינוי שהוגדר לסיומת NID יחול על השדה שנקרא FLD-NID, אבל לא על השדה FUNID.
| ייצוג ב-JSON |
|---|
{ "suffix": string, "is_inverse": boolean, "modifier": object ( |
| שדות | |
|---|---|
suffix |
המשנה יחול על השדה עם הסיומת הזו. |
is_inverse |
מציינים אם המאפיין הוא מאפיין הפוך או לא.
משנה שדה הפוך מחיל את המשנה על שדה אחר עם אותו שם כמו השדה עם המשנה
בלי המשנה. לדוגמה, אם השדות כשמשתמשים במגדיר שדה הפוך, אפשר להשתמש במזהה המיוחד לדוגמה, כדי ליצור שדה של מציין ערך null, אפשר להשתמש במגדיר השדה |
modifier |
מציינים את שינוי המאפיין שרוצים להחיל על שדות תואמים. |
FieldOverride
עקיפה או שינוי של שרשרת הפענוח והקידוד בשדה שצוין.
| ייצוג ב-JSON |
|---|
{ "field": string, "modifier": object ( |
| שדות | |
|---|---|
field |
מציינים את שם השדה שרוצים להחיל עליו את המשנה. |
modifier |
מציינים את המגביל שרוצים להחיל על שדה ההתאמה. |
שינוי
הטרנספורמציות של התצוגה משמשות לשינוי הקשר בין הטבלה לבין קובץ ה-QSAM. הטרנספורמציות תמיד מנוסחות מנקודת המבט של הנתונים. הקונספט דומה לטבלאות תצוגה ב-BigQuery.
| ייצוג ב-JSON |
|---|
{ "exclude": object ( |
| שדות | |
|---|---|
exclude |
|
unnest |
|
move |
|
rename |
|
split |
|
FieldModifier
משנה שדה מאפשר לשנות את הקידוד או הפענוח של שדה ספציפי. חשוב לזכור שלא כל שינויי ההגדרות ניתנים להחלה על כל השדות. מידע נוסף מופיע במסמכי התיעוד של שינויי ההרשאות הספציפיים.
| ייצוג ב-JSON |
|---|
{ "filler": object ( |
| שדות | |
|---|---|
filler |
השדה לא יעבור עיבוד ולא ייכלל בפלט. |
null_if |
הגדרת השדה כ-null באופן מותנה על סמך הערך של שדה אחר. |
format_date |
מעצבת שדה מחרוזת כתאריך. |
chain |
שרשור של כמה משנים שיחולו ברצף. |
zoned_decimal |
ההגדרה הזו מבטלת את הגדרת ברירת המחדל של שדות עשרוניים מחולקים לאזורים. |
binary |
ההגדרה הזו מחליפה את הגדרת ברירת המחדל בשדות מספריים בינאריים. |
packed_decimal |
המדיניות הזו עוקפת את הגדרות ברירת המחדל של שדות עשרוניים דחוסים. |
null_if_invalid |
השדה מוגדר כ-null אם מתרחשת שגיאת קידוד, כדי למנוע חריגה של רשומות. |
bytes |
השדה מטופל כרצף גולמי של בייטים, בלי להתייחס למידע קודם על הסוג. |
varlen |
מגדירים את הרשומה כשדה באורך משתנה. |
string |
הפונקציה מחליפה את הגדרת ברירת המחדל של שדות מחרוזת. |
null_if_empty |
אם התוכן של השדה נחשב ריק, הפונקציה מגדירה את השדה כ-null. |
format_timestamp |
מעצב שדה מחרוזת כחותמת זמן. |
hfp |
מפרשת את השדה כמספר הקסדצימלי בשיטת נקודה צפה (HFP). |
decode_as_null |
הגדרת אופן הפענוח של ערכי null. |
encode_null_as |
הגדרה של אופן הקידוד של ערכי null. |
אל תכלול
להחריג שדה מהטבלה שמתקבלת, אבל עדיין לבצע פענוח או קידוד. האפשרות הזו שימושית כשלא צריך להעביר את השדה לטבלה, אבל הוא נדרש להמרת קידוד. לדוגמה, אפשר להשמיט מהטבלה שדות של אינדיקטורים של ערכי null או של אורך.
כדי לדלג על הטרנסקוד לחלוטין, צריך להחיל את משנה המילוי.
| ייצוג ב-JSON |
|---|
{ "field": string |
| שדות | |
|---|---|
field |
מציינים את השדה שרוצים להחריג. |
Unnest
חילוץ השדה מהפריט שבתוכו הוצב.
| ייצוג ב-JSON |
|---|
{ "field": string, "format": string |
| שדות | |
|---|---|
field |
מציינים את השדה שרוצים לבטל את הקינון שלו |
format |
מציינים את הפורמט החדש של השדה. השדה במבני struct לא מקוננים, במערכים וברשימות לא מקוננים, |
העברה
להעביר שדה ברשומה.
| ייצוג ב-JSON |
|---|
{ "field": string, "offset": int |
| שדות | |
|---|---|
field |
מציינים את השדה שרוצים להעביר. |
offset |
מציינים את מספר המקומות שהשדה צריך לעבור קדימה או אחורה. |
שנה שם
משנים את השם של שדה אחד או יותר על סמך התאמה לביטוי רגולרי.
לדוגמה, כדי להחליף את כל המקפים בקו תחתון, משתמשים בפורמט JSON הבא:
{"find": "\\-", "replace":"_"}.
| ייצוג ב-JSON |
|---|
{ "find": string, "replace": string |
| שדות | |
|---|---|
find |
מציינים תבנית של ביטוי רגולרי ב-Java כדי לזהות את השדות שרוצים לשנות את השם שלהם. ההתאמה של התבנית מתבצעת מול השם המלא של השדה. אם התבנית תואמת לחלק כלשהו של שם השדה, השדה נחשב לתואם. דוגמאות:
|
replace |
מציינים את השם החדש של השדות התואמים. אפשר להשתמש בקבוצות לכידה מהביטוי הרגולרי דוגמאות:
|
פיצול
| ייצוג ב-JSON |
|---|
{ "field": string, "primary_key": string, "foreign_key": string |
| שדות | |
|---|---|
field |
מציינים את השדה שרוצים לפצל. |
primary_key |
מציינים את שם השדה שישמש כמפתח ראשי. |
foreign_key |
מציינים את השם של השדה שיוסף לסכימה החדשה, שבה יאוחסן ערך המפתח הראשי. אם לא מציינים שם, המערכת משתמשת בשם של המפתח הראשי. |
Filler
מציין שהמערכת תתעלם משדה במהלך העיבוד. השדה לא יפוענח מהקלט או יקודד לפלט, והוא לא ייכלל בסכימה ובטבלת הנתונים שיתקבלו במהלך הפענוח. אפשר להחיל את משנה ההגדרה הזה על כל שדה עם גודל סטטי ידוע.
מזינים אובייקט JSON ריק באופן הבא:
| ייצוג ב-JSON |
|---|
{ |
NullIf
הגדרת שדה כ-null אם תנאי מסוים מתקיים. חובה לציין את null_value או את non_null_value או את שניהם.
כדי ליצור שדה של מציין ערך null, אפשר להשתמש ב-FieldSuffix עם משנה שדה null_if ולהגדיר את is_inverse ל-true, כמו בדוגמאות הבאות:
דוגמה: Null-indicator
כדי ליצור שדה של מציין ערך null, אפשר להשתמש במגדיר השדהnull_if באופן הבא.
{
"field_suffixes": [
{
"suffix": "NID",
"is_inverse": true,
"modifier": {
"null_if": {
"null_value": "?",
"target_field": "$self"
}
}
}
]
}
NID הם למעשה אינדיקטורים של ערך null, כמו שמוצג בקטע הקוד הבא:
01 REC. 02 FIELD PIC X(10). 02 FIELD-NID PIC X(1).
דוגמה: מחוון בינארי של ערך null
כדי ליצור שדהbinary null-indicator, אפשר להשתמש במגדירי השדות binary ו-null_if באופן הבא.
{
"field_suffixes": [
{
"suffix": "NID",
"modifier": {
"binary": {}
}
},
{
"suffix": "NID",
"is_inverse": true,
"modifier": {
"null_if": {
"null_value": "15",
"target_field": "$self"
}
}
}
]
}
NID כאינדיקטורים של ערך null.binary
דוגמה: Bytes null-indicator
כדי ליצור שדה של מציין ערך null, אפשר להשתמש במגדירי השדותbytes ו-null_if באופן הבא.
הערכים של null ו-not-null מבוטאים כ-HEX.bytes
{
"field_suffixes": [
{
"suffix": "NID",
"modifier": {
"bytes": {}
}
},
{
"suffix": "NID",
"is_inverse": true,
"modifier": {
"null_if": {
"null_value": "FF",
"target_field": "$self"
}
}
}
]
}
NID יכולים לשמש כbytes מציין ערך null באמצעות אותו קובץ העתקה מהדוגמה הקודמת.
| ייצוג ב-JSON |
|---|
{ "target_field": string, "null_value": string, "null_values": string, "non_null_value": string, "non_null_values": string |
| שדות | |
|---|---|
target_field |
מציינים את השדה שרוצים לבדוק את הערך שלו. השדה חייב להיות בהיקף. |
null_value |
אם מציינים ערך, אם |
null_values |
אם מציינים ערך, אם |
non_null_value |
אם מציינים ערך, והערך של |
non_null_values |
אם מציינים את הערך הזה, והערך |
FormatDate
מעצבת מחרוזת לתאריך באמצעות אחד מהפורמטים הנתמכים. אפשר להחיל את שינוי הגודל הזה רק על שדות בגודל מסוים. במהלך תהליך הפענוח, הפורמטים נבדקים לפי הסדר עד שאחד מהם תואם למחרוזת. במהלך תהליך הקידוד, המערכת משתמשת בפורמט הראשון ומתעלמת מכל השאר.
| ייצוג ב-JSON |
|---|
{ "formats": object ( |
| שדות | |
|---|---|
formats |
רשימה של פורמטים של תאריך. |
ModifierChain
מציינים שרשרת של משנים כדי להחיל כמה משנים ברצף. השינויים מוחלים לפי הסדר שבו הם צוינו.
| ייצוג ב-JSON |
|---|
{ "modifiers": object ( |
| שדות | |
|---|---|
modifiers |
מציינים את רשימת השינויים שרוצים להחיל. |
ZonedDecimal
הגדרת אפשרויות שונות שקשורות לקידוד ולפענוח של מספרים עשרוניים עם אזור. אפשר להחיל את שינוי הערך הזה רק על שדה עשרוני.
| ייצוג ב-JSON |
|---|
{ "logical_type": enum ( |
| שדות | |
|---|---|
logical_type |
מציינים את הסוג הלוגי שבו יש להשתמש כשמפענחים או מקודדים את השדה. |
encoding |
הקידוד שבו השדה מקודד. |
בינארי
מתעלמים מכל רכיבי השינוי הקודמים ומתייחסים לשדה הזה כמספר בינארי.
| ייצוג ב-JSON |
|---|
{ "signedness": enum ( |
| שדות | |
|---|---|
signedness |
הסימן של המספר. |
PackedDecimal
מגדירים את השדה הזה ל-PackedDecimal.
| ייצוג ב-JSON |
|---|
{ "logical_type": enum ( |
| שדות | |
|---|---|
logical_type |
ביטול הסוג הלוגי. כברירת מחדל, Mainframe Connector משתמש בסוג הלוגי האופטימלי על סמך הדיוק והקנה מידה. |
NullIfInvalid
הערך יטופל כ-null אם הטרנסקוד לא יצליח. אפשר להחיל את שינוי הגודל הזה רק על שדות בגודל מסוים. המערכת מתעלמת מהשגיאה והיא לא נרשמת במערך הנתונים של העודפים. במהלך תהליך הפענוח, הערך של השדה הזה יהיה null עבור הרשומה הזו. במהלך תהליך הקידוד, אם אי אפשר לכתוב את הנתונים, השדה כולו ימולא בבייטים של ערך null.
מזינים אובייקט JSON ריק באופן הבא:
| ייצוג ב-JSON |
|---|
{ |
בייטים
השדה מטופל כרצף גולמי של בייטים. המשנה הזה מבטל כל מידע קודם על סוג, וגורם לנתוני הבייטים הגולמיים של השדה להישמר כמו שהם, ללא קידוד תווים ספציפי או פרשנות מספרית. אפשר להחיל את שינוי המאפיין הזה על כל שדה, בלי קשר לסוג או לגודל המקוריים שלו.
מזינים אובייקט JSON ריק באופן הבא:
| ייצוג ב-JSON |
|---|
{ |
VarLen
מייצג שדה באורך משתנה.
שדה באורך משתנה מכיל שלושה חלקים:
- פריט קבוצתי שמכיל שני שדות משנה.
- שדה בתוך פריט הקבוצה שמכיל את אורך נתוני העסקה.
- שדה בתוך פריט הקבוצה שמכיל את הנתונים.
השם של השדה באורך משתנה יהיה שם הקבוצה.
מזינים אובייקט JSON ריק באופן הבא:
| ייצוג ב-JSON |
|---|
{ |
String
הגדרת האפשרויות השונות שקשורות לפענוח ולקידוד של מחרוזות. אפשר להחיל את הפונקציה רק על שדה מחרוזת.
| ייצוג ב-JSON |
|---|
{ "encoding": string, "trim_suffix": boolean, "pad_char": string |
| שדות | |
|---|---|
encoding |
הקידוד שבו השדה מקודד. |
trim_suffix |
אם הערך הוא true, רווחים לבנים בסוף המחרוזת יימחקו. הפונקציה trim_suffix משפיעה רק על פענוח, והקידוד מתעלם ממנה. שימו לב: מחרוזות שמורכבות רק מרווחים יהפכו למחרוזות ריקות. |
pad_char |
כשמגדירים ייצוא של מחרוזות ריפוד עם |
NullIfEmpty
אם כל הבייטים בשדה הם 0, צריך להגדיר את השדה כ-null.
מזינים אובייקט JSON ריק באופן הבא:
| ייצוג ב-JSON |
|---|
{ |
FormatTimestamp
מפרמטים מחרוזת לחותמת זמן באמצעות אחד מהפורמטים שצוינו. אפשר להחיל את ההגדרה הזו רק על שדות בגודל מסוים. במהלך הפענוח, הפורמטים נבדקים לפי הסדר עד שאחד מהם תואם למחרוזת. במהלך הקידוד, המערכת תשתמש בפורמט הראשון ותתעלם מכל השאר.
| ייצוג ב-JSON |
|---|
{ "formats": object ( |
| שדות | |
|---|---|
formats |
רשימה של פורמטים של חותמות זמן. |
HFP
מגדירים את השדה הזה כ-Hexadecimal Floating-Point.
מזינים אובייקט JSON ריק באופן הבא:
| ייצוג ב-JSON |
|---|
{ |
DecodeAsNull
הגדרה של האופן שבו ערכי null מתפרשים במהלך תהליך הפענוח. מכיוון ש-COBOL לא תומכת באופן מובנה בערכי null, הפרמטר הזה מציין אילו ערכים צריך להתייחס אליהם כאל ערכי null.
| ייצוג ב-JSON |
|---|
{ "values": string, "hex_bytes": string |
| שדות | |
|---|---|
values |
רשימה של ייצוגי מחרוזות. אחרי הפענוח הראשוני של השדה לפורמט מחרוזת, אם התוכן של השדה תואם לאחד מהערכים האלה, הוא יטופל כערך null. |
hex_bytes |
רשימה של ייצוגים הקסדצימליים של בייט יחיד.
אם שדה מכיל חזרות של אחד מהבייטים האלה, הוא נחשב כ-null.
לדוגמה, שימוש ב- |
EncodeNullAs
הגדרה של האופן שבו ערכי null מיוצגים במהלך תהליך הקידוד.
| ייצוג ב-JSON |
|---|
{ "value": string, "hex_byte": string |
| שדות | |
|---|---|
value |
קידוד הערך הספציפי הזה כשערך המקור הוא null. מוודאים שהמחרוזת תקינה לסוג השדה. |
hex_byte |
קידוד רצף הבייטים הספציפי הזה (שמיוצג כמחרוזת הקסדצימלית)
כשהערך של מקור הוא null. לדוגמה, |
DateTimeFormat
הגודל והתבנית שבהם יש להשתמש כשממירים את השדה לתאריך.
| ייצוג ב-JSON |
|---|
{ "size": int, "pattern": string |
| שדות | |
|---|---|
size |
מציינים את הגודל של השדה שהתבנית הזו חלה עליו. |
pattern |
מציינים את התבנית של מעצב התאריכים. מידע נוסף על תבניות מעצבות תקינות זמין במאמר בנושא המחלקות DateTimeFormatter. |
BinarySignedness
הסוג הלוגי שבו יש להשתמש בשדה עשרוני.
| טיפוסים בני מנייה (enum) | |
|---|---|
UNSPECIFIED |
מומלץ להשתמש בסוג האופטימלי ביותר בהתאם לקנה המידה ולדיוק. |
SIGNED |
משתמשים ב-64 ביט כדי לאחסן את הערך. המשנה הזה פועל רק על מספרים שרמת הדיוק שלהם קטנה מ-18 או שווה לה, והקנה מידה הוא 0. |
UNSIGNED |
משתמשים ב-64 ביט כדי לאחסן את הערך. המשנה הזה פועל רק על מספרים שרמת הדיוק שלהם היא 18 או פחות. |
SchemaValidationMode
מציינים את מצב אימות הסכימה שבו רוצים להשתמש במהלך הידור ה-copybook. במצב הזה המערכת בודקת את התאימות לפורמט נתונים ספציפי של יעד.
| טיפוסים בני מנייה (enum) | |
|---|---|
DEFAULT |
מצב ברירת המחדל של אימות הסכימה. במצב הזה, המערכת מוודאת ששמות השדות הייחודיים נמצאים בקובץ ה-copybook. |
BIG_QUERY |
מצב אימות סכימה לתאימות ל-BigQuery. במצב הזה, האימות שמוגדר כברירת מחדל מורחב כדי לוודא שהסכימה של קובץ ה-copybook תואמת לסוגי הנתונים של BigQuery. |
POSTGRES |
מצב אימות סכימה לתאימות ל-PostgreSQL. במצב הזה, האימות שמוגדר כברירת מחדל מורחב כדי לוודא שהסכימה של קובץ ה-copybook תואמת לסוגי הנתונים של PostgreSQL. |
MYSQL |
מצב אימות סכימה לתאימות ל-MySQL. במצב הזה, האימות שמוגדר כברירת מחדל מורחב כדי לוודא שהסכימה של קובץ ה-copybook תואמת לסוגי הנתונים של MySQL. |
DecimalLogicalType
הסוג הלוגי שבו יש להשתמש בשדה עשרוני.
| טיפוסים בני מנייה (enum) | |
|---|---|
AUTO |
מומלץ להשתמש בסוג האופטימלי ביותר בהתאם לקנה המידה ולדיוק. |
LONG |
משתמשים ב-64 ביט כדי לאחסן את הערך. המשנה הזה פועל רק על מספרים שרמת הדיוק שלהם קטנה מ-18 או שווה לה, והקנה מידה הוא 0. |
DECIMAL64 |
משתמשים ב-64 ביט כדי לאחסן את הערך. המשנה הזה פועל רק על מספרים שרמת הדיוק שלהם היא 18 או פחות. |
BIG_DECIMAL |
אחסון הערך כמספר עשרוני ללא גבול. זו האפשרות הכי איטית, אבל היא תומכת בכל מספר עשרוני בכל רמת דיוק ובכל קנה מידה. |
BIG_INTEGER |
אחסון הערך כמספר שלם ללא גבולות. זו האפשרות הכי איטית, אבל היא תומכת בכל מספר שלם בכל רמת דיוק. |
ZonedDecimalEncoding
מציינים את הקידוד שבו רוצים להשתמש כשמפענחים או מקודדים שדה עשרוני עם אזור.
| טיפוסים בני מנייה (enum) | |
|---|---|
UNSPECIFIED |
שומרים על הקידוד שצוין בשרשרת של משני המיקום.
אם לא מציינים משנה, המערכת משתמשת ב-EBCDIC. |
EBCDIC |
משתמשים בקידוד EBCDIC. |
ASCII |
משתמשים בקידוד ASCII. |