ניהול מערכי נתונים
במאמר הזה מוסבר איך להעתיק מערכי נתונים, ליצור מחדש מערכי נתונים במיקום אחר, לאבטח מערכי נתונים, למחוק מערכי נתונים ולשחזר טבלאות ממערכי נתונים שנמחקו ב-BigQuery. למידע על שחזור (או ביטול מחיקה) של קבוצת נתונים שנמחקה, אפשר לעיין במאמר שחזור של קבוצות נתונים שנמחקו.
אדמינים ב-BigQuery יכולים לארגן את הגישה לטבלאות ולתצוגות שמשמשות אנליסטים, ולשלוט בה. מידע נוסף על מערכי נתונים זמין במאמר מבוא למערכי נתונים.
אי אפשר לשנות את השם של מערך נתונים קיים או להעביר אותו אחרי שהוא נוצר. כדי לשנות את השם של מערך הנתונים, אפשר להעתיק מערך נתונים ולשנות את השם של מערך הנתונים של היעד. כדי להעביר מיקום של מערך נתונים, אפשר לפעול באחת מהשיטות הבאות:
התפקידים הנדרשים
בקטע הזה מתוארים התפקידים וההרשאות שנדרשים לניהול מערכי נתונים. אם מערך הנתונים של המקור או היעד נמצא באותו פרויקט שבו אתם משתמשים כדי להעתיק, לא צריך הרשאות או תפקידים נוספים במערך הנתונים הזה.
העתקת מערך נתונים
צריך להקצות את ההרשאות האלה כדי להעתיק מערך נתונים. העתקה של מערכי נתונים נמצאת בגרסת בטא.
כדי לקבל את ההרשאות שדרושות להעתקת מערכי נתונים, צריך לבקש מהאדמין להקצות לכם את תפקידי ה-IAM הבאים:
-
אדמין של BigQuery (
roles/bigquery.admin) – פרויקט היעד -
צפייה בנתוני BigQuery (
roles/bigquery.dataViewer) – מערך הנתונים של המקור -
עריכה של נתוני BigQuery (
roles/bigquery.dataEditor) – מערך הנתונים של היעד
להסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.
התפקידים המוגדרים מראש האלה כוללים את ההרשאות שנדרשות להעתקת מערכי נתונים. כדי לראות בדיוק אילו הרשאות נדרשות, אפשר להרחיב את הקטע ההרשאות הנדרשות:
ההרשאות הנדרשות
כדי להעתיק מערכי נתונים, צריך את ההרשאות הבאות:
-
bigquery.transfers.updateבפרויקט היעד -
bigquery.jobs.createבפרויקט היעד -
bigquery.datasets.getבמערך נתוני המקור והיעד -
bigquery.tables.listבמערך נתוני המקור והיעד -
bigquery.datasets.updateבמערך נתוני היעד -
bigquery.tables.createבמערך נתוני היעד
יכול להיות שתקבלו את ההרשאות האלה באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש אחרים.
מחיקה של מערך נתונים
צריך להעניק את ההרשאות האלה כדי למחוק מערך נתונים.
כדי לקבל את ההרשאות שנדרשות למחיקת מערכי נתונים, צריך לבקש מהאדמין להקצות לכם ב-IAM את התפקיד הבעלים של נתוני BigQuery (roles/bigquery.dataOwner) בפרויקט.
להסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.
זהו תפקיד שמוגדר מראש וכולל את ההרשאות שנדרשות למחיקת מערכי נתונים. כדי לראות בדיוק אילו הרשאות נדרשות, אפשר להרחיב את הקטע ההרשאות הנדרשות:
ההרשאות הנדרשות
כדי למחוק מערכי נתונים, נדרשות ההרשאות הבאות:
-
bigquery.datasets.deleteבפרויקט -
bigquery.tables.deleteבפרויקט
יכול להיות שתקבלו את ההרשאות האלה באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש אחרים.
העתקת מערכי נתונים
אתם יכולים להעתיק מערך נתונים, כולל נתונים מחולקים למחיצות, בתוך אזור או בין אזורים, בלי לחלץ, להעביר או לטעון מחדש נתונים ל-BigQuery. ב-BigQuery נעשה שימוש ב-שירות העברת נתונים ל-BigQuery בקצה העורפי כדי להעתיק מערכי נתונים. מידע על שיקולים לגבי מיקום כשמעבירים נתונים זמין במאמר מיקום והעברה של נתונים.
לכל הגדרה של העתקת מערך נתונים יכולה להיות הפעלה אחת של העברה בכל פעם. ריצות העברה נוספות מתווספות לתור. אם אתם משתמשים במסוף Google Cloud , אתם יכולים לתזמן העתקות חוזרות ולהגדיר הודעות באימייל או ב-Pub/Sub באמצעות שירות העברת הנתונים ל-BigQuery.
מגבלות
ההגבלות הבאות חלות כשמעתיקים מערכי נתונים:
אי אפשר להעתיק את המשאבים הבאים ממערך נתונים של מקור:
- צפיות.
- שגרות, כולל פונקציות מוגדרות על ידי המשתמש (UDF).
- טבלאות חיצוניות.
- טבלאות של סימון נתונים שהשתנו (CDC) אם עבודת ההעתקה מתבצעת בין אזורים. יש תמיכה בהעתקה של טבלאות CDC באותו אזור.
לא ניתן להשתמש במשימת העתקה של טבלה בין אזורים עבור טבלאות שמוצפנות באמצעות מפתחות הצפנה בניהול הלקוח (CMEK), אם מערך הנתונים של היעד לא מוצפן באמצעות CMEK ולא סופק CMEK. אפשר להעתיק טבלאות עם הצפנה שמוגדרת כברירת מחדל בין אזורים.
אפשר להעתיק את כל הטבלאות המוצפנות באותו אזור, כולל טבלאות שהוצפנו באמצעות CMEK.
אי אפשר להשתמש במקורות המידע הבאים כערכות נתונים ליעד של עבודות העתקה:
- אחסון שעבר אופטימיזציה לכתיבה.
מערך הנתונים מוצפן באמצעות CMEK אם עבודת ההעתקה מתבצעת בין אזורים והטבלה של המקור לא מוצפנת באמצעות CMEK.
עם זאת, מותר להשתמש בטבלאות שמוצפנות באמצעות CMEK כטבלאות יעד כשמעתיקים נתונים באותו אזור.
התדירות המינימלית בין עבודות העתקה היא 12 שעות.
אי אפשר להוסיף נתונים לטבלה עם או בלי חלוקה למחיצות בערכת נתוני היעד. אם אין שינויים בטבלת המקור, המערכת מדלגת על הטבלה. אם טבלת המקור מתעדכנת, טבלת היעד נחתכת לחלוטין ומוחלפת.
אם טבלה קיימת במערך נתוני המקור ובמערך נתוני היעד, והטבלה במקור לא השתנתה מאז ההעתקה האחרונה שהצליחה, המערכת מדלגת עליה. המערכת מדלגת על טבלת המקור גם אם תיבת הסימון החלפת טבלאות היעד מסומנת.
כשמבצעים חיתוך של טבלאות במערך הנתונים של היעד, עבודת ההעתקה של מערך הנתונים לא מזהה שינויים שבוצעו במשאבים במערך הנתונים של היעד לפני שהיא מתחילה. משימת ההעתקה של מערך הנתונים מחליפה את כל הנתונים במערך הנתונים של היעד, כולל הטבלאות והסכימה.
יכול להיות שהשינויים שבוצעו בטבלאות המקור אחרי שהתחילה משימת ההעתקה לא יופיעו בטבלת היעד.
העתקה של מערך נתונים לא אפשרי באזורי BigQuery Omni.
כדי להעתיק מערך נתונים לפרויקט בגבולות גזרה לשירות אחר של VPC Service Controls, צריך להגדיר את כללי התעבורה היוצאת הבאים:
בהגדרת גבולות הגזרה לשירות של VPC Service Controls בפרויקט היעד, ל-IAM principal צריכות להיות ה-methods הבאות:
bigquery.datasets.getbigquery.tables.listbigquery.tables.get,bigquery.tables.getData
בהגדרות של גבולות הגזרה לשירות ב-VPC Service Controls של פרויקט המקור, לישות המורשית (principal) של IAM שבה נעשה שימוש צריך להיות מוגדרת השיטה
All Methods.
אם תנסו לעדכן העברה של עותק של מערך נתונים שלא בבעלותכם, יכול להיות שהעדכון ייכשל ותופיע הודעת השגיאה הבאה:
Cannot modify restricted parameters without taking ownership of the transfer configuration.הבעלים של עותק מערך הנתונים הוא המשתמש שמשויך לעותק מערך הנתונים או המשתמש שיש לו גישה לחשבון השירות שמשויך לעותק מערך הנתונים. המשתמש המשויך מופיע בפרטי ההגדרה של העותק של מערך הנתונים. במאמר עדכון פרטי הכניסה מוסבר איך לעדכן את העותק של מערך הנתונים כדי לקבל בעלות. כדי לתת למשתמשים גישה לחשבון שירות, צריך להיות לכם התפקיד Service Account User.
הפרמטרים שהבעלים הגביל להעתקות של מערכי נתונים הם:
- פרויקט המקור
- מערך נתוני המקור
- מערך נתוני יעד
- החלפת ההגדרה של טבלת היעד
כל ההגבלות על העתקת טבלאות בין אזורים חלות.
העתקת מערך נתונים
בוחרים באחת מהאפשרויות הבאות:
המסוף
מפעילים את שירות העברת הנתונים ל-BigQuery למערך הנתונים של היעד.
ודאו שיש לכם את התפקידים הנדרשים.
אם אתם מתכוונים להגדיר התראות על הפעלת העברה ל-Pub/Sub (אפשרות 2 בהמשך השלבים האלה), אתם צריכים את ההרשאה
pubsub.topics.setIamPolicy.אם הגדרתם רק התראות באימייל, לא נדרשות הרשאות Pub/Sub. מידע נוסף זמין במאמר בנושא הפעלת התראות בשירות העברת נתונים ל-BigQuery.
יוצרים מערך נתונים ב-BigQuery באותו אזור או באזור אחר ממערך הנתונים של המקור.
אפשרות 1: שימוש בפונקציית ההעתקה של BigQuery
כדי ליצור העברה חד-פעמית, משתמשים בפונקציית ההעתקה של BigQuery:
עוברים לדף BigQuery.
בחלונית הימנית, לוחצים על כלי הניתוחים:

אם החלונית הימנית לא מוצגת, לוחצים על הרחבת החלונית הימנית כדי לפתוח אותה.
בחלונית Explorer, מרחיבים את הפרויקט, לוחצים על Datasets ובוחרים מערך נתונים.
בקטע פרטי מערך הנתונים, לוחצים על העתקה ומבצעים את הפעולות הבאות:
בשדה Dataset, יוצרים מערך נתונים חדש או בוחרים מזהה של מערך נתונים קיים מהרשימה.
השמות של מערכי הנתונים בפרויקט חייבים להיות ייחודיים. הפרויקט ומערך הנתונים יכולים להיות באזורים שונים, אבל לא כל האזורים תומכים בהעתקה של מערך נתונים בין אזורים.
בשדה מיקום מוצג המיקום של מערך נתוני המקור.
אופציונלי: כדי להחליף את הנתונים ואת הסכימה של טבלאות היעד בטבלאות המקור, מסמנים את התיבה החלפת טבלאות היעד. לשני הטבלאות, המקור והיעד, צריך להיות אותו סכימת חלוקה.
כדי להעתיק את מערך הנתונים, לוחצים על Copy (העתקה).
אפשרות 2: שימוש בשירות העברת נתונים ל-BigQuery
כדי לתזמן העתקות חוזרות ולהגדיר התראות באימייל או ב-Pub/Sub, משתמשים בשירות העברת הנתונים ל-BigQuery במסוף של פרויקט היעד: Google Cloud
עוברים לדף העברות נתונים.
לוחצים על יצירת העברה.
ברשימה מקור, בוחרים באפשרות העתקת מערך נתונים.
בשדה שם תצוגה, מזינים שם להרצת ההעברה.
בקטע Schedule options:
בקטע תדירות החזרה, בוחרים אפשרות לתדירות שבה רוצים להפעיל את ההעברה:
אם בוחרים באפשרות בהתאמה אישית, מזינים תדירות מותאמת אישית – לדוגמה,
every day 00:00. מידע נוסף מופיע במאמר בנושא עיצוב לוח הזמנים.בשדה Start date and run time, מזינים את התאריך והשעה שבהם רוצים להתחיל את ההעברה. אם בוחרים באפשרות Start now (התחלה מיידית), האפשרות הזו מושבתת.
בקטע הגדרות היעד, בוחרים מערך נתונים ליעד שבו רוצים לאחסן את נתוני ההעברה. אפשר גם ללחוץ על יצירת מערך נתונים חדש כדי ליצור מערך נתונים חדש לפני שבוחרים אותו להעברה הזו.
בקטע פרטים של מקור הנתונים, מזינים את הפרטים הבאים:
- בשדה Source dataset (מערך נתונים של המקור), מזינים את מזהה מערך הנתונים שרוצים להעתיק.
- בשדה פרויקט המקור, מזינים את מזהה הפרויקט של מערך נתוני המקור.
כדי להחליף גם את הנתונים וגם את הסכימה של טבלאות היעד בטבלאות המקור, מסמנים את תיבת הסימון החלפת טבלאות היעד. לשני הטבלאות, המקור והיעד, צריך להיות אותו סכימת חלוקה.
בתפריט Service Account בוחרים חשבון שירות מתוך חשבונות השירות שמשויכים לGoogle Cloud פרויקט. אתם יכולים לשייך לחשבון השירות את ההעברה במקום להשתמש בפרטי הכניסה של המשתמש. מידע נוסף על שימוש בחשבונות שירות בהעברות נתונים זמין במאמר שימוש בחשבונות שירות.
- אם נכנסתם באמצעות זהות מאוחדת, תצטרכו ליצור חשבון שירות כדי ליצור העברה. אם נכנסתם באמצעות חשבון Google, חשבון שירות להעברה הוא אופציונלי.
- לחשבון השירות צריכים להיות התפקידים הנדרשים.
אופציונלי: בקטע אפשרויות התראות, מבצעים את הפעולות הבאות:
לוחצים על Save.
BQ
מפעילים את שירות העברת הנתונים ל-BigQuery למערך הנתונים של היעד.
ודאו שיש לכם את התפקידים הנדרשים.
כדי ליצור מערך נתונים ב-BigQuery, משתמשים בפקודה
bq mkעם הדגל ליצירת מערך נתונים--datasetוהדגלlocation:bq mk \ --dataset \ --location=LOCATION \ PROJECT:DATASET
מחליפים את מה שכתוב בשדות הבאים:
-
LOCATION: המיקום שאליו רוצים להעתיק את מערך הנתונים -
PROJECT: מזהה הפרויקט של מערך הנתונים של היעד -
DATASET: השם של מערך הנתונים של היעד
-
כדי להעתיק מערך נתונים, משתמשים בפקודה
bq mkעם דגל יצירת ההעברה--transfer_configוהדגל--data_source. חובה להגדיר את הדגל--data_sourceלערךcross_region_copy. רשימה מלאה של הערכים התקינים לשימוש עם האפשרות--data_sourceמופיעה במאמר אפשרויות של transfer-config בחומר העזר לכלי שורת הפקודה של BigQuery.bq mk \ --transfer_config \ --project_id=PROJECT \ --data_source=cross_region_copy \ --target_dataset=DATASET \ --display_name=NAME \ --service_account_name=SERCICE_ACCOUNT \ --params='PARAMETERS'
מחליפים את מה שכתוב בשדות הבאים:
NAME: השם המוצג של עבודת ההעתקה או של הגדרות ההעברה
SERVICE_ACCOUNT: השם של חשבון השירות שמשמש לאימות ההעברה. חשבון השירות צריך להיות בבעלות אותוproject_idששימש ליצירת ההעברה, וצריכות להיות לו כל ההרשאות הנדרשות.
PARAMETERS: הפרמטרים של הגדרת ההעברה בפורמט JSONהפרמטרים של הגדרת העתקה של מערך נתונים כוללים את הפרטים הבאים:
-
source_dataset_id: המזהה של מערך נתוני המקור שרוצים להעתיק -
source_project_id: מזהה הפרויקט שבו נמצא מערך הנתונים של המקור -
overwrite_destination_table: דגל אופציונלי שמאפשר לחתוך את הטבלאות של עותק קודם ולרענן את כל הנתונים
לשני הטבלאות, המקור והיעד, צריך להיות אותו סכימת חלוקה.
-
בדוגמאות הבאות מוצג הפורמט של הפרמטרים, על סמך סביבת המערכת שלכם:
Linux: משתמשים במירכאות בודדות כדי להקיף את מחרוזת ה-JSON – לדוגמה:
'{"source_dataset_id":"mydataset","source_project_id":"mysourceproject","overwrite_destination_table":"true"}'שורת הפקודה של Windows: צריך להשתמש במירכאות כפולות כדי להקיף את מחרוזת ה-JSON, ולסמן בתו בריחה (escape) את המירכאות הכפולות במחרוזת באמצעות קו נטוי הפוך – לדוגמה:
"{\"source_dataset_id\":\"mydataset\",\"source_project_id\":\"mysourceproject\",\"overwrite_destination_table\":\"true\"}"PowerShell: משתמשים בגרש כדי לתחום את מחרוזת ה-JSON, ומסמנים בתו בריחה (escape) את המירכאות הכפולות במחרוזת באמצעות קו נטוי הפוך – לדוגמה:
'{\"source_dataset_id\":\"mydataset\",\"source_project_id\":\"mysourceproject\",\"overwrite_destination_table\":\"true\"}'
לדוגמה, הפקודה הבאה יוצרת הגדרת העתקה של מערך נתונים בשם
My Transferעם מערך נתונים יעד בשםmydatasetופרויקט עם המזההmyproject.bq mk \ --transfer_config \ --project_id=myproject \ --data_source=cross_region_copy \ --target_dataset=mydataset \ --display_name='My Transfer' \ --params='{ "source_dataset_id":"123_demo_eu", "source_project_id":"mysourceproject", "overwrite_destination_table":"true" }'
API
מפעילים את שירות העברת הנתונים ל-BigQuery למערך הנתונים של היעד.
ודאו שיש לכם את התפקידים הנדרשים.
כדי ליצור מערך נתונים ב-BigQuery, קוראים לשיטה
datasets.insertעם משאב מוגדר של מערך נתונים.כדי להעתיק מערך נתונים, משתמשים בשיטה
projects.locations.transferConfigs.createומספקים מופע של המשאבTransferConfig.
Java
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי Javaהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery Java API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
Python
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי Pythonהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery Python API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
מתקינים את לקוח Python עבור BigQuery Data Transfer API באמצעותpip install google-cloud-bigquery-datatransfer. לאחר מכן, יוצרים הגדרת העברה כדי להעתיק את מערך הנתונים.
כדי להימנע מעלויות אחסון נוספות, כדאי למחוק את מערך הנתונים הקודם.
הצגת משימות של העתקת מערכי נתונים
כדי לראות את הסטטוס ואת הפרטים של עבודת העתקה של מערך נתונים במסוףGoogle Cloud :
נכנסים לדף Data transfers במסוף Google Cloud .
בוחרים העברה שרוצים לראות את הפרטים שלה, ואז מבצעים את הפעולות הבאות:
בדף פרטי ההעברה, בוחרים בהרצת העברה.
כדי לרענן, לוחצים על רענון.
יצירה מחדש של מערכי נתונים במיקום אחר
כדי להעביר מערך נתונים באופן ידני ממיקום אחד למיקום אחר, פועלים לפי השלבים הבאים:
-
מייצאים את הנתונים מטבלאות BigQuery לקטגוריה של Cloud Storage.
אין חיובים על ייצוא נתונים מ-BigQuery, אבל יש חיובים על אחסון הנתונים המיוצאים ב-Cloud Storage. הייצוא ל-BigQuery כפוף למגבלות על משימות חילוץ.
-
מעתיקים או מעבירים את הנתונים מקטגוריית Cloud Storage של הייצוא לקטגוריה חדשה שיצרתם במיקום היעד. לדוגמה, אם אתם מעבירים את הנתונים מהאזור
USשכולל מספר אזורים לאזור טוקיוasia-northeast1, תצטרכו להעביר את הנתונים לקטגוריה שיצרתם בטוקיו. מידע על העברת אובייקטים ב-Cloud Storage זמין במאמר העתקה, שינוי שם והעברה של אובייקטים במסמכי Cloud Storage.העברת נתונים בין אזורים כרוכה בחיובים על תעבורת נתונים יוצאת (egress) ברשת ב-Cloud Storage.
-
יוצרים מערך נתונים חדש ב-BigQuery במיקום החדש, ואז טוענים את הנתונים מקטגוריה של Cloud Storage למערך הנתונים החדש.
לא תחויבו על טעינת הנתונים ל-BigQuery, אבל תחויבו על אחסון הנתונים ב-Cloud Storage עד שתמחקו את הנתונים או את הקטגוריה. בנוסף, תשלמו על אחסון הנתונים ב-BigQuery אחרי שהם ייטענו. טעינת נתונים לתוך BigQuery כפופה למגבלות של עבודות טעינה.
אפשר גם להשתמש ב- Cloud Composer כדי להעביר ולהעתיק מערכי נתונים גדולים באופן פרוגרמטי.
למידע נוסף על שימוש ב-Cloud Storage לאחסון ולהעברה של מערכי נתונים גדולים, אפשר לעיין במאמר בנושא שימוש ב-Cloud Storage עם Big Data.
אבטחת מערכי נתונים
מידע על בקרת גישה למערכי נתונים ב-BigQuery זמין במאמר בקרת גישה למערכי נתונים. מידע על הצפנת נתונים זמין במאמר הצפנה במנוחה.
מחיקה של מערכי נתונים
כשמוחקים מערך נתונים באמצעות מסוף Google Cloud , הטבלאות והתצוגות במערך הנתונים, כולל הנתונים שלהן, נמחקות באופן אוטומטי. עם זאת, כשמשתמשים בשיטה אחרת, צריך קודם לרוקן את מערך הנתונים או לציין דגלים, פרמטרים או מילות מפתח מתאימים שמכריחים את הסרת התוכן של מערך הנתונים.
אם תנסו למחוק מערך נתונים לא ריק בלי הדגלים או הפרמטרים המתאימים, הפעולה תיכשל ותוצג השגיאה הבאה:
Dataset project:dataset is still in use.
מחיקה של מערך נתונים יוצרת רשומה אחת של יומן ביקורת למחיקת מערך הנתונים. לא נוצרות רשומות נפרדות ביומן לכל טבלה שנמחקה במערך הנתונים.
כדי למחוק קבוצת נתונים, בוחרים באחת מהאפשרויות הבאות:
המסוף
עוברים לדף BigQuery.
בחלונית הימנית, לוחצים על כלי הניתוחים:

בחלונית Explorer, מרחיבים את הפרויקט, לוחצים על Datasets ואז לוחצים על מערך הנתונים.
בחלונית הפרטים, לוחצים על מחיקה.
בתיבת הדו-שיח מחיקת מערך נתונים, מקלידים
deleteבשדה ולוחצים על מחיקה.
SQL
כדי למחוק קבוצת נתונים, משתמשים בהצהרת DDL DROP SCHEMA.
בדוגמה הבאה נמחקת קבוצת נתונים בשם mydataset:
במסוף Google Cloud , עוברים לדף BigQuery.
מזינים את ההצהרה הבאה בעורך השאילתות:
DROP SCHEMA IF EXISTS mydataset;
כברירת מחדל, אפשר למחוק רק קבוצת נתונים ריקה. כדי למחוק קבוצת נתונים ואת כל התוכן שלה, משתמשים במילת המפתח
CASCADE:DROP SCHEMA IF EXISTS mydataset CASCADE;
לוחצים על הפעלה.
מידע נוסף על הרצת שאילתות זמין במאמר הרצת שאילתה אינטראקטיבית.
BQ
משתמשים בפקודה bq rm עם הדגל --dataset או -d (אופציונלי).
אם מערך הנתונים מכיל טבלאות, צריך להשתמש בדגל -r כדי להסיר את כל הטבלאות במערך הנתונים. אם משתמשים בדגל -r, אפשר להשמיט את הדגל --dataset או -d.
אחרי שמריצים את הפקודה, המערכת מבקשת אישור. אפשר להשתמש בדגל -f כדי לדלג על האישור.
אם מוחקים טבלה בפרויקט שאינו פרויקט ברירת המחדל, צריך להוסיף את מזהה הפרויקט לשם מערך הנתונים בפורמט הבא: PROJECT_ID:DATASET.
bq rm -r -f -d PROJECT_ID:DATASET
מחליפים את מה שכתוב בשדות הבאים:
-
PROJECT_ID: מזהה הפרויקט -
DATASET: השם של מערך הנתונים שרוצים למחוק
לדוגמה:
כדי להסיר מהפרויקט שמוגדר כברירת מחדל מערך נתונים בשם mydataset ואת כל הטבלאות שבו, מזינים את הפקודה הבאה: בפקודה נעשה שימוש בדגל -d.
bq rm -r -d mydataset
כשמופיעה בקשה, כותבים y ומקישים על Enter.
מזינים את הפקודה הבאה כדי להסיר את mydataset ואת כל הטבלאות שבו מ-myotherproject. בפקודה לא נעשה שימוש בדגל האופציונלי -d.
הדגל -f משמש לדילוג על האישור.
bq rm -r -f myotherproject:mydataset
אפשר להשתמש בפקודה bq ls כדי לוודא שמערך הנתונים נמחק.
API
מפעילים את השיטה datasets.delete כדי למחוק את מערך הנתונים, ומגדירים את הפרמטר deleteContents לערך true כדי למחוק את הטבלאות שבו.
C#
בדוגמת הקוד הבאה מוצג איך מוחקים מערך נתונים ריק.
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי C#הוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery C# API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
מתקינים את לקוח Python עבור BigQuery Data Transfer API באמצעותpip install google-cloud-bigquery-datatransfer. לאחר מכן, יוצרים הגדרת העברה כדי להעתיק את מערך הנתונים.
בדוגמת הקוד הבאה מוצגת מחיקה של מערך נתונים וכל התוכן שלו:
Go
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי Goהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery Go API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
מתקינים את לקוח Python עבור BigQuery Data Transfer API באמצעותpip install google-cloud-bigquery-datatransfer. לאחר מכן, יוצרים הגדרת העברה כדי להעתיק את מערך הנתונים.
Java
בדוגמת הקוד הבאה מוצג איך מוחקים מערך נתונים ריק.
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי Javaהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery Java API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
מתקינים את לקוח Python עבור BigQuery Data Transfer API באמצעותpip install google-cloud-bigquery-datatransfer. לאחר מכן, יוצרים הגדרת העברה כדי להעתיק את מערך הנתונים.
בדוגמת הקוד הבאה מוצגת מחיקה של מערך נתונים וכל התוכן שלו:
Node.js
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי Node.jsהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery Node.js API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
מתקינים את לקוח Python עבור BigQuery Data Transfer API באמצעותpip install google-cloud-bigquery-datatransfer. לאחר מכן, יוצרים הגדרת העברה כדי להעתיק את מערך הנתונים.
PHP
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי PHPהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery PHP API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
מתקינים את לקוח Python עבור BigQuery Data Transfer API באמצעותpip install google-cloud-bigquery-datatransfer. לאחר מכן, יוצרים הגדרת העברה כדי להעתיק את מערך הנתונים.
Python
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי Pythonהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery Python API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
מתקינים את לקוח Python עבור BigQuery Data Transfer API באמצעותpip install google-cloud-bigquery-datatransfer. לאחר מכן, יוצרים הגדרת העברה כדי להעתיק את מערך הנתונים.
Ruby
בדוגמת הקוד הבאה מוצג איך מוחקים מערך נתונים ריק.
לפני שמנסים את הדוגמה הזו, צריך לפעול לפי Rubyהוראות ההגדרה שבמדריך למתחילים של BigQuery באמצעות ספריות לקוח. מידע נוסף מופיע במאמרי העזרה של BigQuery Ruby API.
כדי לבצע אימות ב-BigQuery, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לספריות לקוח.
מתקינים את לקוח Python עבור BigQuery Data Transfer API באמצעותpip install google-cloud-bigquery-datatransfer. לאחר מכן, יוצרים הגדרת העברה כדי להעתיק את מערך הנתונים.
בדוגמת הקוד הבאה מוצגת מחיקה של מערך נתונים וכל התוכן שלו:
שחזור טבלאות ממערכי נתונים שנמחקו
אפשר לשחזר טבלאות מקבוצת נתונים שנמחקה, אם הן נמצאות בחלון הזמן של האפשרות 'חזרה בזמן' של קבוצת הנתונים. כדי לשחזר את כל מערך הנתונים, אפשר לעיין במאמר בנושא שחזור של מערכי נתונים שנמחקו.
- יוצרים מערך נתונים עם אותו שם ובאותו מיקום כמו המערך המקורי.
- בוחרים חותמת זמן מלפני המחיקה של מערך הנתונים המקורי בפורמט של אלפיות השנייה מאז התקופה – לדוגמה,
1418864998000. מעתיקים את הטבלה
originaldataset.table1בזמן1418864998000למערך הנתונים החדש:bq cp originaldataset.table1@1418864998000 mydataset.mytable
כדי למצוא את השמות של הטבלאות הלא ריקות שהיו במערך הנתונים שנמחק, צריך לשלוח שאילתה לתצוגה
INFORMATION_SCHEMA.TABLE_STORAGEשל מערך הנתונים בתוך חלון הזמן של האפשרות 'חזרה בזמן'.
שחזור של מערכי נתונים שנמחקו
כדי ללמוד איך לשחזר (או לבטל את המחיקה) של קבוצת נתונים שנמחקה, אפשר לעיין במאמר שחזור של קבוצות נתונים שנמחקו.
מכסות
מידע על מכסות העתקה זמין במאמר בנושא העתקת משימות.
נתוני השימוש במשימות העתקה זמינים ב-INFORMATION_SCHEMA. במאמר תצוגת JOBS מוסבר איך לשלוח שאילתות לתצוגה INFORMATION_SCHEMA.JOBS.
תמחור
למידע על המחירים של העתקת מערכי נתונים, אפשר לעיין במחירים של רפליקציית נתונים.
BigQuery שולח נתונים דחוסים להעתקה בין אזורים, כך שהנתונים שמחויבים עליהם עשויים להיות קטנים יותר מהגודל בפועל של מערך הנתונים. כאן תוכלו לקרוא מידע נוסף על התמחור ב-BigQuery.