יצירה של טבלה עם הפעלה של זרם שינויים ותיעוד של שינויים
במאמר הזה מוסבר איך להגדיר טבלת Bigtable עם הפעלה של זרם שינויים, להריץ צינור של זרם שינויים, לבצע שינויים בטבלה ואז לראות את השינויים בזרם.
לפני שמתחילים
-
בדף לבחירת הפרויקט במסוף Google Cloud , בוחרים פרויקט ב- Google Cloud או יוצרים אותו.
תפקידים שנדרשים כדי לבחור או ליצור פרויקט
- Select a project: כדי לבחור פרויקט לא צריך תפקיד IAM ספציפי – אפשר לבחור כל פרויקט שקיבלתם בו תפקיד.
-
יצירת פרויקט: כדי ליצור פרויקט, צריך את התפקיד Project Creator (יצירת פרויקטים) (
roles/resourcemanager.projectCreator), שכולל את ההרשאהresourcemanager.projects.create. איך מקצים תפקידים
מפעילים את ממשקי ה-API Dataflow, Cloud Bigtable API ו-Cloud Bigtable Admin API.
תפקידים שנדרשים להפעלת ממשקי API
כדי להפעיל ממשקי API, צריך את תפקיד ה-IAM 'אדמין של Service Usage' (
roles/serviceusage.serviceUsageAdmin), שכולל את ההרשאהserviceusage.services.enable. איך מקצים תפקידים-
במסוף Google Cloud , מפעילים את Cloud Shell.
יצירת טבלה עם הפעלה של שינוי נתונים
נכנסים לדף Instances של Bigtable במסוף Google Cloud .
לוחצים על המזהה של המופע שבו משתמשים במדריך למתחילים הזה.
אם אין לכם מכונה זמינה, אתם יכולים ליצור מכונה עם הגדרות ברירת המחדל באזור שקרוב אליכם.
בחלונית הניווט הימנית, לוחצים על טבלאות.
לוחצים על יצירת טבלה.
נותנים לטבלה את השם
change-streams-quickstart.מוסיפים קבוצת עמודות בשם
cf.בוחרים באפשרות הפעלת מקור נתונים לשינויים.
לוחצים על יצירה.
אתחול צינור נתונים כדי לתעד את זרם השינויים
ב-Cloud Shell, מריצים את הפקודות הבאות כדי להוריד את הקוד ולהריץ אותו.
git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git cd java-docs-samples/bigtable/beam/change-streams mvn compile exec:java -Dexec.mainClass=ChangeStreamsHelloWorld \ "-Dexec.args=--project=PROJECT_ID --bigtableProjectId=PROJECT_ID \ --bigtableInstanceId=BIGTABLE_INSTANCE_ID --bigtableTableId=change-streams-quickstart \ --runner=dataflow --region=BIGTABLE_REGION --experiments=use_runner_v2"מחליפים את מה שכתוב בשדות הבאים:
- PROJECT_ID: מזהה הפרויקט שבו אתם משתמשים
- BIGTABLE_INSTANCE_ID: המזהה של המופע שיכיל את הטבלה החדשה
- BIGTABLE_REGION: האזור שבו נמצאת מכונת Bigtable, למשל
us-east5
נכנסים לדף Dataflow במסוף Google Cloud .
לוחצים על העבודה עם שם שמתחיל ב-changestreamquickstart.
בתחתית המסך, לוחצים על הצגה כדי לפתוח את חלונית היומנים.
לוחצים על Worker logs (יומני עובדים) כדי לעקוב אחרי הפלט של מקור הנתונים.
ב-Cloud Shell, כותבים נתונים ל-Bigtable כדי לראות את התהליך של מקור הנתונים לשינויים.
cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ import change-streams-quickstart quickstart-data.csv column-family=cfב Google Cloud מסוף, מוודאים שהערך של חומרה מוגדר ל-
Infoלפחות.פלט יומן העובד מכיל את השורה הבאה:
Change captured: user123#2023,USER,SetCell,cf,col1,abc Change captured: user546#2023,USER,SetCell,cf,col1,def Change captured: user789#2023,USER,SetCell,cf,col1,ghi
הסרת המשאבים
כדי לא לצבור חיובים לחשבון Google Cloud על המשאבים שבהם השתמשתם בדף הזה, פועלים לפי השלבים הבאים:
השבתת עדכוני התוכן בטבלה
gcloud bigtable instances tables update change-streams-quickstart --instance=BIGTABLE_INSTANCE_ID \ --clear-change-stream-retention-periodמחיקת הטבלה
change-streams-quickstart:cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID deletetable change-streams-quickstartעוצרים את צינור עיבוד הנתונים של שינוי הנתונים:
נכנסים לדף Jobs ב-Dataflow במסוף Google Cloud .
בוחרים את משימת הסטרימינג מרשימת המשימות.
בניווט, לוחצים על הפסקה.
בתיבת הדו-שיח Stop job (הפסקת העבודה), מבטלים את הצינור ולוחצים על Stop job (הפסקת העבודה).
אופציונלי: אם יצרתם מופע חדש לצורך המדריך הזה למתחילים, אתם יכולים למחוק אותו:
cbt deleteinstance BIGTABLE_INSTANCE_ID