הפעלת Workflows באמצעות יומני ביקורת של Cloud (ה-CLI של gcloud)
במדריך למתחילים הזה נסביר איך להפעיל תהליך עבודה באמצעות טריגר Eventarc שמקבל אירועים מיומני ביקורת ב-Cloud מ-BigQuery. ב-BigQuery מתארחים מערכי נתונים ציבוריים שאפשר לגשת אליהם ולשלב אותם באפליקציות שלכם. הטריגר מפעיל את זרימת העבודה על ידי האזנה למשימת BigQuery שמריצה שאילתה על מערך נתונים ציבורי. לאחר מכן, הוא מעביר את האירועים כארגומנטים של זמן ריצה אל זרימת העבודה של היעד.
אפשר להשלים את המדריך למתחילים הזה באמצעות Google Cloud CLI.
- אפשר להשתמש בתכונה 'תהליכי עבודה' כדי ליצור ולפרוס תהליך עבודה שמחלץ נתונים מאירוע ומחזיר אותם.
- יצירת טריגר Eventarc שמקשר בין משימת BigQuery לבין מקלט אירועים של Workflows.
- מפיקים אירוע על ידי הרצת משימת BigQuery באמצעות כלי שורת הפקודה של BigQuery. האירוע הזה מועבר כארגומנט של זמן ריצה לתהליך העבודה של היעד.
- צפייה בנתוני האירועים בפלט של הפעלת תהליך העבודה.
לפני שמתחילים
יכול להיות שהגבלות אבטחה שהוגדרו בארגון שלכם ימנעו מכם להשלים את השלבים הבאים. מידע לפתרון בעיות זמין במאמר פיתוח אפליקציות בסביבה מוגבלת. Google Cloud
- נכנסים לחשבון Google Cloud . אם אתם משתמשים חדשים ב- Google Cloud, צרו חשבון כדי שתוכלו להעריך את הביצועים של המוצרים שלנו בתרחישים מהעולם האמיתי. לקוחות חדשים מקבלים בחינם גם קרדיט בשווי 300$ להרצה, לבדיקה ולפריסה של עומסי העבודה.
-
התקינו את ה-CLI של Google Cloud.
-
אם אתם משתמשים בספק זהויות חיצוני (IdP), קודם אתם צריכים להיכנס ל-CLI של gcloud באמצעות המאגר המאוחד לניהול זהויות.
-
כדי לאתחל את ה-CLI של gcloud, הריצו את הפקודה הבאה:
gcloud init -
יוצרים או בוחרים Google Cloud פרויקט.
תפקידים שנדרשים כדי לבחור או ליצור פרויקט
- Select a project: כדי לבחור פרויקט לא צריך תפקיד IAM ספציפי – אפשר לבחור כל פרויקט שקיבלתם בו תפקיד.
-
יצירת פרויקט: כדי ליצור פרויקט, צריך את התפקיד Project Creator (יצירת פרויקטים) (
roles/resourcemanager.projectCreator), שכולל את ההרשאהresourcemanager.projects.create. איך מקצים תפקידים
-
יוצרים Google Cloud פרויקט:
gcloud projects create PROJECT_ID
מחליפים את
PROJECT_IDבשם של פרויקט Google Cloud שיוצרים. -
בוחרים את הפרויקט שיצרתם: Google Cloud
gcloud config set project PROJECT_ID
מחליפים את
PROJECT_IDבשם הפרויקט ב- Google Cloud .
-
התקינו את ה-CLI של Google Cloud.
-
אם אתם משתמשים בספק זהויות חיצוני (IdP), קודם אתם צריכים להיכנס ל-CLI של gcloud באמצעות המאגר המאוחד לניהול זהויות.
-
כדי לאתחל את ה-CLI של gcloud, הריצו את הפקודה הבאה:
gcloud init -
יוצרים או בוחרים Google Cloud פרויקט.
תפקידים שנדרשים כדי לבחור או ליצור פרויקט
- Select a project: כדי לבחור פרויקט לא צריך תפקיד IAM ספציפי – אפשר לבחור כל פרויקט שקיבלתם בו תפקיד.
-
יצירת פרויקט: כדי ליצור פרויקט, צריך את התפקיד Project Creator (יצירת פרויקטים) (
roles/resourcemanager.projectCreator), שכולל את ההרשאהresourcemanager.projects.create. איך מקצים תפקידים
-
יוצרים Google Cloud פרויקט:
gcloud projects create PROJECT_ID
מחליפים את
PROJECT_IDבשם של פרויקט Google Cloud שיוצרים. -
בוחרים את הפרויקט שיצרתם: Google Cloud
gcloud config set project PROJECT_ID
מחליפים את
PROJECT_IDבשם הפרויקט ב- Google Cloud .
- עדכון רכיבים של
gcloud:gcloud components update
- נכנסים באמצעות החשבון:
gcloud auth login
- מפעילים את ממשקי ה-API של Compute Engine, Eventarc, Pub/Sub ו-Workflows.
gcloud services enable \ compute.googleapis.com \ eventarc.googleapis.com \ pubsub.googleapis.com \ workflows.googleapis.com \ workflowexecutions.googleapis.com
- מגדירים את משתני ההגדרה שמשמשים במדריך הזה:
export WORKFLOW_LOCATION=us-central1 export TRIGGER_LOCATION=us-central1 export PROJECT_ID=PROJECT_ID gcloud config set project ${PROJECT_ID} gcloud config set workflows/location ${WORKFLOW_LOCATION} gcloud config set eventarc/location ${TRIGGER_LOCATION}
-
אם אתם יוצרי הפרויקט, מוקצה לכם תפקיד הבעלים הבסיסי (
roles/owner). כברירת מחדל, תפקיד ניהול הזהויות והרשאות הגישה (IAM) הזה כולל את ההרשאות שנדרשות לגישה מלאה לרוב המשאבים Google Cloud, ואפשר לדלג על השלב הזה.אם אתם לא יוצרי הפרויקט, צריך להעניק את ההרשאות הנדרשות בחשבון המשתמש המתאים בפרויקט. לדוגמה, חשבון משתמש יכול להיות חשבון Google (למשתמשי קצה) או חשבון שירות (לאפליקציות ולעומסי עבודה ממוחשבים). מידע נוסף זמין בדף תפקידים והרשאות של יעד האירוע.
ההרשאות הנדרשות
כדי לקבל את ההרשאות שדרושות לביצוע ההפעלה המהירה הזו, צריך לבקש מהאדמין להקצות לכם את תפקידי ה-IAM הבאים בפרויקט:
- אדמין ב-Eventarc (
roles/eventarc.admin) - בעל הרשאת גישה לתצוגת יומנים (
roles/logging.viewAccessor) - אדמין IAM בפרויקט (
roles/resourcemanager.projectIamAdmin) - אדמין בחשבון שירות (
roles/iam.serviceAccountAdmin) - משתמש בחשבון שירות (
roles/iam.serviceAccountUser) - אדמין Service Usage (
roles/serviceusage.serviceUsageAdmin) - אדמין ב-Workflows (
roles/workflows.admin)
להסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.
יכול להיות שאפשר לקבל את ההרשאות הנדרשות גם באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש.
- אדמין ב-Eventarc (
חשוב לשים לב לחשבון השירות שמוגדר כברירת מחדל ב-Compute Engine, כי תצטרכו לצרף אותו לטריגר של Eventarc כדי לייצג את הזהות של הטריגר למטרות בדיקה. חשבון השירות הזה נוצר באופן אוטומטי אחרי שמפעילים או משתמשים בשירות Google Cloud שמשתמש ב-Compute Engine, והוא בפורמט האימייל הבא:
PROJECT_NUMBER-compute@developer.gserviceaccount.com
מחליפים את
PROJECT_NUMBERבמספר הפרויקט ב- Google Cloud. אפשר לראות את מספר הפרויקט בדף Welcome במסוף Google Cloud או על ידי הרצת הפקודה הבאה:gcloud projects describe PROJECT_ID --format='value(projectNumber)'
בסביבות ייצור, מומלץ מאוד ליצור חשבון שירות חדש ולהקצות לו תפקיד IAM אחד או יותר שמכילים את ההרשאות המינימליות הנדרשות, ולפעול לפי העיקרון של הרשאות מינימליות.
- מקצים את התפקיד 'מקבל אירועים ב-Eventarc' (
roles/eventarc.eventReceiver) בפרויקט לחשבון השירות שמוגדר כברירת מחדל ב-Compute Engine, כדי שהטריגר של Eventarc יוכל לקבל אירועים מספקי אירועים.gcloud projects add-iam-policy-binding PROJECT_ID \ --member=serviceAccount:PROJECT_NUMBER-compute@developer.gserviceaccount.com \ --role=roles/eventarc.eventReceiver
- מעניקים את התפקיד 'הפעלת Workflows' (
roles/workflows.invoker) בפרויקט לחשבון השירות שמוגדר כברירת מחדל ב-Compute Engine, כדי שלחשבון תהיה הרשאה להפעיל את זרימת העבודה.gcloud projects add-iam-policy-binding PROJECT_ID \ --member=serviceAccount:PROJECT_NUMBER-compute@developer.gserviceaccount.com \ --role=roles/workflows.invoker
- מעניקים את התפקיד 'כותב יומנים' (
roles/logging.logWriter) בפרויקט לחשבון השירות שמוגדר כברירת מחדל ב-Compute Engine, כדי שתהליך העבודה יוכל לשלוח יומנים ל-Cloud Logging.gcloud projects add-iam-policy-binding PROJECT_ID \ --member=serviceAccount:PROJECT_NUMBER-compute@developer.gserviceaccount.com \ --role=roles/logging.logWriter
- אם הפעלתם את סוכן השירות של Cloud Pub/Sub ב-8 באפריל 2021 או לפני כן, כדי לתמוך בבקשות push מאומתות של Pub/Sub, צריך להקצות לסוכן השירות את התפקיד 'יצירת אסימונים בחשבון שירות' (
roles/iam.serviceAccountTokenCreator). אחרת, התפקיד הזה מוענק כברירת מחדל:gcloud projects add-iam-policy-binding PROJECT_ID \ --member=serviceAccount:service-PROJECT_NUMBER@gcp-sa-pubsub.iam.gserviceaccount.com \ --role=roles/iam.serviceAccountTokenCreator
יצירה ופריסה של תהליך עבודה
יצירה ופריסה של תהליך עבודה שמופעל כשמשימה ב-BigQuery מסתיימת ושולחת בקשת HTTP לתהליך העבודה.
- פותחים טרמינל או Cloud Shell.
- בספריית הבית, יוצרים קובץ חדש בשם
myFirstWorkflow.yamlאוmyFirstWorkflow.json. - מעתיקים את הקוד הבא ומדביקים אותו בקובץ החדש, ואז שומרים את הקובץ:
YAML
main: params: [event] steps: - log_event: call: sys.log args: text: ${event} severity: INFO - extract_data: assign: - data: ${event.data.protoPayload} - return_data: return: data: ${data}
JSON
{ "main": { "params": [ "event" ], "steps": [ { "log_event": { "call": "sys.log", "args": { "text": "${event}", "severity": "INFO" } } }, { "extract_data": { "assign": [ { "data": "${event.data.protoPayload}" } ] } }, { "return_data": { "return": { "data": "${data}" } } } ] } }
- פריסת תהליך העבודה:
export MY_WORKFLOW=myFirstWorkflow gcloud workflows deploy ${MY_WORKFLOW} --source=myFirstWorkflow.yaml
מחליפים את
.yamlב-.jsonאם העתקתם את גרסת ה-JSON של תהליך העבודה לדוגמה.
יצירת טריגר Eventarc
כדי ליצור טריגר Eventarc שמנתב אירועים מ-BigQuery ליעד Workflows, מריצים את הפקודה gcloud eventarc triggers create.
יוצרים טריגר שמסנן אירועים ב-BigQuery:
gcloud eventarc triggers create events-cal-trigger \ --destination-workflow=${MY_WORKFLOW} \ --destination-workflow-location=${WORKFLOW_LOCATION} \ --event-filters="type=google.cloud.audit.log.v1.written" \ --event-filters="serviceName=bigquery.googleapis.com" \ --event-filters="methodName=google.cloud.bigquery.v2.JobService.InsertJob" \ --service-account="PROJECT_NUMBER-compute@developer.gserviceaccount.com"
הפעולה הזו יוצרת טריגר בשם
events-cal-trigger.שימו לב: כשיוצרים טריגר Eventarc בפעם הראשונה בפרויקט Google Cloud , יכול להיות שיהיה עיכוב בהקצאת סוכן השירות של Eventarc. בדרך כלל אפשר לפתור את הבעיה הזו על ידי ניסיון ליצור את הטריגר מחדש. מידע נוסף זמין במאמר בנושא שגיאות שקשורות לסירוב הרשאה.
כדי לוודא ש-
events-cal-triggerנוצר בהצלחה, מריצים את הפקודה:gcloud eventarc triggers describe events-cal-trigger --location=${TRIGGER_LOCATION}
הפלט מציג את שעת היצירה והמיקום של הטריגר, והוא אמור להיות דומה לזה:
createTime: '2021-10-14T15:15:43.872360951Z' [...] name: projects/PROJECT_ID/locations/us-central1/triggers/events-cal-trigger
יצירה והצגה של אירוע
מריצים משימת BigQuery באמצעות כלי שורת הפקודה של BigQuery כדי ליצור אירועים ולהפעיל את תהליך העבודה.
כדי להפעיל את תהליך העבודה, מריצים משימת BigQuery שמאפשרת גישה למערך נתונים ציבורי ושליפת מידע ממנו:
bq query --nouse_legacy_sql \ 'SELECT COUNT(*) FROM `bigquery-public-data`.samples.shakespeare'
האירועים שנוצרו מועברים כארגומנטים של זמן ריצה לתהליך העבודה, שמחזיר את נתוני המטען הייעודי כתוצאה מהרצת תהליך העבודה.
כדי לוודא שהפעלתם את תהליך העבודה, מציגים את שתי ההרצות האחרונות שלו:
gcloud workflows executions list ${MY_WORKFLOW} --limit=2
שתי הרצות של זרימת העבודה מופעלות על ידי משימת BigQuery. (אירוע אחד מסמן את שינוי התפקיד, והשני את הוספת התפקיד עצמו). הפלט מציג
NAMEו-STATEששווים ל-SUCCEEDEDלכל אחת מההרצות, והוא אמור להיראות כך:NAME: projects/218898424763/locations/us-central1/workflows/myFirstWorkflow/executions/a073ad6a-c76b-4437-8d39-2ab3ade289d2 STATE: SUCCEEDED START_TIME: 2024-02-06T14:16:14.390549813Z END_TIME: 2024-02-06T14:16:14.870102511Z NAME: projects/218898424763/locations/us-central1/workflows/myFirstWorkflow/executions/35d7c730-7ba5-4055-afee-c04ed706b179 STATE: SUCCEEDED START_TIME: 2024-02-06T14:16:14.389882601Z END_TIME: 2024-02-06T14:16:14.829942525Z
שימו לב שבפלט,
a073ad6a-c76b-4437-8d39-2ab3ade289d2מהשדהNAMEהוא המזהה של הרצת תהליך העבודה. מעתיקים את מזהה ההפעלה כדי להשתמש בו בשלב הבא.כדי לראות את סטטוס ההפעלה, מריצים את הפקודה הבאה:
gcloud workflows executions describe WORKFLOW_EXECUTION_ID --workflow=${MY_WORKFLOW}
מחליפים את
WORKFLOW_EXECUTION_IDבמזהה של הרצת זרימת העבודה שתואמת לזמן שבו הסתיימה העבודה ב-BigQuery.הפלט אמור להיראות כך:
argument: [...] duration: 0.277917625s endTime: '2024-02-06T14:16:14.870102511Z' name: projects/218898424763/locations/us-central1/workflows/myFirstWorkflow/executions/a073ad6a-c76b-4437-8d39-2ab3ade289d2 result: '{"data": [...]}' startTime: '2024-02-06T14:16:14.390549813Z' state: SUCCEEDEDמוודאים ש
startTimeשבו משימת BigQuery הסתיימה וSTART_TIMEשל הפעלת תהליך העבודה תואמים.
יצרתם בהצלחה אירוע ב-BigQuery שהפעיל מקלט אירועים ב-Workflows באמצעות Eventarc.
הסרת המשאבים
- מחיקת תהליך העבודה שיצרתם:
כשמוצגת השאלה אם אתם רוצים להמשיך, מזיניםgcloud workflows delete ${MY_WORKFLOW}
y. - מחיקת הטריגר שיצרתם:
gcloud eventarc triggers delete events-cal-trigger
- אפשר גם למחוק את הפרויקט Google Cloud כדי להימנע מחיובים. אם מוחקים את הפרויקט ב- Google Cloud , החיוב על כל המשאבים שנעשה בהם שימוש באותו פרויקט יופסק.
כדי למחוק Google Cloud פרויקט:
gcloud projects delete PROJECT_ID