מבוא לשאילתות מתמשכות

במסמך הזה מתוארות שאילתות רציפות ב-BigQuery.

שאילתות מתמשכות ב-BigQuery הן הצהרות SQL שמופעלות באופן רציף. שאילתות רציפות מאפשרות לכם לנתח נתונים נכנסים ב-BigQuery בזמן אמת. אפשר להוסיף את שורות הפלט שנוצרות על ידי שאילתה מתמשכת לטבלה ב-BigQuery או לייצא אותן ל-Pub/Sub, ל-Bigtable או ל-Spanner. שאילתות רציפות יכולות לעבד נתונים שנכתבו בטבלאות BigQuery רגילות באחת מהשיטות הבאות:

אפשר להשתמש בשאילתות רציפות כדי לבצע משימות שרגישות לזמן, כמו יצירת תובנות ופעולה מיידית על סמך התובנות, הפעלת הסקה של למידת מכונה (ML) בזמן אמת ושכפול נתונים בפלטפורמות אחרות. כך תוכלו להשתמש ב-BigQuery כמנוע לעיבוד נתונים מבוסס-אירועים ללוגיקת ההחלטות של האפליקציה.

התרשים הבא מציג תהליכי עבודה נפוצים של שאילתות מתמשכות:

דיאגרמה שממחישה תהליכי עבודה נפוצים של שאילתות מתמשכות ב-BigQuery, כולל הטמעת נתונים, עיבוד וייצוא ליעדים כמו Bigtable ו-Pub/Sub.

תרחישים לדוגמה

אלה כמה תרחישי שימוש נפוצים שבהם כדאי להשתמש בשאילתות רציפות:

  • שירותים של אינטראקציה מותאמת אישית עם לקוחות: שימוש ב-AI גנרטיבי ליצירת הודעות מותאמות אישית לכל אינטראקציה עם לקוח.
  • זיהוי אנומליות: בניית פתרונות שמאפשרים לכם לבצע זיהוי אנומליות ואיומים על נתונים מורכבים בזמן אמת, כדי שתוכלו להגיב לבעיות מהר יותר.
  • צינורות עיבוד נתונים מותאמים אישית שמבוססים על אירועים: אפשר להשתמש בשילוב של שאילתה מתמשכת עם Pub/Sub כדי להפעיל אפליקציות במורד הזרם על סמך נתונים נכנסים.
  • העשרת נתונים וחילוץ ישויות: אפשר להשתמש בשאילתות רציפות כדי לבצע העשרה וטרנספורמציה של נתונים בזמן אמת באמצעות פונקציות SQL ומודלים של ML.
  • הפוך ETL: ביצוע הפוך ETL בזמן אמת למערכות אחסון אחרות שמתאימות יותר להצגת אפליקציות עם זמן אחזור נמוך. לדוגמה, ניתוח או שיפור של נתוני אירועים שנכתבים ב-BigQuery, ואז העברתם בסטרימינג ל-Bigtable או ל-Spanner לצורך הצגה באפליקציה.

פעולות נתמכות

הפעולות הבאות נתמכות בשאילתות רציפות:

הרשאה

Google Cloud אסימוני הגישה שמשמשים להרצת משימות של שאילתות מתמשכות, כוללים אורך חיים (TTL) של יומיים כשהם נוצרים על ידי חשבון משתמש. לכן, משימות כאלה מפסיקות לפעול אחרי יומיים. אסימוני הגישה שנוצרים על ידי חשבונות שירות יכולים לפעול למשך זמן ארוך יותר, אבל הם עדיין צריכים לעמוד בדרישות של זמן הריצה המקסימלי של השאילתה. מידע נוסף זמין במאמר הפעלת שאילתה מתמשכת באמצעות חשבון שירות.

מיקומים

רשימת האזורים הנתמכים זמינה במאמר מיקומים של שאילתות מתמשכות ב-BigQuery.

מגבלות

ההגבלות הבאות חלות על שאילתות מתמשכות:

מגבלות על הזמנות

  • כדי להריץ שאילתות רציפות, צריך ליצור הזמנות במהדורת Enterprise או במהדורת Enterprise Plus. שאילתות רציפות לא תומכות במודל החיוב על פי דרישה.
  • כשיוצרים CONTINUOUS הקצאת הזמנה, ההזמנה המשויכת מוגבלת ל-500 משבצות לכל היותר. כדי לבקש להגדיל את המגבלה הזו, אפשר לפנות לכתובת bq-continuous-queries-feedback@google.com.
  • אי אפשר ליצור הקצאת הזמנה שמשתמשת בסוג עבודה שונה באותה הזמנה כמו הקצאת הזמנה של שאילתה מתמשכת.
  • אי אפשר להגדיר את הבו-זמניות של שאילתה מתמשכת. ‫BigQuery קובע באופן אוטומטי את מספר השאילתות המתמשכות שיכולות לפעול בו-זמנית, על סמך הקצאות הזמנות זמינות שמשתמשות בסוג העבודה CONTINUOUS.
  • כשמריצים כמה שאילתות רציפות באמצעות אותה הזמנה, יכול להיות שהמשאבים הזמינים לא יחולקו באופן הוגן בין המשימות השונות, כפי שמוגדר בהוגנות ב-BigQuery.

התאמה אוטומטית לעומס של מיקומי מודעות

שאילתות מתמשכות יכולות להשתמש בהתאמה אוטומטית לעומס של משבצות כדי לשנות באופן דינמי את גודל הקיבולת שהוקצתה בהתאם לעומס העבודה. ככל שעומס העבודה של השאילתות הרציפות גדל או קטן, BigQuery משנה את יחידות הקיבולת באופן דינמי.

אחרי שמתחילים להריץ שאילתה רציפה, היא מאזינה באופן פעיל לנתונים נכנסים, וזה צורך משאבי משבצות. הזמנה עם שאילתה מתמשכת פעילה לא מצטמצמת לאפס משבצות, אבל שאילתה מתמשכת בלי פעילות שמיועדת בעיקר להאזנה לנתונים נכנסים צפויה לצרוך כמות מינימלית של משבצות, בדרך כלל משבצת אחת.

שיתוף משבצות זמן פנויות

שאילתות מתמשכות יכולות להשתמש בשיתוף של משבצות זמן פנויות כדי לשתף משאבים של משבצות זמן לא בשימוש עם הזמנות אחרות וסוגי משימות.

  • עדיין נדרש CONTINUOUS הקצאת הזמנה כדי להריץ שאילתה מתמשכת, ואי אפשר להסתמך רק על משבצות זמן פנויות מהזמנות אחרות. לכן, הקצאת הזמנה של CONTINUOUS מחייבת הגדרת בסיס של משבצות זמן שאינו אפס או הגדרת קנה מידה אוטומטי של משבצות זמן שאינו אפס.
  • אפשר לשתף רק משבצות זמן בסיסיות פנויות או משבצות זמן שהוקצו מתוך הקצאת הזמנה של CONTINUOUS. אי אפשר לשתף משבצות שגודלן משתנה אוטומטית כמשבצות פנויות להזמנות אחרות.

תמחור

שאילתות רציפות משתמשות בתמחור של קיבולת מחשוב ב-BigQuery, שנמדדת ביחידות קיבולת (Slot). כדי להריץ שאילתות רציפות, צריך הזמנה שמשתמשת במהדורות Enterprise או Enterprise Plus, והקצאת הזמנה שמשתמשת בסוג המשימה CONTINUOUS.

השימוש במשאבים אחרים של BigQuery, כמו הטמעה ואחסון של נתונים, מחויב לפי התעריפים שמופיעים בתמחור של BigQuery.

השימוש בשירותים אחרים שמקבלים תוצאות של שאילתות מתמשכות או שמתבצעת אליהם קריאה במהלך העיבוד של שאילתות מתמשכות, מחויב בתעריפים שפורסמו עבור השירותים האלה. למידע על התמחור של שירותים אחרים של Google Cloud שאילתות רציפות, אפשר לעיין בנושאים הבאים:

המאמרים הבאים

אפשר לנסות ליצור שאילתה מתמשכת.