סקירה כללית על BigQuery

‫BigQuery היא פלטפורמת נתונים מנוהלת לחלוטין שמוכנה לשימוש ב-AI. היא עוזרת לכם לנהל ולנתח את הנתונים שלכם באמצעות תכונות מובנות כמו למידת מכונה, חיפוש, ניתוח גיאוספציאלי ובינה עסקית. הארכיטקטורה ללא שרת (serverless) של BigQuery מאפשרת לכם להשתמש בשפות כמו SQL ו-Python כדי לענות על השאלות הכי חשובות של הארגון, בלי שתצטרכו לנהל את התשתית.

‫BigQuery מספק דרך אחידה לעבודה עם נתונים מובנים ולא מובנים, ותומך בפורמטים פתוחים של טבלאות כמו Apache Iceberg, ‏ Delta ו-Apache Hudi. הזרמת נתונים ב-BigQuery תומכת בהטמעה ובניתוח רציפים של נתונים, ומנוע הניתוח המבוזר והניתן להרחבה של BigQuery מאפשר לכם להריץ שאילתות על טרה-בייט של נתונים בשניות ועל פטה-בייט של נתונים בדקות.

ל-BigQuery יש יכולות מובנות של ניהול נתונים שמאפשרות לכם לגלות ולסדר נתונים, ולנהל מטא-נתונים ואיכות נתונים. באמצעות תכונות כמו חיפוש סמנטי ושיוך נתונים למקור, אתם יכולים למצוא ולאמת נתונים רלוונטיים לניתוח. אתם יכולים לשתף נתונים ונכסי AI בארגון שלכם וליהנות מיתרונות בקרת הגישה. התכונות האלה מבוססות על Dataplex Universal Catalog, שהוא פתרון מאוחד וחכם למשילות נתונים ולנכסי AI ב- Google Cloud.

הארכיטקטורה של BigQuery מורכבת משני חלקים: שכבת אחסון שמטמיעה, מאחסנת ומבצעת אופטימיזציה של נתונים, ושכבת מחשוב שמספקת יכולות ניתוח. שכבות המחשוב והאחסון האלה פועלות ביעילות באופן עצמאי זו מזו, הודות לרשת של Google בקנה מידה של פטה-ביט, שמאפשרת את התקשורת הנדרשת ביניהן.

בדרך כלל, מסדי נתונים מדור קודם צריכים לחלוק משאבים בין פעולות קריאה וכתיבה לבין פעולות ניתוח. זה עלול לגרום לקונפליקטים במשאבים ולהאט את השאילתות בזמן כתיבת נתונים לאחסון או קריאת נתונים מהאחסון. העומס על מאגרי משאבים משותפים יכול לגדול עוד יותר כשנדרשים משאבים למשימות ניהול מסדי נתונים, כמו הקצאה או ביטול של הרשאות. ההפרדה בין שכבות החישוב והאחסון ב-BigQuery מאפשרת לכל שכבה להקצות משאבים באופן דינמי בלי להשפיע על הביצועים או על הזמינות של השכבה השנייה.

הארכיטקטורה של BigQuery מפרידה בין משאבים באמצעות רשת פטה-ביט.

העיקרון הזה מאפשר ל-BigQuery לחדש מהר יותר כי אפשר לפרוס שיפורים באחסון ובחישוב באופן עצמאי, בלי השבתה או השפעה שלילית על ביצועי המערכת. בנוסף, חשוב להציע מחסן נתונים (data warehouse) ללא שרתים שמנוהל באופן מלא, שבו צוות ההנדסה של BigQuery מטפל בעדכונים ובתחזוקה. התוצאה היא שלא צריך להקצות משאבים או לשנות את גודלם באופן ידני, כך שתוכלו להתמקד בהעברת ערך במקום במשימות ניהול מסדי נתונים מסורתיות.

ממשקי BigQuery כוללים את ממשק Google Cloud המסוף ואת כלי שורת הפקודה של BigQuery. מפתחים ומדעני נתונים יכולים להשתמש בספריות לקוח עם תכנות מוכר, כולל Python, ‏ Java, ‏ JavaScript ו-Go, וגם ב-API בארכיטקטורת REST וב-RPC API של BigQuery כדי לשנות ולנהל נתונים. דרייברים של ODBC ו-JDBC מאפשרים אינטראקציה עם אפליקציות קיימות, כולל כלים וכלי עזר של צד שלישי.

אם אתם עובדים כנתוני אנליטיקה, מהנדסי מערכות מידע, מנהלי מחסני נתונים או מדעני נתונים, BigQuery יכול לעזור לכם לטעון, לעבד ולנתח נתונים כדי לקבל החלטות עסקיות חשובות.

איך מתחילים לעבוד עם BigQuery

אפשר להתחיל להתנסות ב-BigQuery תוך דקות. כדי להתחיל לטעון נתונים ולהריץ עליהם שאילתות, אפשר להשתמש בתוכנית השימוש החינמית של BigQuery או בארגז החול ללא עלות.

עיון ב-BigQuery

התשתית ללא שרת (serverless) של BigQuery מאפשרת לכם להתמקד בנתונים במקום בניהול משאבים. ‫BigQuery משלב מחסן נתונים בענן עם כלי ניתוח מתקדמים.

אחסון BigQuery

‫BigQuery מאחסן נתונים בפורמט אחסון עמודתי שעבר אופטימיזציה לשאילתות ניתוחיות. הנתונים ב-BigQuery מוצגים בטבלאות, בשורות ובעמודות, ויש תמיכה מלאה בסמנטיקה של טרנזקציות במסד נתונים (ACID). האחסון ב-BigQuery משוכפל באופן אוטומטי בכמה מיקומים כדי לספק זמינות גבוהה.

מידע נוסף זמין במאמר סקירה כללית של האחסון ב-BigQuery.

ניתוח נתונים ב-BigQuery

ניתוח תיאורי וניתוח פרסקריפטיבי משמשים בין היתר לבינה עסקית, לניתוח אד-הוק, לניתוח גיאו-מרחבי וללמידת מכונה. אפשר להריץ שאילתות על נתונים שמאוחסנים ב-BigQuery או על נתונים שמאוחסנים במקום אחר באמצעות טבלאות חיצוניות או שאילתות מאוחדות, כולל נתונים ב-Cloud Storage, ב-Bigtable, ב-Spanner או ב-Google Sheets שמאוחסנים ב-Google Drive.

מידע נוסף זמין במאמר סקירה כללית על ניתוח הנתונים ב-BigQuery.

ניהול BigQuery

‫BigQuery מספק ניהול מרכזי של נתונים ומשאבי מחשוב, וניהול זהויות וגישה (IAM) עוזר לאבטח את המשאבים האלה באמצעות מודל הגישה שמשמש בכל Google Cloud.השיטות המומלצות לאבטחה מספקות גישה מוצקה אך גמישה שיכולה לכלול אבטחה היקפית או גישה מורכבת ומפורטת יותר של הגנה לעומק.Google Cloud

  • מבוא לאבטחת נתונים ולניהול נתונים עוזר להבין מהו ניהול נתונים, ואילו אמצעי בקרה עשויים להידרש כדי לאבטח משאבי BigQuery.
  • משימות הן פעולות ש-BigQuery מריץ בשמכם כדי לטעון, לייצא, לשלוח שאילתות או להעתיק נתונים.
  • הזמנות מאפשרות לכם לעבור בין תמחור על פי דרישה לבין תמחור על בסיס קיבולת.

מידע נוסף זמין במאמר מבוא לניהול BigQuery.

משאבים ב-BigQuery

עיון במשאבים של BigQuery:

ממשקי API, כלים וחומרי עזר

חומרי עזר למפתחים ולמנתחים של BigQuery:

תכונות של Gemini ב-BigQuery

‫Gemini ב-BigQuery הוא חלק מחבילת המוצרים Gemini for Google Cloud, שמספקת עזרה מבוססת-AI בעבודה עם הנתונים.

‫Gemini ב-BigQuery מספק תמיכה מבוססת-AI שתעזור לכם:

איך מגדירים את Gemini ב-BigQuery

תפקידים ומשאבים ב-BigQuery

‫BigQuery נותן מענה לצרכים של אנשי מקצוע בתחום הנתונים בתפקידים ובתחומי האחריות הבאים.

מנתח/ת נתונים

הנחיות לביצוע משימות שיעזרו לכם אם תצטרכו:

אדמין של נתונים

הנחיות לביצוע משימות שיעזרו לכם אם תצטרכו:

מידע נוסף זמין במאמר מבוא לניהול BigQuery.

כדי לראות את התכונות לניהול נתונים ב-BigQuery Google Cloud ישירות במסוף, לוחצים על Take the tour.

להצטרפות לסיור

מדען/ית נתונים

הנחיות לביצוע משימות שיעזרו לכם להשתמש בלמידת מכונה של BigQuery ML כדי לבצע את הפעולות הבאות:

מפתחים של נתונים

הנחיות לביצוע משימות שיעזרו לכם אם תצטרכו:

המאמרים הבאים