ניתוח נתונים בעזרת Gemini

במדריך הזה מוסבר איך אפשר להשתמש בעזרה מבוססת-AI ב-Gemini ב-BigQuery כדי לנתח נתונים.

בדוגמה שבמדריך הזה, נניח שאתם מנתחי נתונים שצריכים לנתח ולחזות מכירות של מוצרים ממערך נתונים.

ההנחה במדריך הזה היא שאתם מכירים SQL ומשימות בסיסיות של ניתוח נתונים. לא נדרש ידע במוצרי Google Cloud . משתמשים מתחילים ב-BigQuery יכולים לעיין במדריכים לתחילת העבודה עם BigQuery.

מטרות

  • אתם יכולים להשתמש ב-Gemini ב-BigQuery כדי לקבל תשובות לשאלות על האופן שבו BigQuery מטפל במשימות ספציפיות של ניתוח נתונים.
  • מנחים את Gemini ב-BigQuery למצוא מערכי נתונים, להסביר שאילתות SQL וליצור אותן.
  • פיתוח מודל למידת מכונה (ML) לחיזוי תקופות עתידיות.

עלויות

במדריך הזה נעשה שימוש במוצרים הבאים שחלים עליהם חיובים: Google Cloud

כדי להעריך את העלויות על סמך השימוש החזוי, אפשר להשתמש במחשבון התמחור.

לפני שמתחילים

  1. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  2. מוודאים ש-Gemini ב-BigQuery מוגדר עבור פרויקט Google Cloud .
  3. במסוף Google Cloud , עוברים לדף BigQuery.

    כניסה ל-BigQuery

  4. יוצרים מערך נתונים בשם bqml_tutorial. משתמשים במערך הנתונים כדי לאחסן אובייקטים של מסד נתונים, כולל טבלאות ומודלים.

  5. כדי להפעיל את התכונות של Gemini ב-BigQuery שדרושות להשלמת המדריך הזה, בסרגל הכלים של BigQuery לוחצים על pen_spark Gemini ובוחרים באפשרויות הבאות:

    • השלמה אוטומטית
    • יצירה אוטומטית
    • הסבר

מידע על היכולות של BigQuery

לפני שמתחילים, כדאי לדעת איך BigQuery מטפל בשאילתות של נתונים. כדי לקבל עזרה, אתם יכולים לשלוח ל-Gemini ב-BigQuery הצהרה בשפה טבעית (או הנחיה) כמו זו:

  • "איך מתחילים לעבוד עם BigQuery?"
  • "מה היתרונות של שימוש ב-BigQuery לניתוח נתונים?"
  • "איך BigQuery מטפל בהתאמת קנה מידה אוטומטית לשאילתות?"

בנוסף, Gemini ב-BigQuery יכול לספק מידע על אופן הניתוח של הנתונים. כדי לקבל עזרה כזו, אפשר לשלוח הנחיות כמו אלה:

  • "איך יוצרים מודל לתחזית של סדרת זמנים ב-BigQuery?"
  • "איך טוענים סוגים שונים של נתונים ל-BigQuery?"

גישה לנתונים וניתוח שלהם

‫Gemini ב-BigQuery יכול לעזור לכם להבין אילו נתונים זמינים לניתוח ואיך לנתח אותם.

לצורך הדוגמה הזו, נניח שאתם צריכים עזרה בנושאים הבאים:

  • חיפוש טבלאות ומערכי נתונים של מכירות לניתוח.
  • הבנה של הקשר בין טבלאות נתונים לבין שאילתות במערך נתונים של מכירות.
  • הבנה של שאילתות מורכבות וכתיבת שאילתות שמשתמשות במערך הנתונים.

חיפוש נתונים

לפני ששולחים שאילתות לנתונים, צריך לדעת לאילו נתונים יש לכם גישה. כל מוצר נתונים מארגן ומאחסן את הנתונים בצורה שונה.

כדי לקבל עזרה, אפשר לשלוח ל-Gemini ב-BigQuery הנחיה כמו 'איך אפשר לדעת אילו מערכי נתונים וטבלאות זמינים לי ב-BigQuery?'

  1. במסוף Google Cloud , עוברים לדף BigQuery.

    כניסה ל-BigQuery

  2. בסרגל הכלים של מסוף Google Cloud , לוחצים על סמל הנצנוץ Open or close Gemini Cloud Assist chat.

  3. כותבים את ההנחיה How do I learn which datasets and tables are available to me in BigQuery? בחלונית Cloud Assist.

  4. לוחצים על send שליחת ההנחיה.

    איך Gemini for Google Cloud ‎ משתמש בנתונים שלכם, ובאילו מקרים.

    התשובה כוללת כמה דרכים להצגת רשימה של פרויקטים, מערכי נתונים או טבלאות במערך נתונים.

  5. אופציונלי: כדי לאפס את היסטוריית הצ'אט, בחלונית Cloud Assist, לוחצים על delete Clear chat ואז על Reset chat.

הבנה של SQL וכתיבת SQL ב-BigQuery

בדוגמה הזו, נניח שבחרתם נתונים לניתוח ועכשיו אתם רוצים לשלוח שאילתה לגבי הנתונים האלה. ‫Gemini ב-BigQuery יכול לעזור לכם לעבוד עם SQL – בין אם כדי להבין שאילתות מורכבות שקשה לנתח, או כדי ליצור שאילתות SQL חדשות.

איך מבקשים מ-Gemini עזרה בהסבר על שאילתות SQL

נניח שאתם רוצים להבין שאילתה מורכבת שמישהו אחר כתב. ‫Gemini ב-BigQuery יכול להסביר את השאילתה בשפה פשוטה – למשל, את תחביר השאילתה, הסכמה הבסיסית וההקשר העסקי.

  1. במסוף Google Cloud , עוברים לדף BigQuery.

    כניסה ל-BigQuery

  2. בעורך השאילתות, פותחים את השאילתה שרוצים לקבל עליה הסבר או מדביקים אותה. לדוגמה:

    SELECT
      u.id AS user_id,
      u.first_name,
      u.last_name,
      avg(oi.sale_price) AS avg_sale_price
    FROM `bigquery-public-data.thelook_ecommerce.users` AS u
    JOIN `bigquery-public-data.thelook_ecommerce.order_items` AS oi
      ON u.id = oi.user_id
    GROUP BY 1, 2, 3
    ORDER BY avg_sale_price DESC
    LIMIT 10
    
  3. מדגישים את השאילתה ולוחצים על auto_awesome הסבר על השאילתה שנבחרה.

    בחלונית Cloud Assist, מוחזרת תגובה שדומה לזו:

    The intent of this query is to find the top 10 users by average sale price.
    The query first joins the users and order_items tables on the user_id
    column. It then groups the results by user_id, first_name, and last_name,
    and calculates the average sale price for each group. The results are then
    ordered by average sale price in descending order, and the top 10 results
    are returned.
    

יצירת שאילתת SQL שמקבצת מכירות לפי יום ומוצר

בדוגמה הזו, אתם רוצים ליצור שאילתה שמציגה את המוצרים המובילים שלכם בכל יום. אחר כך משתמשים בטבלאות במערך הנתונים thelook_ecommerce ומבקשים מ-Gemini ב-BigQuery ליצור שאילתה לחישוב נתוני המכירות לפי פריט בהזמנה ולפי שם המוצר.

בדרך כלל שאילתות כאלה הן מורכבות, אבל בעזרת Gemini ב-BigQuery אפשר ליצור הצהרה באופן אוטומטי. אתם יכולים להזין הנחיה כדי ליצור שאילתת SQL על סמך סכימת הנתונים. גם אם אתם מתחילים בלי צורך בתכנות, עם ידע מוגבל בסכימת הנתונים או עם ידע בסיסי בלבד בתחביר SQL, Gemini יכול להציע הצהרת SQL אחת או יותר.

כדי להנחות את Gemini ב-BigQuery ליצור שאילתה שמפרטת את המוצרים המובילים שלכם, פועלים לפי השלבים הבאים:

  1. במסוף Google Cloud , עוברים לדף BigQuery.

    כניסה ל-BigQuery

  2. בתפריט הניווט, לוחצים על Studio.

  3. לוחצים על שאילתת SQL. החלונית Explorer (סייר) טוענת באופן אוטומטי את מסד הנתונים שנבחר.

  4. בעורך השאילתות, מזינים את ההנחיה הבאה ואז מקישים על Enter:

    # select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
    

    הסימן סולמית (#) מנחה את Gemini ב-BigQuery ליצור SQL. ‫Gemini ב-BigQuery מציע שאילתת SQL שדומה לזו:

    SELECT
      sum(sale_price),
      DATE(created_at),
      product_id
    FROM
      `bigquery-public-data.thelook_ecommerce.order_items`
        AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2
      ON t1.product_id = t2.id
    GROUP BY 2, 3
    
  5. כדי לאשר את הצעת הקוד, לוחצים על Tab ואז על הפעלה כדי להריץ את הצהרת ה-SQL. אפשר גם לגלול בין הצעות ה-SQL ולקבל מילים ספציפיות שמוצעות בהצהרה.

  6. בחלונית Query results, רואים את תוצאות השאילתה.

איך בונים מודל חיזוי וצופים בתוצאות

בדוגמה הזו, תשתמשו ב-BigQuery ML כדי לבצע את הפעולות הבאות:

  • משתמשים בשאילתת מגמה כדי ליצור מודל חיזוי.
  • אתם יכולים להשתמש ב-Gemini ב-BigQuery כדי לקבל הסבר על שאילתה או עזרה בכתיבת שאילתה להצגת התוצאות של מודל החיזוי.

משתמשים בשאילתה לדוגמה הבאה עם נתוני מכירות בפועל, שמשמשים כקלט למודל. השאילתה משמשת כחלק מתהליך יצירת מודל ה-ML.

  1. כדי ליצור מודל ML לחיזוי, מריצים את שאילתת ה-SQL הבאה בעורך השאילתות:

    CREATE MODEL bqml_tutorial.sales_forecasting_model
      OPTIONS (
        MODEL_TYPE = 'ARIMA_PLUS',
        time_series_timestamp_col = 'date_col',
        time_series_data_col = 'total_sales',
        time_series_id_col = 'product_id')
    AS
    SELECT
      sum(sale_price) AS total_sales,
      DATE(created_at) AS date_col,
      product_id
    FROM
      `bigquery-public-data.thelook_ecommerce.order_items`
        AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2
      ON t1.product_id = t2.id
    GROUP BY 2, 3;
    

    אתם יכולים להשתמש ב-Gemini ב-BigQuery כדי להבין את השאילתה הזו.

    כשיוצרים את המודל, בחלונית תוצאות השאילתה, בכרטיסייה תוצאות, מוצגת הודעה שדומה להודעה הבאה:

    Successfully created model named sales_forecasting_model.
    
  2. בחלונית Cloud Assist, מזינים הנחיה ל-Gemini ב-BigQuery כדי לקבל עזרה בכתיבת שאילתה לקבלת תחזית מהמודל כשהוא יסיים את הפעולה. לדוגמה, מזינים How can I get a forecast in SQL from the model?

    על סמך ההקשר של ההנחיה, התשובה כוללת דוגמה של מודל ML שמבצע תחזית של מכירות:

    SELECT
      *
    FROM
      ML.FORECAST(
        MODEL `PROJECT_ID.bqml_tutorial.sales_forecasting_model`,
        STRUCT(
          7 AS horizon,
          0.95 AS confidence_level))
    

    בתשובה הזו, PROJECT_ID הוא הפרויקט שלךGoogle Cloud .

  3. מעתיקים את שאילתת ה-SQL בחלונית Cloud Assist.

  4. בעורך השאילתות, מריצים את שאילתת ה-SQL.

הסרת המשאבים

כדי להימנע מחיובים בחשבון Google Cloud על המשאבים שבהם השתמשתם במדריך הזה, אתם יכולים למחוק את הפרויקט Google Cloud שיצרתם לצורך המדריך. אפשר גם למחוק את המשאבים הספציפיים.

מחק את הפרויקט

  1. In the Google Cloud console, go to the Manage resources page.

    Go to Manage resources

  2. In the project list, select the project that you want to delete, and then click Delete.
  3. In the dialog, type the project ID, and then click Shut down to delete the project.

מחיקת מערך נתונים

אם מוחקים פרויקט, כל מערכי הנתונים וכל הטבלאות בפרויקט נמחקים. אם אתם מעדיפים להשתמש מחדש בפרויקט, אתם יכולים למחוק את מערך הנתונים שיצרתם במדריך הזה.

  1. במסוף Google Cloud , עוברים לדף BigQuery.

    כניסה ל-BigQuery

  2. בתפריט הניווט, בוחרים את מערך הנתונים bqml_tutorial שיצרתם.

  3. כדי למחוק את מערך הנתונים, את הטבלה ואת כל הנתונים, לוחצים על מחיקת מערך הנתונים.

  4. כדי לאשר את המחיקה, בתיבת הדו-שיח מחיקת מערך הנתונים, מקלידים את השם של מערך הנתונים (bqml_tutorial) ולוחצים על מחיקה.

המאמרים הבאים