ניתוח נתונים באמצעות Gemini CLI

בדף הזה מוסבר איך ליצור אינטראקציה עם נתוני BigQuery במסוף באמצעות הנחיות בשפה טבעית עם Gemini CLI. שימוש בתוספים ייעודיים של BigQuery עם Gemini CLI מאפשר ניתוח נתונים ותובנות מבוססי-AI ישירות בשורת הפקודה. אתם יכולים לנתח נתונים מטבלאות BigQuery או מטבלאות במערכי הנתונים הציבוריים של BigQuery.

התוספים האלה מאינטראקציה ישירה (First-Party) מספקים כמה כלים נפוצים לניתוח נתונים ולתובנות. כדי ליצור כלים משלכם, אפשר לעיין במאמר בנושא שימוש ב-BigQuery עם MCP,‏ Gemini CLI וסוכנים אחרים.

מידע על Gemini CLI ותוספים

‫Gemini CLI הוא סוכן AI בממשק שיחה של Google בקוד פתוח, שמאיץ את תהליכי הפיתוח ועוזר בכתיבת קוד, בניפוי באגים, בחיפוש נתונים וביצירת תוכן. הוא מציע חוויה מבוססת-סוכן לאינטראקציה עם שירותי Data Cloud, כמו BigQuery, ומסדי נתונים פופולריים אחרים ומסדי נתונים בקוד פתוח. Google Cloud

מידע נוסף על Gemini CLI זמין במסמכי התיעוד של Gemini CLI.

איך תוספים פועלים

התוספים מרחיבים את היכולות של Gemini CLI, ומאפשרים לו להתחבר לשירותים ספציפיים ולכלים אחרים ולשלוט בהם. Google Cloud התוספים מספקים ל-Gemini הקשר והבנה של ה-API, ומאפשרים אינטראקציה שיחתית. אפשר לטעון את התוספים מכתובות URL ב-GitHub, מספריות מקומיות או ממאגרי מידע. התוספים האלה מציעים כלים, פקודות לוכסן והנחיות. הם נפרדים מתוספים לסביבת פיתוח משולבת (IDE), כמו Gemini Code Assist, שמשולבים באמצעות ערכת הכלים של MCP.

מידע על התוספים של BigQuery

‫BigQuery מציע את התוספים הבאים לעבודה עם נתוני BigQuery באמצעות Gemini CLI:

תוסף BigQuery Data Analytics
אפשר להשתמש בתוסף הזה כדי לגלות נתונים, לקבל מידע נוסף על טבלאות ומערכי נתונים ב-BigQuery ולשאול שאלות בשפה טבעית על מערכי הנתונים. אפשר גם ליצור תחזיות או להפעיל ניתוח של תרומה באמצעות כלים מתקדמים מובנים. הכלים בתוסף הזה עוזרים ל-Gemini CLI לכתוב שאילתות SQL על סמך שאלות בשפה טבעית, ואז להריץ את השאילתות כדי לספק תשובות לשאלות.
תוסף לניתוח נתוני שיחות ב-BigQuery
אפשר להשתמש בתוסף הזה כדי לקבל תובנות מתקדמות מהנתונים ב-BigQuery באמצעות סוכן ניתוח נתונים בצד השרת שמתארח מראש. הכלים בתוסף הזה עוזרים ל-Gemini CLI לשלוח את השאלה שלכם בשפה טבעית לסוכן מובנה ומארח, ולתת תשובה עם תובנות מעמיקות יותר מהנתונים שלכם.

כלים לניתוח נתונים ב-BigQuery

התוסף BigQuery Data Analytics מספק את הכלים הבאים:

קטגוריה כלי דוגמה להנחיה בשפה טבעית
מידע על מערך הנתונים והטבלה get_dataset_info אחזור מידע על מערך הנתונים bigquery-public-data.pypi
get_table_info קבלת מידע על הטבלה bigquery-public-data.pypi.file_downloads
list_dataset_ids הצגת רשימה של כל מערכי הנתונים של ML בפרויקט bigquery-public-data
list_table_ids רשימה של כל הטבלאות במערך הנתונים bigquery-public-data.pypi
חיפוש search_catalog חיפוש טבלאות שקשורות להורדות מ-PyPi
הרצת SQL execute_sql Using bigquery-public-data.pypi.file_downloads, show me the top 10 downloaded pypi packages this month
חיזוי של סדרות זמנים forecast באמצעות bigquery-public-data.pypi.file_downloads, צור תחזית להורדות של החבילה urllib3 בארבעת החודשים האחרונים של 2025
ניתוח הגורמים לאנומליות analyze_contribution ניתוח התרומה של מדינה להכנסות בטבלה bigquery-public-data.google_analytics_sample.ga_sessions_20170801

כלים לניתוח נתוני השיחות

התוסף Conversational Analytics מספק את הכלים הבאים:

קטגוריה כלי דוגמה להנחיה בשפה טבעית
חיפוש search_catalog חיפוש טבלאות שקשורות להורדות מ-PyPi
ניתוח נתוני השיחות ask_data_insights בעזרת הכלי ask_data_insights והטבלאות שמתחת ל-bigquery-public-data.google_analytics_sample, תגיד לי באילו ערוצים כדאי לי להתמקד ולמה.

לפני שמתחילים

לפני שמתחילים, צריך:

  • גישה לפרויקט אחד לפחות Google Cloud .
  • כדי להשתמש בתוסף Data Analytics, צריך להפעיל את ממשקי ה-API הבאים:

    • BigQuery
    • כדי להשתמש בכלי search_catalog: Dataplex Universal Catalog
  • כדי להשתמש בתוסף Conversational Analytics, צריך להפעיל את ממשקי ה-API הבאים:

    • BigQuery
    • Dataplex Universal Catalog
    • כדי להשתמש בכלי ask_data_insights: Gemini for Google Cloud API,‏ Gemini ו-Data Analytics API עם Gemini

התפקידים הנדרשים

כדי לקבל את ההרשאות שדרושות לשימוש בתוספים של BigQuery עם Gemini CLI, צריך לבקש מהאדמין להקצות לכם את תפקידי ה-IAM הבאים במשאבים של מנהל המשאבים (פרויקטים, תיקיות וארגונים) או במשאבים ברמה נמוכה יותר כמו מערכי נתונים:

  • הפעלת שאילתות ב-BigQuery בפרויקט Google Cloud : BigQuery User (roles/bigquery.user)
  • כדי לקבל מטא-נתונים של מערך נתונים וטבלה ב-BigQuery, אפשר להשתמש בכלי המטא-נתונים הבסיסיים: BigQuery Metadata Viewer (roles/bigquery.metadataViewer)
  • שימוש בתוסף Conversational Analytics: משתמש ב-Gemini for Google Cloud (roles/cloudaicompanion.user)

להסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.

יכול להיות שאפשר לקבל את ההרשאות הנדרשות גם באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש.

התקנת התוספים של BigQuery

מתקינים את התוספים של BigQuery ואז משתמשים בהם כדי לבדוק ולנתח את הנתונים.

  1. מתקינים את Gemini CLI.

  2. מגדירים את משתני הסביבה כדי להתחבר לפרויקט BigQuery:

    export BIGQUERY_PROJECT="PROJECT_ID"
    

    מחליפים את PROJECT_ID במזהה הפרויקט ב- Google Cloud.

    אפשר גם להגדיר את משתני הסביבה האופציונליים האלה:

    • BIGQUERY_LOCATION: מיקום מערך הנתונים – לדוגמה: export BIGQUERY_LOCATION="us"
    • BIGQUERY_USE_CLIENT_OAUTH: האם להשתמש ב-OAuth בצד הלקוח – לדוגמה: export BIGQUERY_USE_CLIENT_OAUTH=true
  3. מתקינים את התוסף BigQuery Data Analytics או Conversational Analytics באמצעות הפקודה gemini extension install:

    • אופציונלי: מתקינים את התוסף BigQuery Data Analytics:

      gemini extensions install https://github.com/gemini-cli-extensions/bigquery-data-analytics
      
    • אופציונלי: מתקינים את התוסף BigQuery Conversational Analytics:

      gemini extensions install https://github.com/gemini-cli-extensions/bigquery-conversational-analytics
      
  4. מפעילים את Gemini CLI במצב אינטראקטיבי כדי לחקור ולנתח את הנתונים:

    gemini
    

    ממשק ה-CLI טוען אוטומטית את התוסף BigQuery ואת הכלים שלו, שבהם אפשר להשתמש כדי ליצור אינטראקציה עם הנתונים.

דוגמאות להנחיות לחקירה ולניתוח של הנתונים

מזינים הנחיות ב-Gemini CLI. בהמשך מופיעות דוגמאות שיעזרו לכם להתחיל.

עיון בטבלאות וניתוח שלהן

ההנחיות הבאות לדוגמה מאפשרות לכם לחקור ולנתח את הטבלאות.

  • הנחיה לדוגמה לחיפוש טבלאות שקשורות להורדות של PyPi:

    Find tables related to PyPi downloads
    

    דוגמה לתשובה

    ‫Gemini CLI מחזיר רשימה של טבלאות קשורות:

    ✦ I found the following tables related to PyPi downloads:
    
        *   file_downloads: projects/bigquery-public-data/datasets/pypi/tables/file_downloads
        *   distribution_metadata: projects/bigquery-public-data/datasets/pypi/tables/distribution_metadata
    
  • הנחיה לדוגמה להצגת עשרת חבילות ה-PyPI שהורדו הכי הרבה החודש:

    Using bigquery-public-data.pypi.file_downloads, show me the top 10
    downloaded pypi packages this month
    

    דוגמה לתשובה

    ‫Gemini CLI מחזיר את 10 החבילות המובילות:

    ✦ Here are the top 10 most downloaded PyPI packages this month:
    
        1.  boto3: 685,007,866 downloads
        2.  botocore: 531,034,851 downloads
        3.  urllib3: 512,611,825 downloads
        4.  requests: 464,595,806 downloads
        5.  typing-extensions: 459,505,780 downloads
        6.  certifi: 451,929,759 downloads
        7.  charset-normalizer: 428,716,731 downloads
        8.  idna: 409,262,986 downloads
        9.  grpcio-status: 402,535,938 downloads
        10. aiobotocore: 399,650,559 downloads
    

קבלת תובנות מעמיקות יותר באמצעות ask_data_insights

הכלי ask_data_insights מפעיל סוכן בממשק BigQuery Conversational Analytics API כדי לענות על השאלות שלכם. הסוכן בצד השרת אוסף הקשר נוסף לגבי הנתונים שלכם ומציע תובנות נוספות.

  • הנחיה לדוגמה לקבלת תובנות לגבי הערוצים שבהם כדאי להתמקד:

    Using ask_data_insights and using the tables under
    bigquery-public-data.google_analytics_sample, tell me the channels I should
    focus on and why
    

    דוגמה לתשובה

    ‫Gemini CLI מחזיר המלצות על סמך הניתוח:

    Based on the analysis of the Google Analytics sample data, here are the
    channels you should focus on and why:
    
    |     Channel      | Total Visits | Total Pageviews | Total Transactions | Total Revenue |
    | ---------------- | ------------ | --------------- | ------------------ | ------------- |
    | Referral         |      104,838 |         707,597 |              5,543 |   $651,429.91 |
    | Direct           |      143,026 |         584,840 |              2,219 |   $434,840.55 |
    | Organic Search   |      381,561 |       1,569,218 |              3,581 |   $326,380.51 |
    | Display          |        6,262 |          34,202 |                152 |    $78,337.46 |
    | Paid Search      |       25,326 |         136,060 |                479 |    $43,558.90 |
    | Social           |      226,117 |         398,690 |                131 |     $4,916.54 |
    | Affiliates       |       16,403 |          47,417 |                  9 |       $597.38 |
    | (Other)          |          120 |             442 |                  1 |         $9.99 |
    
      Recommendations:
    
        1.  Prioritize referral traffic:
            *   Why: This is a highly valuable channel. It brings in the most
                revenue and has a high number of transactions, despite not
                having the highest number of visits. This indicates that
                traffic from referrals is highly qualified and converts
                well.
            *   Action: Identify your top referring websites and build
                stronger relationships with them. Look for similar websites
                to partner with.
    
        2.  Nurture your direct traffic:
            *   Why: Direct traffic is your second-highest revenue source.
                These are likely returning customers or people who know your
                brand well.
    

תמחור

אין עלות נוספת לשימוש בכלי מטא-נתונים (כמו get_dataset_info,‏ get_table_info,‏ list_dataset_ids ו-list_table_ids) או בכלי search_catalog.

החיוב על כלים שמריצים שאילתות, כולל execute_sql,‏ forecast ו-analyze_contribution, מתבצע לפי תמחור לפי דרישה ב-BigQuery או תמחור לפי קיבולת ב-BigQuery, בהתאם להגדרות הפרויקט.

במהלך תקופת הבטא (לפני גרסה 1.0), השימוש בכלי ask_data_insights לא כרוך בעלות נוספת, אבל כל שאילתות BigQuery שהכלי מפעיל יחויבו בהתאם לתמחור הרגיל של BigQuery.

המאמרים הבאים