ניתוח נתונים באמצעות Gemini CLI
בדף הזה מוסבר איך ליצור אינטראקציה עם נתוני BigQuery במסוף באמצעות הנחיות בשפה טבעית עם Gemini CLI. שימוש בתוספים ייעודיים של BigQuery עם Gemini CLI מאפשר ניתוח נתונים ותובנות מבוססי-AI ישירות בשורת הפקודה. אתם יכולים לנתח נתונים מטבלאות BigQuery או מטבלאות במערכי הנתונים הציבוריים של BigQuery.
התוספים האלה מאינטראקציה ישירה (First-Party) מספקים כמה כלים נפוצים לניתוח נתונים ולתובנות. כדי ליצור כלים משלכם, אפשר לעיין במאמר בנושא שימוש ב-BigQuery עם MCP, Gemini CLI וסוכנים אחרים.
מידע על Gemini CLI ותוספים
Gemini CLI הוא סוכן AI בממשק שיחה של Google בקוד פתוח, שמאיץ את תהליכי הפיתוח ועוזר בכתיבת קוד, בניפוי באגים, בחיפוש נתונים וביצירת תוכן. הוא מציע חוויה מבוססת-סוכן לאינטראקציה עם שירותי Data Cloud, כמו BigQuery, ומסדי נתונים פופולריים אחרים ומסדי נתונים בקוד פתוח. Google Cloud
מידע נוסף על Gemini CLI זמין במסמכי התיעוד של Gemini CLI.
איך תוספים פועלים
התוספים מרחיבים את היכולות של Gemini CLI, ומאפשרים לו להתחבר לשירותים ספציפיים ולכלים אחרים ולשלוט בהם. Google Cloud התוספים מספקים ל-Gemini הקשר והבנה של ה-API, ומאפשרים אינטראקציה שיחתית. אפשר לטעון את התוספים מכתובות URL ב-GitHub, מספריות מקומיות או ממאגרי מידע. התוספים האלה מציעים כלים, פקודות לוכסן והנחיות. הם נפרדים מתוספים לסביבת פיתוח משולבת (IDE), כמו Gemini Code Assist, שמשולבים באמצעות ערכת הכלים של MCP.
מידע על התוספים של BigQuery
BigQuery מציע את התוספים הבאים לעבודה עם נתוני BigQuery באמצעות Gemini CLI:
- תוסף BigQuery Data Analytics
- אפשר להשתמש בתוסף הזה כדי לגלות נתונים, לקבל מידע נוסף על טבלאות ומערכי נתונים ב-BigQuery ולשאול שאלות בשפה טבעית על מערכי הנתונים. אפשר גם ליצור תחזיות או להפעיל ניתוח של תרומה באמצעות כלים מתקדמים מובנים. הכלים בתוסף הזה עוזרים ל-Gemini CLI לכתוב שאילתות SQL על סמך שאלות בשפה טבעית, ואז להריץ את השאילתות כדי לספק תשובות לשאלות.
- תוסף לניתוח נתוני שיחות ב-BigQuery
- אפשר להשתמש בתוסף הזה כדי לקבל תובנות מתקדמות מהנתונים ב-BigQuery באמצעות סוכן ניתוח נתונים בצד השרת שמתארח מראש. הכלים בתוסף הזה עוזרים ל-Gemini CLI לשלוח את השאלה שלכם בשפה טבעית לסוכן מובנה ומארח, ולתת תשובה עם תובנות מעמיקות יותר מהנתונים שלכם.
כלים לניתוח נתונים ב-BigQuery
התוסף BigQuery Data Analytics מספק את הכלים הבאים:
| קטגוריה | כלי | דוגמה להנחיה בשפה טבעית |
|---|---|---|
| מידע על מערך הנתונים והטבלה | get_dataset_info |
אחזור מידע על מערך הנתונים bigquery-public-data.pypi |
get_table_info |
קבלת מידע על הטבלה bigquery-public-data.pypi.file_downloads | |
list_dataset_ids |
הצגת רשימה של כל מערכי הנתונים של ML בפרויקט bigquery-public-data | |
list_table_ids |
רשימה של כל הטבלאות במערך הנתונים bigquery-public-data.pypi | |
| חיפוש | search_catalog |
חיפוש טבלאות שקשורות להורדות מ-PyPi |
| הרצת SQL | execute_sql |
Using bigquery-public-data.pypi.file_downloads, show me the top 10 downloaded pypi packages this month |
| חיזוי של סדרות זמנים | forecast |
באמצעות bigquery-public-data.pypi.file_downloads, צור תחזית להורדות של החבילה urllib3 בארבעת החודשים האחרונים של 2025 |
| ניתוח הגורמים לאנומליות | analyze_contribution |
ניתוח התרומה של מדינה להכנסות בטבלה bigquery-public-data.google_analytics_sample.ga_sessions_20170801 |
כלים לניתוח נתוני השיחות
התוסף Conversational Analytics מספק את הכלים הבאים:
| קטגוריה | כלי | דוגמה להנחיה בשפה טבעית |
|---|---|---|
| חיפוש | search_catalog |
חיפוש טבלאות שקשורות להורדות מ-PyPi |
| ניתוח נתוני השיחות | ask_data_insights |
בעזרת הכלי ask_data_insights והטבלאות שמתחת ל-bigquery-public-data.google_analytics_sample, תגיד לי באילו ערוצים כדאי לי להתמקד ולמה. |
לפני שמתחילים
לפני שמתחילים, צריך:
- גישה לפרויקט אחד לפחות Google Cloud .
כדי להשתמש בתוסף Data Analytics, צריך להפעיל את ממשקי ה-API הבאים:
- BigQuery
- כדי להשתמש בכלי
search_catalog: Dataplex Universal Catalog
כדי להשתמש בתוסף Conversational Analytics, צריך להפעיל את ממשקי ה-API הבאים:
- BigQuery
- Dataplex Universal Catalog
- כדי להשתמש בכלי
ask_data_insights: Gemini for Google Cloud API, Gemini ו-Data Analytics API עם Gemini
התפקידים הנדרשים
כדי לקבל את ההרשאות שדרושות לשימוש בתוספים של BigQuery עם Gemini CLI, צריך לבקש מהאדמין להקצות לכם את תפקידי ה-IAM הבאים במשאבים של מנהל המשאבים (פרויקטים, תיקיות וארגונים) או במשאבים ברמה נמוכה יותר כמו מערכי נתונים:
-
הפעלת שאילתות ב-BigQuery בפרויקט Google Cloud :
BigQuery User (
roles/bigquery.user) -
כדי לקבל מטא-נתונים של מערך נתונים וטבלה ב-BigQuery, אפשר להשתמש בכלי המטא-נתונים הבסיסיים:
BigQuery Metadata Viewer (
roles/bigquery.metadataViewer) -
שימוש בתוסף Conversational Analytics:
משתמש ב-Gemini for Google Cloud (
roles/cloudaicompanion.user)
להסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.
יכול להיות שאפשר לקבל את ההרשאות הנדרשות גם באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש.
התקנת התוספים של BigQuery
מתקינים את התוספים של BigQuery ואז משתמשים בהם כדי לבדוק ולנתח את הנתונים.
מגדירים את משתני הסביבה כדי להתחבר לפרויקט BigQuery:
export BIGQUERY_PROJECT="PROJECT_ID"מחליפים את
PROJECT_IDבמזהה הפרויקט ב- Google Cloud.אפשר גם להגדיר את משתני הסביבה האופציונליים האלה:
-
BIGQUERY_LOCATION: מיקום מערך הנתונים – לדוגמה:export BIGQUERY_LOCATION="us" -
BIGQUERY_USE_CLIENT_OAUTH: האם להשתמש ב-OAuth בצד הלקוח – לדוגמה:export BIGQUERY_USE_CLIENT_OAUTH=true
-
מתקינים את התוסף BigQuery Data Analytics או Conversational Analytics באמצעות הפקודה
gemini extension install:אופציונלי: מתקינים את התוסף BigQuery Data Analytics:
gemini extensions install https://github.com/gemini-cli-extensions/bigquery-data-analyticsאופציונלי: מתקינים את התוסף BigQuery Conversational Analytics:
gemini extensions install https://github.com/gemini-cli-extensions/bigquery-conversational-analytics
מפעילים את Gemini CLI במצב אינטראקטיבי כדי לחקור ולנתח את הנתונים:
geminiממשק ה-CLI טוען אוטומטית את התוסף BigQuery ואת הכלים שלו, שבהם אפשר להשתמש כדי ליצור אינטראקציה עם הנתונים.
דוגמאות להנחיות לחקירה ולניתוח של הנתונים
מזינים הנחיות ב-Gemini CLI. בהמשך מופיעות דוגמאות שיעזרו לכם להתחיל.
עיון בטבלאות וניתוח שלהן
ההנחיות הבאות לדוגמה מאפשרות לכם לחקור ולנתח את הטבלאות.
הנחיה לדוגמה לחיפוש טבלאות שקשורות להורדות של PyPi:
Find tables related to PyPi downloadsדוגמה לתשובה
Gemini CLI מחזיר רשימה של טבלאות קשורות:
✦ I found the following tables related to PyPi downloads: * file_downloads: projects/bigquery-public-data/datasets/pypi/tables/file_downloads * distribution_metadata: projects/bigquery-public-data/datasets/pypi/tables/distribution_metadataהנחיה לדוגמה להצגת עשרת חבילות ה-PyPI שהורדו הכי הרבה החודש:
Using bigquery-public-data.pypi.file_downloads, show me the top 10 downloaded pypi packages this monthדוגמה לתשובה
Gemini CLI מחזיר את 10 החבילות המובילות:
✦ Here are the top 10 most downloaded PyPI packages this month: 1. boto3: 685,007,866 downloads 2. botocore: 531,034,851 downloads 3. urllib3: 512,611,825 downloads 4. requests: 464,595,806 downloads 5. typing-extensions: 459,505,780 downloads 6. certifi: 451,929,759 downloads 7. charset-normalizer: 428,716,731 downloads 8. idna: 409,262,986 downloads 9. grpcio-status: 402,535,938 downloads 10. aiobotocore: 399,650,559 downloads
קבלת תובנות מעמיקות יותר באמצעות ask_data_insights
הכלי ask_data_insights מפעיל סוכן בממשק BigQuery Conversational Analytics API כדי לענות על השאלות שלכם. הסוכן בצד השרת אוסף הקשר נוסף לגבי הנתונים שלכם ומציע תובנות נוספות.
הנחיה לדוגמה לקבלת תובנות לגבי הערוצים שבהם כדאי להתמקד:
Using ask_data_insights and using the tables under bigquery-public-data.google_analytics_sample, tell me the channels I should focus on and whyדוגמה לתשובה
Gemini CLI מחזיר המלצות על סמך הניתוח:
Based on the analysis of the Google Analytics sample data, here are the channels you should focus on and why: | Channel | Total Visits | Total Pageviews | Total Transactions | Total Revenue | | ---------------- | ------------ | --------------- | ------------------ | ------------- | | Referral | 104,838 | 707,597 | 5,543 | $651,429.91 | | Direct | 143,026 | 584,840 | 2,219 | $434,840.55 | | Organic Search | 381,561 | 1,569,218 | 3,581 | $326,380.51 | | Display | 6,262 | 34,202 | 152 | $78,337.46 | | Paid Search | 25,326 | 136,060 | 479 | $43,558.90 | | Social | 226,117 | 398,690 | 131 | $4,916.54 | | Affiliates | 16,403 | 47,417 | 9 | $597.38 | | (Other) | 120 | 442 | 1 | $9.99 | Recommendations: 1. Prioritize referral traffic: * Why: This is a highly valuable channel. It brings in the most revenue and has a high number of transactions, despite not having the highest number of visits. This indicates that traffic from referrals is highly qualified and converts well. * Action: Identify your top referring websites and build stronger relationships with them. Look for similar websites to partner with. 2. Nurture your direct traffic: * Why: Direct traffic is your second-highest revenue source. These are likely returning customers or people who know your brand well.
תמחור
אין עלות נוספת לשימוש בכלי מטא-נתונים (כמו get_dataset_info, get_table_info, list_dataset_ids ו-list_table_ids) או בכלי search_catalog.
החיוב על כלים שמריצים שאילתות, כולל execute_sql, forecast ו-analyze_contribution, מתבצע לפי תמחור לפי דרישה ב-BigQuery או תמחור לפי קיבולת ב-BigQuery, בהתאם להגדרות הפרויקט.
במהלך תקופת הבטא (לפני גרסה 1.0), השימוש בכלי ask_data_insights לא כרוך בעלות נוספת, אבל כל שאילתות BigQuery שהכלי מפעיל יחויבו בהתאם לתמחור הרגיל של BigQuery.
המאמרים הבאים
- מידע נוסף על שימוש ב-BigQuery עם MCP, Gemini CLI וסוכנים אחרים
- מידע נוסף על Gemini ב-BigQuery
- אפשר לעיין בתוסף Data Analytics ב-GitHub.
- אפשר לעיין בתוסף Conversational Analytics ב-GitHub.