סקירה כללית על ניתוח נתוני השיחות
ניתוח שיחות ב-BigQuery מאפשר לכם לשוחח עם נציגים על הנתונים שלכם באמצעות שפה טבעית. כדי לקבל תשובות לגבי הנתונים שלכם, אתם יכולים:
- יוצרים סוכני נתונים שמגדירים באופן אוטומטי את הקשר של הנתונים ואת הוראות העיבוד של שאילתות עבור קבוצה של מקורות ידע, כמו טבלאות, תצוגות או פונקציות שהוגדרו על ידי המשתמש (UDF) שאתם בוחרים.
- אם צריך, אפשר ליצור הקשר והוראות לסוכן בצורה של מטא-נתונים של טבלה ושדה בהתאמה אישית, הוראות לסוכן לפרש את הנתונים ולשאול עליהם שאילתות, או על ידי יצירת שאילתות מאומתות (שנקראו בעבר שאילתות מוצלחות) כדי להגדיר את סוכן הנתונים כך שיענה ביעילות על שאלות לתרחישי שימוש ספציפיים.
לפני שמתאימים אישית סוכן, מומלץ קודם לעבוד עם ההקשר וההוראות שהסוכן יוצר.
דוגמאות להקשר ולהוראות שאתם יכולים לספק לסוכן:
- הקשר. אפשר להגדיר סוכן נתונים לניתוח מכירות כך שיבין שהמונח 'המובילים' מתייחס לנציגי מכירות עם ההכנסה הגבוהה ביותר, ולא רק לנציגים שסגרו הכי הרבה עסקאות.
- הוראות. אתם יכולים להנחות את סוכן הנתונים לסנן תמיד את הנתונים לפי הרבעון האחרון כשמבקשים ממנו מידע על 'מגמות', או לקבץ את התוצאות לפי 'קטגוריית מוצר' כברירת מחדל.
אחרי שיוצרים סוכני נתונים, אפשר לנהל איתם שיחות כדי לשאול שאלות על נתוני BigQuery באמצעות שפה טבעית. אתם יכולים גם ליצור שיחות ישירות עם מקור נתונים אחד או יותר כדי לקבל תשובות לשאלות בסיסיות חד-פעמיות.
ניתוח שיחות מבוסס על Gemini for Google Cloud ותומך בחלק מהפונקציות של BigQuery ML. מידע נוסף זמין במאמר בנושא תמיכה ב-BigQuery ML.
איך Gemini for Google Cloud משתמש בנתונים שלכם, ובאילו מקרים.
סוכני נתונים
סוכני נתונים מורכבים ממקור ידע אחד או יותר, ומקבוצת הוראות ספציפיות לתרחיש לדוגמה לעיבוד הנתונים. כשיוצרים סוכן נתונים, אפשר להגדיר אותו באמצעות האפשרויות הבאות:
- שימוש במקורות ידע כמו טבלאות, תצוגות ופונקציות מוגדרות על ידי המשתמש (UDF) עם סוכן נתונים.
- מספקים מטא-נתונים מותאמים אישית של טבלאות ושדות כדי לתאר את הנתונים בצורה המתאימה ביותר לתרחיש השימוש הנתון.
- לספק הוראות להבנה ולשאילת שאילתות לגבי הנתונים, למשל להגדיר את הפרטים הבאים:
- מילים נרדפות ומונחים עסקיים לשמות של שדות
- השדות הכי חשובים וערכי ברירת המחדל לסינון ולקיבוץ
- ליצור שאילתות מאומתות שסוכן הנתונים יכול להשתמש בהן כדי לעצב את מבנה התשובה של הסוכן וללמוד את הלוגיקה העסקית שבה הארגון שלכם משתמש. בעבר, שאילתות מאומתות נקראו שאילתות מוצלחות. בשאילתות מאומתות אפשר להשתמש בפונקציות נתמכות של BigQuery ML.
- ליצור מונחים מותאמים אישית במילון המונחים של BigQuery לכל סוכן או לייבא מונחים במילון המונחים הארגוני מ-Dataplex Universal Catalog. המונחים האלה עוזרים לסוכן לפרש את ההנחיות של המשתמש. במאמר יצירה או בדיקה של מונחים במילון המונחים מפורטות המלצות לגבי מתי כדאי להשתמש בכל אחד מהסוגים.
ניהול סוכני נתונים
בכרטיסייה Agent Catalog במסוף Google Cloud , אפשר ליצור ולנהל סוכני נתונים מהסוגים הבאים ולעבוד איתם:
- סוכן לדוגמה מוגדר מראש לכל Google Cloud פרויקט.
- רשימה של סוכנים שנמצאים בטיוטה, סוכנים שנוצרו וסוכנים שפורסמו.
- רשימה של סוכנים שאנשים אחרים יוצרים ומשתפים איתכם.
מידע נוסף זמין במאמר יצירת סוכני נתונים.
שירותים אחרים בפרויקט שתומכים בסוכני נתונים, כמו Conversational Analytics API ו-Looker Studio Pro, יכולים לגשת לסוכני נתונים שאתם יוצרים ב-BigQuery. אפשר גם לגשת לסוכן שנוצר במסוף Google Cloud באמצעות קריאה ל-API של ניתוח שיחות.
שיחות
שיחות הן צ'אטים שנשמרים עם סוכן נתונים או מקור נתונים. אתם יכולים לשאול סוכני נתונים שאלות מורכבות שכוללות מונחים נפוצים כמו 'מכירות' או 'הכי פופולרי', בלי שתצטרכו לציין שמות של שדות בטבלה או להגדיר תנאים לסינון הנתונים. אפשר גם לשאול שאלות לגבי נתונים שנמצאים באובייקטים כמו קובצי PDF.
התשובה שמתקבלת בצ'אט כוללת את התכונות הבאות:
- התשובה לשאלה שלכם כטקסט, קוד או תמונות (מולטימודאלית). התשובה יכולה לכלול פונקציות נתמכות של BigQuery ML.
- יצירת תרשימים במקומות הרלוונטיים.
- ההסבר של ה-Agent לתוצאות.
- מטא-נתונים על השיחה, כמו הסוכן ומקורות הנתונים שבהם נעשה שימוש.
כשיוצרים שיחה ישירה עם מקור נתונים, Conversational Analytics API מפרש את השאלה בלי ההקשר והוראות העיבוד שסוכן נתונים מספק. לכן, התוצאות של שיחות ישירות יכולות להיות פחות מדויקות. כדאי להשתמש בסוכני נתונים במקרים שבהם נדרשת רמת דיוק גבוהה יותר.
אפשר ליצור ולנהל שיחות ב-BigQuery באמצעות מסוףGoogle Cloud . מידע נוסף זמין במאמר ניתוח נתונים באמצעות שיחות.
תמיכה ב-BigQuery ML
ניתוח שיחות תומך בפונקציות הבאות של BigQuery ML בתגובה לצ'אטים עם סוכני נתונים ומקורות נתונים, ובשאילתות SQL מאומתות שאתם יוצרים.
AI.FORECASTAI.DETECT_ANOMALIES-
AI.GENERATE, כוללAI.GENERATE_BOOL,AI.GENERATE_INTוAI.GENERATE_DOUBLE
כדי להשתמש בפונקציות הנתמכות AI.GENERATE, צריך לוודא שיש לכם הרשאות נדרשות להרצת שאילתות של AI גנרטיבי.
תרחישי שימוש ב-BigQuery ML
כדי להפעיל פונקציות נתמכות של BigQuery ML, משתמשים בהן באחת מהדרכים הבאות:
- כשיוצרים סוכן ומוסיפים שאילתה מאומתת – לדוגמה, אם אתם מדעני נתונים שמכינים דוח חוזר – אתם יכולים להשתמש בפונקציות נתמכות של BigQuery ML בשאילתה מאומתת כדי לתאר ברירות מחדל ולבצע אוטומציה של הדוח.
- כששואלים סוכן שאלות כלליות על נתונים בשיחה או בשאילתה מאומתת באמצעות מילות מפתח, הסוכן יוצר את ה-SQL של BigQuery ML בתגובה לשאלות.
בטבלה הבאה מוצגות דוגמאות להנחיות חד-פעמיות שמפעילות את השימוש ב-BigQuery ML:
| תרחיש לדוגמה | דוגמאות לשימוש | מערך נתונים ציבורי |
|---|---|---|
| תחזיות | "Predict the number of trips for the next month" (תחזית של מספר הנסיעות בחודש הבא). | bigquery-public-data.san_francisco_bikeshare.bikeshare_trips |
| זיהוי חריגה | "Find outliers in trips per day for 2018 using 2017 as a baseline." | bigquery-public-data.san_francisco_bikeshare.bikeshare_trips |
| יצירת טקסט על ידי מודל שפה גדול (LLM) | "לכל כתבה בקטגוריה 'ספורט', סכם את העמודה 'גוף הכתבה' במשפט אחד או שניים". | bigquery-public-data.bbc_news.fulltext |
אבטחה
אתם יכולים לנהל את הגישה לניתוח נתוני שיחות ב-BigQuery באמצעות תפקידים והרשאות של IAM ב-Conversational Analytics API. במאמרים התפקידים הנדרשים של סוכן הנתונים והתפקידים הנדרשים של השיחה מוסבר אילו תפקידים נדרשים לפעולות ספציפיות.
מיקומים
ניתוח שיחות פועל באופן גלובלי, ואי אפשר לבחור את האזור שבו הוא יפעל.
תמחור
החיוב על שאילתות שמופעלות כשיוצרים סוכני נתונים ומנהלים שיחות עם סוכני נתונים או עם מקורות נתונים הוא לפי תמחור של BigQuery Compute. אין חיוב נוסף על יצירה ושימוש בסוכני נתונים ובשיחות במהלך תקופת התצוגה המקדימה.
שיטות מומלצות
כשמשתמשים בניתוח שיחות, השאילתות מופעלות באופן אוטומטי כדי לענות על השאלות. יכול להיות שייגבו מכם חיובים בלתי צפויים במקרים הבאים:
- אם הטבלאות גדולות
- אם השאילתות משתמשות באיחוד נתונים
- אם השאילתות מבצעות הרבה קריאות לפונקציות AI
כדי למנוע את הבעיה הזו, כדאי לקחת בחשבון את הגודל כשבוחרים מקורות ידע, וכשמנהלים שיחות, כדאי להשתמש בצירופים.
מכסת שימוש משותפת דינמית
מכסת השימוש הדינמית המשותפת (DSQ) ב-Vertex AI מנהלת את הקיבולת של מודל Gemini. בניגוד למכסות רגילות, DSQ מאפשרת לכם לגשת למאגר גדול של משאבים משותפים ללא מגבלה קבועה לכל פרויקט על תפוקת המודל.
הביצועים, כמו זמן האחזור, עשויים להשתנות בהתאם לעומס הכולל של המערכת. בזמנים של ביקוש גבוה במאגר המשותף, יכול להיות שתיתקלו מדי פעם בשגיאות זמניות ב-429 Resource Exhausted. השגיאות האלה מצביעות על כך שהקיבולת של המאגר המשותף מוגבלת באופן זמני, אבל לא על כך שהגעתם למגבלת מכסה ספציפית בפרויקט. כדי לבדוק את הקיבולת, צריך לנסות לשלוח את הבקשה שוב אחרי השהיה קצרה.