מבוא ל-AI ב-BigQuery

‫BigQuery מציע יכולות שונות של AI שמאפשרות לכם:

  • ביצוע למידת מכונה (ML) לחיזוי.
  • להריץ הסקה על מודלים גדולים של שפה (LLM) כמו Gemini.
  • פיתוח אפליקציות באמצעות הטמעות וחיפוש וקטורי.
  • שימוש בסוכנים מובנים כדי לקבל עזרה בתכנות.
  • יצירת צינורות נתונים.
  • גישה לפונקציונליות של BigQuery באמצעות כלי סוכן.

למידת מכונה

באמצעות BigQuery ML, אתם יכולים לאמן מודלים, להעריך אותם ולהריץ הסקה לביצוע משימות כמו חיזוי סדרות עיתיות, זיהוי אנומליות, סיווג, רגרסיה, אשכולות, צמצום ממדיות והמלצות.

אפשר לעבוד עם היכולות של BigQuery ML דרך מסוףGoogle Cloud , כלי שורת הפקודה של BigQuery,‏ API בארכיטקטורת REST או במחברות Colab Enterprise. ‫BigQuery ML מאפשר למומחי SQL להשתמש בכלים ובכישורים קיימים של SQL כדי ליצור מודלים ולהעריך אותם. כך הוא הופך את למידת המכונה לנגישה יותר ומזרז את פיתוח המודלים, כי הוא מביא את למידת המכונה אל הנתונים במקום לדרוש העברת נתונים. אתם יכולים להשתמש ב-BigQuery ML כדי לבצע את סוגי המשימות הבאים של למידת מכונה:

מידע נוסף זמין במאמר מבוא ל-ML ב-BigQuery.

פונקציות AI

ב-BigQuery יש פונקציות SQL שונות שאפשר להשתמש בהן למשימות AI כמו יצירת טקסט, ניתוח טקסט או נתונים לא מובנים ותרגום. הפונקציות האלה ניגשות ל-Gemini ולמודלים של שותפים מסוג LLM שזמינים מ-Vertex AI, מממשקי Cloud AI API או ממודלים מובנים של BigQuery כדי לבצע את המשימות האלה.

יש כמה קטגוריות של פונקציות AI:

  • פונקציות של AI גנרטיבי. הפונקציות האלה עוזרות לכם לבצע משימות כמו יצירת תוכן, ניתוח, סיכום, חילוץ נתונים מובנים, סיווג, יצירת הטמעה והעשרת נתונים. יש שני סוגים של פונקציות AI גנרטיביות:

    • פונקציות AI לשימוש כללי מאפשרות לכם שליטה מלאה ושקיפות בבחירת המודל, ההנחיה והפרמטרים לשימוש.
    • פונקציות AI מנוהלות מציעות תחביר יעיל למשימות שגרתיות כמו סינון, דירוג וסיווג. ‫BigQuery יכול לבחור בשבילכם מודל לאופטימיזציה של העלות והאיכות.
  • פונקציות ספציפיות למשימות. הפונקציות האלה עוזרות לכם להשתמש ב-Cloud AI APIs למשימות כמו:

מידע נוסף זמין במאמר סקירה כללית של פתרונות שמתאימים למשימות ספציפיות.

‫BigQuery מציע מגוון של פונקציות ותכונות חיפוש שיעזרו לכם למצוא ביעילות נתונים ספציפיים או לגלות קווי דמיון בין נתונים, כולל נתונים מולטימודליים.

  • חיפוש טקסט. אפשר להשתמש בפונקציה SEARCH כדי לבצע חיפוש באמצעות אסימונים בטקסט לא מובנה או בנתוני JSON חצי מובנים. כדי לשפר את ביצועי החיפוש, אפשר ליצור אינדקס חיפוש, שמאפשר ל-BigQuery לבצע אופטימיזציה של שאילתות שמשתמשות בפונקציה SEARCH, וגם בפונקציות ובאופרטורים אחרים. מידע נוסף זמין במאמר חיפוש נתונים שנוספו לאינדקס.

  • יצירת הטמעה. הטמעה היא וקטור מספרי רב-ממדי שמייצג ישויות כמו טקסט או תמונות, ולרוב נוצר על ידי מודלים של ML. אתם יכולים ליצור הטבעות מולטימודאליות באמצעות מודלים שסופקו על ידי Vertex AI או מתארחים בו, או באמצעות מודלים שיובאו והופעלו ב-BigQuery.

    אפשר גם להגדיר ש-BigQuery יעדכן באופן אוטומטי עמודה של הטמעות באמצעות הפעלה של יצירת הטמעות אוטונומית (גרסת Preview).

  • חיפוש וקטורי. אפשר להשתמש בפונקציה VECTOR_SEARCH כדי לחפש הטמעות ולמצוא פריטים דומים מבחינה סמנטית. אפשר להשתמש בפונקציה AI.SEARCH (תצוגה מקדימה) כדי לחפש בטבלאות שמופעל בהן יצירה אוטונומית של הטמעה. כדי לשפר את הביצועים של חיפוש וקטורי, אפשר ליצור אינדקס וקטורי שמשתמש בטכניקות חיפוש של השכן הקרוב ביותר המשוער כדי לספק תוצאות מהירות יותר ומשוערות יותר.

    תרחישי שימוש נפוצים בחיפוש וקטורי כוללים חיפוש סמנטי, המלצות ויצירה משולבת-אחזור (RAG). מידע נוסף זמין במאמר מבוא לחיפוש וקטורי.

תכונות AI שמסייעות

תכונות העזרה מבוססות-AI ב-BigQuery, שנקראות ביחד Gemini ב-BigQuery, עוזרות לכם לגלות, להכין, לשלוח שאילתות לגבי הנתונים ולהציג אותם באופן חזותי.

  • תובנות מנתונים. ליצור שאלות בשפה טבעית לגבי הנתונים, יחד עם שאילתות ה-SQL שיענו על השאלות האלה.
  • הכנת נתונים. ליצור המלצות בהתאם להקשר כדי לנקות, לשנות ולהעשיר את הנתונים.
  • עזרה בכתיבת קוד SQL יצירה, השלמה והסבר של שאילתות SQL.
  • עזרה בכתיבת קוד Python. יצירה, השלמה והסבר של קוד Python, כולל PySpark ו-BigQuery DataFrames.
  • קנבס נתונים. אפשר לשלוח שאילתות לנתונים בשפה טבעית, להציג את התוצאות בתרשימים ולשאול שאלות המשך.
  • כלי לתרגום SQL אתם יכולים ליצור כללי תרגום של SQL שמשופרים על ידי Gemini כדי לעזור לכם להעביר שאילתות שנכתבו בדיאלקט אחר ל-GoogleSQL.

נציגים

סוכנים הם כלי תוכנה שיכולים להשתמש ב-AI כדי להשלים משימות בשמכם. אתם יכולים להשתמש בסוכנים מובנים או ליצור סוכנים משלכם כדי לעבד, לנהל, לנתח ולהמחיש את הנתונים:

  • אפשר להשתמש בסוכן מדע הנתונים כדי לבצע אוטומציה של ניתוח נתונים ראשוני, עיבוד נתונים, משימות של למידת מכונה ותובנות לגבי ויזואליזציה במחברת Colab Enterprise.

  • אפשר להשתמש בסוכן הנדסת הנתונים כדי ליצור, לשנות ולנהל צינורות עיבוד נתונים לטעינה ולעיבוד של נתונים ב-BigQuery. אתם יכולים להשתמש בהנחיות בשפה טבעית כדי ליצור צינורות להעברת נתונים ממקורות נתונים שונים, או להתאים צינורות קיימים להעברת נתונים לצרכים שלכם בתחום הנדסת הנתונים.

  • אפשר להשתמש בסוכן לניתוח נתונים בשיחה כדי לנהל צ'אט עם הנתונים בשפה יומיומית. הסוכן הזה מורכב ממקור נתונים אחד או יותר ומקבוצה של הוראות ספציפיות לתרחיש שימוש לעיבוד הנתונים האלה. ניתוח שיחות תומך בשימוש בחלק מהפונקציות של BigQuery ML.

  • אתם יכולים להשתמש ב-Gemini CLI כדי ליצור אינטראקציה עם נתונים ב-BigQuery במסוף באמצעות הנחיות בשפה טבעית.

  • אפשר ליצור סוכן באמצעות ערכת הכלים של MCP בקוד פתוח או כלי ADK כדי לפתח סוכן במהירות ובאופן איטרטיבי.

המאמרים הבאים