במסמך הזה מתוארת ארכיטקטורה ברמה גבוהה של אפליקציה שמריצה תהליך עבודה של מדעי הנתונים כדי לבצע אוטומציה של ניתוח נתונים מורכב ומשימות של למידת מכונה.
בארכיטקטורה הזו נעשה שימוש במערכי נתונים שמארחים ב-BigQuery או ב-AlloyDB ל-PostgreSQL. הארכיטקטורה היא מערכת מרובת סוכנים שמאפשרת למשתמשים להריץ פעולות בפקודות בשפה טבעית, והיא מבטלת את הצורך בכתיבת קוד SQL או Python מורכב.
המסמך הזה מיועד לארכיטקטים, למפתחים ולאדמינים שיוצרים ומנהלים אפליקציות AI אקטיבי. הארכיטקטורה הזו מאפשרת לצוותים עסקיים ולצוותי נתונים לנתח מדדים במגוון רחב של ענפים, כמו קמעונאות, פיננסים וייצור. ההנחה במסמך הזה היא שיש לכם הבנה בסיסית של מערכות AI אקטיבי. מידע על ההבדלים בין סוכנים לבין מערכות לא סוכניות זמין במאמר מה ההבדל בין סוכני AI, עוזרי AI ובוטים?
בקטע פריסה במסמך הזה יש קישורים לדוגמאות קוד שיעזרו לכם להתנסות בפריסה של אפליקציית AI אקטיבי שמריצה תהליך עבודה של מדע הנתונים.
ארכיטקטורה
התרשים הבא מציג את הארכיטקטורה של סוכן בתהליך עבודה של מדע הנתונים.
הארכיטקטורה הזו כוללת את הרכיבים הבאים:
| רכיב | תיאור |
|---|---|
| קצה קדמי | המשתמשים יוצרים אינטראקציה עם מערכת מרובת הסוכנים דרך ממשק קצה, כמו ממשק צ'אט, שפועל כשירות Cloud Run ללא שרת. |
| נציגים | הארכיטקטורה הזו משתמשת בסוכנים הבאים:
|
| זמן ריצה של סוכנים | סוכני ה-AI בארכיטקטורה הזו נפרסים כשירותים ללא שרת (serverless) ב-Cloud Run. |
| ADK | ADK מספק כלים ומסגרת לפיתוח, לבדיקה ולפריסה של סוכנים. ADK מפשט את המורכבות של יצירת סוכנים ומאפשר למפתחי AI להתמקד בלוגיקה וביכולות של הסוכן. |
| מודל AI וזמני ריצה של מודלים | לצורך הסקת מסקנות, הסוכנים בארכיטקטורה לדוגמה הזו משתמשים במודל Gemini העדכני ב-Vertex AI. |
המוצרים שהשתמשו בהם
בדוגמה הזו של ארכיטקטורה נעשה שימוש במוצרים ובכלים הבאים Google Cloud ובקוד פתוח:
- Cloud Run: פלטפורמת מחשוב ללא שרת שמאפשרת להריץ קונטיינרים ישירות על גבי התשתית הניתנת להרחבה של Google.
- ערכת פיתוח סוכנים (ADK): קבוצה של כלים וספריות לפיתוח, לבדיקה ולפריסה של סוכני AI.
- Vertex AI: פלטפורמה ללמידת מכונה שמאפשרת לאמן ולפרוס מודלים של למידת מכונה ואפליקציות מבוססות-AI, ולהתאים אישית מודלים גדולים של שפה (LLM) לשימוש באפליקציות מבוססות-AI.
- Gemini: משפחה של מודלים מולטי-מודאליים של AI שפותחו על ידי Google.
- BigQuery: מחסן נתונים ארגוני שעוזר לכם לנהל ולנתח את הנתונים באמצעות תכונות מובנות כמו למידת מכונה, ניתוח גיאוספציאלי ובינה עסקית.
- AlloyDB ל-PostgreSQL: שירות מסד נתונים מנוהל במלואו, שתואם ל-PostgreSQL ומיועד לעומסי העבודה התובעניים ביותר, כולל עיבוד היברידי של טרנזקציות וניתוחים.
- MCP Toolbox for Databases: שרת Model Context Protocol (MCP) עם קוד פתוח, שמאפשר לסוכני AI להתחבר למסדי נתונים בצורה מאובטחת על ידי ניהול של מורכבויות במסדי נתונים כמו איגום חיבורים, אימות ויכולת צפייה.
פריסה
כדי לפרוס הטמעה לדוגמה של הארכיטקטורה הזו, אפשר להשתמש בData Science with Multiple Agents. מאגר המידע כולל שני מערכי נתונים לדוגמה שממחישים את הגמישות של המערכת, כולל מערך נתונים של טיסות לניתוח תפעולי ומערך נתונים של מכירות במסחר אלקטרוני לניתוח עסקי.
המאמרים הבאים
- (סרטון) צפייה בפודקאסט Agent Factory על סוכני AI להנדסת נתונים ומדע נתונים.
- (Notebook) שימוש בסוכן מדע הנתונים ב-Colab Enterprise.
- איך מארחים סוכני AI ב-Cloud Run
- סקירה כללית של עקרונות והמלצות לארכיטקטורה שספציפיים לעומסי עבודה של AI ו-ML ב- Google Cloudזמינה בפרספקטיבת ה-AI וה-ML ב-Well-Architected Framework.
- לדוגמאות נוספות של ארכיטקטורות, תרשימים ושיטות מומלצות, עיינו במאמר Cloud Architecture Center.
שותפים ביצירת התוכן
מחבר: סמנתה הי | כותבת טכנית
תורמי תוכן אחרים:
- אמינה מנסור | ראש צוות הערכות של Cloud Platform
- קומאר דהנגופאל | מפתח פתרונות חוצי-מוצרים
- מייגן או'קיף | אחראית קשרי מפתחים
- רייצ'ל דיקון-סמית' | אחראית קשרי מפתחים
- שיר מאיר לדור | מנהלת הנדסה של קשרי מפתחים