במסמך הזה מתוארת ארכיטקטורה ברמה גבוהה של אפליקציה שמריצה תהליך עבודה של מדעי הנתונים כדי לבצע אוטומציה של ניתוח נתונים מורכב ומשימות של למידת מכונה.
בארכיטקטורה הזו נעשה שימוש במערכי נתונים שמארחים ב-BigQuery או ב-AlloyDB ל-PostgreSQL. הארכיטקטורה היא מערכת מרובת סוכנים שמאפשרת למשתמשים להריץ פעולות באמצעות פקודות בשפה טבעית, ומבטלת את הצורך בכתיבת קוד SQL או Python מורכב.
קהל היעד של המסמך הזה כולל ארכיטקטים, מפתחים ואדמינים שיוצרים ומנהלים אפליקציות AI אקטיבי. הארכיטקטורה הזו מאפשרת לצוותים עסקיים ולצוותי נתונים לנתח מדדים במגוון רחב של תעשיות, כמו קמעונאות, פיננסים וייצור. המסמך מניח שיש לכם הבנה בסיסית של מערכות AI אקטיבי. כדי לקבל מידע על ההבדלים בין סוכנים לבין מערכות לא מבוססות-סוכנים, אפשר לעיין במאמר מה ההבדל בין סוכני AI, עוזרי AI ובוטים?
בקטע פריסה במסמך הזה יש קישורים לדוגמאות קוד שיעזרו לכם להתנסות בפריסה של אפליקציית AI אקטיבי שמריצה תהליך עבודה של מדעי הנתונים.
ארכיטקטורה
התרשים הבא מציג את הארכיטקטורה של סוכן בתהליך עבודה של מדעי הנתונים.
הארכיטקטורה הזו כוללת את הרכיבים הבאים:
| רכיב | תיאור |
|---|---|
| קצה קדמי | המשתמשים יוצרים אינטראקציה עם מערכת מרובת הסוכנים דרך קצה קדמי, כמו ממשק צ'אט, שפועלת כשירות Cloud Run בלי שרת. |
| סוכנים | הארכיטקטורה הזו משתמשת בסוכנים הבאים:
|
| Agents runtime | סוכני ה-AI בארכיטקטורה הזו נפרסים כשירותים ללא שרת (serverless) ב-Cloud Run. |
| ADK | ערכת ה-ADK מספקת כלים ומסגרת לפיתוח, לבדיקה ולפריסה של סוכנים. ADK מפשט את המורכבות של יצירת סוכנים ומאפשר למפתחי AI להתמקד בלוגיקה וביכולות של הסוכן. |
| מודל AI וזמני ריצה של מודלים | להצגת מסקנות, הסוכנים בארכיטקטורה לדוגמה הזו משתמשים במודל Gemini העדכני ב-Vertex AI. |
המוצרים שהשתמשו בהם
בדוגמה הזו של ארכיטקטורה נעשה שימוש במוצרים ובכלים הבאים Google Cloud ובקוד פתוח:
- Cloud Run: פלטפורמת מחשוב ללא שרת שמאפשרת להריץ קונטיינרים ישירות על גבי התשתית הניתנת להרחבה של Google.
- ערכה לפיתוח סוכנים (ADK): קבוצה של כלים וספריות לפיתוח, לבדיקה ולפריסה של סוכני AI.
- Vertex AI: פלטפורמה ללמידת מכונה שמאפשרת לאמן ולפרוס מודלים של למידת מכונה ואפליקציות מבוססות-AI, ולהתאים אישית מודלים של שפה גדולה (LLM) לשימוש באפליקציות מבוססות-AI.
- Gemini: משפחה של מודלים מולטי-מודאליים של AI שפותחו על ידי Google.
- BigQuery: מחסן נתונים ארגוני שעוזר לכם לנהל ולנתח את הנתונים באמצעות תכונות מובנות כמו למידת מכונה, ניתוח גיאוספציאלי ובינה עסקית.
- AlloyDB ל-PostgreSQL: שירות מנוהל של מסד נתונים שתואם ל-PostgreSQL, ומיועד לעומסי העבודה הכבדים ביותר, כולל עיבוד היברידי של טרנזקציות וניתוחים.
- MCP Toolbox for Databases: שרת Model Context Protocol (MCP) בקוד פתוח שמאפשר לסוכני AI להתחבר למסדי נתונים בצורה מאובטחת. השרת מנהל את המורכבויות של מסדי הנתונים, כמו איגום חיבורים, אימות ויכולת צפייה.
פריסה
כדי לפרוס הטמעה לדוגמה של הארכיטקטורה הזו, אפשר להשתמש במדעי הנתונים עם כמה סוכנים. המאגר מספק שני מערכי נתונים לדוגמה כדי להדגים את הגמישות של המערכת, כולל מערך נתונים של טיסות לניתוח תפעולי ומערך נתונים של מכירות במסחר אלקטרוני לניתוח עסקי.
המאמרים הבאים
- (סרטון) צפייה בפודקאסט Agent Factory על סוכני AI להנדסת נתונים ומדע נתונים.
- (Notebook) שימוש בסוכן מדע הנתונים ב-Colab Enterprise.
- איך מארחים סוכני AI ב-Cloud Run
- סקירה כללית של עקרונות והמלצות בנושא ארכיטקטורה שספציפיים לעומסי עבודה של AI ו-ML ב- Google Cloudזמינה בפרספקטיבה של AI ו-ML ב-Well-Architected Framework.
- לדוגמאות נוספות של ארכיטקטורות, תרשימים ושיטות מומלצות, עיינו במאמר Cloud Architecture Center.
שותפים ביצירת התוכן
מחבר: סמנתה הי | כותבת טכנית
תורמי תוכן אחרים:
- Amina Mansour | Head of Cloud Platform Evaluations Team
- קומאר דהנגופאל | מפתח פתרונות חוצי-מוצרים
- מייגן או'קיף | אחראית קשרי מפתחים
- רייצ'ל דיקון-סמית' | אחראית קשרי מפתחים
- Shir Meir Lador | Developer Relations Engineering Manager