Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

תרחיש לדוגמה לשימוש ב-AI אקטיבי: סיווג נתונים מרובי-אופנים

Last reviewed 2026-03-03 UTC

במאמר הזה מוצגת ארכיטקטורה ברמה גבוהה של מערכת AI עם כמה סוכנים שנפרסת ב-Cloud Run, שמנתחת נתונים מולטימודליים שונים ומפיקה סיווג ברמת מהימנות גבוהה. הגישה הזו מאמתת צולבת מדיה מקוטעת על ידי התאמת נתונים בזמן אמת לנתוני אמת היסטוריים, כדי להפיק תובנות מבוססות שניתן לאמת.

המסמך הזה מיועד לארכיטקטים, למפתחים ולמנהלים שבונים ומנהלים תשתית ואפליקציות של AI בענן. ההנחה במסמך הזה היא שיש לכם הבנה בסיסית של סוכני AI ומודלים של AI. במסמך לא מופיעות הנחיות ספציפיות לעיצוב ולתכנות של סוכני AI.

בקטע פריסה במסמך הזה מופיעות דוגמאות לקוד שאפשר להשתמש בהן כדי ללמוד איך ליצור ולפרוס מערכות AI מרובות סוכנים.

ארכיטקטורה

בתרשים הבא מוצגת הארכיטקטורה של מערכת AI מרובת סוכנים שמשתמשת בתבנית עיצוב של סוכנים מקבילים כדי לתאם ניתוח עצמאי של נתונים מולטי-מודאליים, ולהפיק סיווג יחיד.

ארכיטקטורה של מערכת AI עם כמה סוכנים שמסווגת נתונים מולטי-מודאליים.

הארכיטקטורה מציגה את זרימת הנתונים הבאה:

אפליקציית האינטרנט שולחת בקשה לסוכן הבסיסי כדי לנתח קבוצה של נתונים מרובי-אופנים לצורך סיווג. סוכן הבסיס הוא סוכן מתאם שמקבל בקשות ונפרס בשירות Cloud Run.
סוכן הבסיס מטפל בבקשה באופן הבא:
1. הסוכן הראשי יוזם before_agent_callback כדי לאסוף הגדרות סביבה, לאמת את קלט של משתמשים ולשמור נתיבי משאבים במצב סשן משותף. לכל הסוכנים המשניים יש גישה למצב הסשן המשותף, כך שלא צריך לבצע קריאות מיותרות כדי לאחזר נתוני מצב, והחביון הכולל קטן יותר.
2. הסוכן הראשי משתמש ב-Gemini ב-Gemini Enterprise Agent Platform כדי לפרש את הבקשה של המשתמש ולהפיץ משימות לסוכני משנה מיוחדים שפועלים במקביל.
כל סוכן משנה מתמחה בתחום מסוים ומבצע את המשימות הבאות באופן עצמאי:
1. סוכני המשנה לניתוח תמונות וסרטונים מקיימים אינטראקציה עם שרתים מותאמים אישית של Model Context Protocol‏ (MCP) כדי לבצע את הפעולות הבאות:
  1. אחזור נתונים לא מעובדים ולא מובנים שמאוחסנים בקטגוריה של Cloud Storage.
  2. שולחים בקשה ל-Gemini לפרש את נתוני הקלט, לסווג את הנתונים ולחשב את רמת הביטחון.
  3. ‫Gemini שולח את הסיווג המוצע ואת רמת הביטחון בחזרה לשרת ה-MCP המותאם אישית.
  4. שרת ה-MCP המותאם אישית מעביר את התגובה בחזרה לסוכן המשנה.
2. סוכן המשנה לניתוח נתונים מובְנים מתאם את הניתוח על ידי השלמת המשימות הבאות:
  1. מתקשר עם שרת BigQuery MCP כדי לאחזר נתונים מובְנים והקשריים (כמו רשומות היסטוריות, יומני אירועים או קריאות של חיישנים) שמאוחסנים במערך נתונים של BigQuery.
  2. הכלי לניתוח נתונים מובנים שולח בקשה ל-Gemini כדי לפרש את נתוני הקלט, לסווג את הנתונים ולחשב רמת סמך.
  3. ‫Gemini שולח את הסיווג המוצע ואת רמת הוודאות בחזרה לסוכן המשנה.
כל סוכן משנה שולח בחזרה לסוכן הבסיסי את הסיווג המוצע ואת רמת הביטחון.
הסוכן הראשי משתמש ב-Gemini כדי לסכם את התוצאות של סוכני המשנה המיוחדים, וכך ליצור סיווג יחיד ברמת מהימנות גבוהה.
- אם רוב הסיווגים מסוכני המשנה המיוחדים תואמים, סוכן הבסיס שולח את הסיווג התואם לאפליקציית האינטרנט.
- אם סוכני המשנה לא מספקים סיווג תואם, סוכן הבסיס בוחר את הסיווג עם רמת הסמך הגבוהה ביותר ושולח אותו לאפליקציית האינטרנט.

המוצרים שהשתמשו בהם

ארכיטקטורת ההפניה הזו משתמשת במוצרים ובכלים הבאים: Google Cloud

‫ Cloud Run: פלטפורמת מחשוב ללא שרת שמאפשרת להריץ קונטיינרים ישירות על גבי התשתית הניתנת להרחבה של Google.
‫Gemini Enterprise Agent Platform: פלטפורמה מקיפה שמאפשרת לכם ליצור סוכני AI ברמה ארגונית, להרחיב את השימוש בהם, לנהל אותם ולבצע אופטימיזציה שלהם.
‫ Gemini : משפחה של מודלים מולטי-מודאליים של AI שפותחו על ידי Google.

BigQuery: מחסן נתונים ארגוני שעוזר לכם לנהל ולנתח את הנתונים באמצעות תכונות מובנות כמו למידת מכונה, ניתוח גיאוספציאלי ובינה עסקית.
‫ Cloud Storage: מאגר אובייקטים ללא הגבלה בעלות נמוכה, לשימוש עם סוגים שונים של נתונים. אפשר לגשת לנתונים מתוך Google Cloudומחוץ להם, והם משוכפלים במיקומים שונים כדי ליצור יתירות.
שרתי Google Cloud MCP: שירותים מרוחקים שמנוהלים על ידי Google ומיישמים את Model Context Protocol‏ (MCP) כדי לספק לאפליקציות מבוססות-AI גישה למוצרים ולשירותים של Google. Google Cloud
Model Context Protocol‏ (MCP): תקן קוד פתוח לחיבור אפליקציות מבוססות-AI למערכות חיצוניות.
‫Agent Development Kit (ADK): ערכה של כלים וספריות לפיתוח, לבדיקה ולפריסה של סוכני AI.

מידע על בחירת רכיבים חלופיים למערכת AI אקטיבי, כולל framework, Agent Runtime, כלים, זיכרון ודפוסי עיצוב, זמין במאמר בחירת רכיבי הארכיטקטורה של AI אקטיבי.

תרחיש שימוש

הארכיטקטורה הזו מיועדת לתרחישי שימוש שבהם מתבצעת סינתזה של נתונים מגוונים ממקורות שונים לצורך משימות סיווג וזיהוי. כדי לשפר את הדיוק ואת יכולת ההתאמה, הארכיטקטורה משתמשת במערכת AI מרובת סוכנים במקום בגישה מונוליטית של סוכן יחיד. דפוס העיצוב הזה מספק הוראות ממוקדות, מונע הנחיות סותרות, מאפשר להשתמש במערכות קטנות יותר של כלים כדי לקבל החלטות מהר יותר, ותומך בעדכונים עצמאיים. כל אלה מובילים לתוצאות חזקות ומתוחכמות יותר.

הנה כמה דוגמאות לתרחישי שימוש בארכיטקטורה שמתוארת במסמך הזה:

אבחון רפואי: אפשר לספק הערכות אבחון מקיפות באמצעות פריסת סוכנים ייעודיים לניתוח עצמאי של תמונות רפואיות, תסמינים של מטופלים ותוצאות בדיקות מעבדה. מערכת ה-AI מסכמת את הממצאים האלה על סמך סף מהימנות שנקבע, כדי לספק לרופאים תובנות מבוססות וניתנות לאימות.
זיהוי הונאות: כדי לזהות הונאות פוטנציאליות ולסמן אותן, אפשר לפרוס סוכנים שינתחו באופן עצמאי דפוסי התנהגות של משתמשים ונתוני עסקאות, כמו קבלות סרוקות וחשבוניות של מוֹכרים. המערכת משווה בין ראיות ויזואליות ממסמכים לבין פעילות ברשת הדיגיטלית, מזהה אי-התאמות ומסמנת עסקאות שבהן סוכן יחיד מזהה אינדיקטור חשוד.
עיבוד מסמכים: אפשר להטמיע סוכנים ייעודיים לזיהוי תווים אופטי (OCR), לסיווג מסמכים ולשליפת נתונים כדי לבצע אוטומציה של סיווג ושליפה של מידע ממסמכים. כדי לתמוך בעיבוד ברמת מהימנות גבוהה, מערכת ה-AI דורשת שכל הסוכנים יסכימו על הפלט.
בקרת איכות: אפשר לסווג את איכות המוצר או לזהות אנומליות באמצעות סוכנים ייעודיים לבדיקה חזותית, לניתוח נתוני חיישנים ולבדיקת מפרטים. המערכת קובעת אם התוצאה היא 'עבר' או 'נכשל' על סמך סף מהימנות שנקבע בין הסוכנים.

שיקולים בתכנון

כדי להטמיע את הארכיטקטורה הזו בסביבת ייצור, כדאי לפעול לפי ההמלצות הבאות:

אבטחת הסוכן: כדי להגביל את היכולת של הסוכן לבצע פעולות מסוכנות, צריך ליצור זהות סוכן ולאחר מכן לאבטח את הגישה לשרתי ה-MCP באמצעות מאפיינים של ניהול זהויות והרשאות גישה (IAM). יישום העיקרון של הרשאות מינימליות יכול לעזור לכם לוודא שמערכת ה-AI האגנטית מתנהגת בצורה צפויה ומונעת גישת קריאה-כתיבה לא מכוונת למשאבי הייצור שלכם.
אבטחת תעבורת נכנסת: כדי לשלוט בגישה לאפליקציה, משביתים את כתובת ה-URL שמוגדרת כברירת מחדל ב-run.app של שירות Cloud Run בחלק הקדמי, ומגדירים מאזן עומסים חיצוני אזורי של אפליקציות. בנוסף לאיזון העומסים של התנועה הנכנסת לאפליקציה, מאזן העומסים מטפל בניהול אישורי SSL. כדי להוסיף שכבת הגנה, אפשר להשתמש בכללי מדיניות האבטחה של Google Cloud Armor כדי לספק סינון בקשות, הגנה מפני מתקפות DDoS והגבלת קצב של יצירת בקשות לשירות.
אבטחת קובצי אימג' של קונטיינרים: כדי לוודא שרק קובצי אימג' מורשים של קונטיינרים נפרסים ב-Cloud Run, צריך להשתמש ב-Binary Authorization. כדי לזהות סיכוני אבטחה בתמונות של קונטיינרים ולצמצם אותם, אפשר להריץ באופן אוטומטי סריקות של נקודות חולשה באמצעות Artifact Analysis. מידע נוסף זמין במאמר סקירה כללית על סריקת קונטיינרים.
יצירת הנחיות חסכוניות: האורך של ההנחיות (קלט) והתגובות שנוצרות (פלט) משפיע ישירות על הביצועים והעלות. כתבו הנחיות קצרות וישירות שמספקות מספיק הקשר. מידע נוסף זמין במאמר בנושא שיטות מומלצות לעיצוב הנחיות.
עלויות אחסון: כדי לשלוט בעלויות האחסון, אפשר לבחור בStandard Storage ולהפעיל את ניהול מחזור החיים של אובייקטים ואת הסיווג האוטומטי. התכונות האלה עוזרות לכם לייעל את העלויות על ידי העברה או מחיקה אוטומטית של נתונים בין סוגי אחסון, על סמך דפוסי הגישה או הכללים שאתם מגדירים.
אבטחת אחסון: Cloud Storage תומך בשתי שיטות לשליטה בגישת המשתמשים לקטגוריות ולאובייקטים: IAM ורשימות של בקרת גישה (ACL). ברוב המקרים מומלץ להשתמש ב-IAM, שמאפשר לתת הרשאות ברמת הקטגוריה והפרויקט. מידע נוסף זמין במאמר סקירה כללית על בקרת גישה.
הקצאת משאבים: בהתאם לדרישות הביצועים, מגדירים את מגבלות הזיכרון ואת מגבלות המעבד שיוקצו לשירות Cloud Run. הנחיות נוספות לאופטימיזציה של הביצועים זמינות במאמר בנושא טיפים כלליים לפיתוח ב-Cloud Run.

מידע על גורמי עיצוב ושיטות מומלצות, והמלצות לגבי בנייה ופריסה של מערכת AI מרובת סוכנים, זמין במאמר מערכת AI מרובת סוכנים ב- Google Cloud.

פריסה

כדי לפרוס הטמעה לדוגמה של הארכיטקטורה הזו, אפשר לנסות את שיעור Codelab בנושא Way Back Home Level 1.

המאמרים הבאים

איך מארחים סוכני AI ב-Cloud Run
איך מפתחים ופורסים שרת MCP מרוחק ב-Cloud Run
איך בוחרים את רכיבי הארכיטקטורה של AI אקטיבי
(סרטון) צפייה בפודקאסט Agent Factory על יצירת כלים מותאמים אישית לסוכנים.
כדי ליצור ולפרוס סוכני AI ברמת הארגון, תוכלו להיעזר במקורות מידע ללימודים של Gemini Enterprise Agent Ready‏ (GEAR).
עולם תוכן מורחב: מדריכים לארכיטקטורת AI אקטיבי
סקירה כללית של עקרונות והמלצות בנושא ארכיטקטורה שספציפיים לעומסי עבודה של AI ו-ML ב- Google Cloudמופיעה בפרספקטיבה של AI ו-ML ב-Well-Architected Framework.
לדוגמאות נוספות של ארכיטקטורות, תרשימים ושיטות מומלצות, עיינו במאמר Cloud Architecture Center.

שותפים ביצירת התוכן

מחבר: סמנתה הי | כותבת טכנית

תורמי תוכן אחרים:

אמינה מנסור | ראש צוות הערכות של Cloud Platform
Andrey Shakirov | Solutions Architect, Google Cloud
Ayo Adedeji | Developer Relations Engineer
Christina Lin | Developer Relations Engineer Manager
קומאר דהנגופאל | מפתח פתרונות חוצי-מוצרים
ריאן פיי | מנהל מוצר, Google Cloud

תרחיש לדוגמה לשימוש ב-AI אקטיבי: סיווג נתונים מרובי-אופנים קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.