מערכת AI מרובת סוכנים ב-Google Cloud

Last reviewed 2025-09-16 UTC

במאמר הזה מוצגת ארכיטקטורת הפניה שתעזור לכם לתכנן מערכות AI חזקות עם כמה סוכנים ב- Google Cloud. מערכת AI מרובת סוכנים מבצעת אופטימיזציה של תהליכים מורכבים ודינמיים על ידי פילוח שלהם למשימות נפרדות, שסוכני AI מיוחדים רבים מבצעים בשיתוף פעולה.

המסמך הזה מיועד לארכיטקטים, למפתחים ולמנהלים שיוצרים ומנהלים תשתית ואפליקציות של AI בענן. ההנחה במסמך הזה היא שיש לכם הבנה בסיסית של סוכני AI ומודלים. במסמך לא מופיעות הנחיות ספציפיות לתכנון ולקידוד של סוכני AI.

בקטע פריסה של המסמך הזה מופיעות דוגמאות לקוד שאפשר להשתמש בהן כדי ללמוד איך לבנות ולפרוס מערכות AI מרובות סוכנים.

ארכיטקטורה

בתרשים הבא מוצגת ארכיטקטורה לדוגמה של מערכת AI מרובת סוכנים שנפרסת ב- Google Cloud.

ארכיטקטורה של מערכת AI מרובת סוכנים ב- Google Cloud. ארכיטקטורה של מערכת AI מרובת סוכנים ב- Google Cloud.

רכיבי ארכיטקטורה

ארכיטקטורת הדוגמה בקטע הקודם כוללת את הרכיבים הבאים:

רכיב תיאור
קצה קדמי המשתמשים יוצרים אינטראקציה עם מערכת מרובת הסוכנים דרך ממשק קצה, כמו ממשק צ'אט, שפועל כשירות Cloud Run ללא שרת.
נציגים

בדוגמה הזו, סוכן מתאם שולט במערכת ה-AI האקטיבי. הסוכן המתאם מפעיל סוכן משנה מתאים כדי להפעיל את התהליך של הסוכן. הסוכנים יכולים לתקשר ביניהם באמצעות הפרוטוקול Agent2Agent‏ (A2A), שמאפשר אינטראופרביליות בין סוכנים ללא קשר לשפת התכנות ולזמן הריצה שלהם. בדוגמה לארכיטקטורה מוצגים סוכנים בדפוס רציף ובדפוס של שיפור איטרטיבי.

מידע נוסף על סוכני המשנה בדוגמה הזו זמין בקטע תהליך מבוסס-סוכנים.

זמן ריצה של סוכנים אפשר לפרוס סוכני AI כשירותי Cloud Run ללא שרתים, כאפליקציות בקונטיינרים ב-Google Kubernetes Engine‏ (GKE) או ב-Vertex AI Agent Engine.
ADK הערכה לפיתוח סוכנים (ADK) מספקת כלים ומסגרת לפיתוח, לבדיקה ולפריסה של סוכנים. ערכת ה-ADK מפשטת את תהליך יצירת הסוכן ומאפשרת למפתחי AI להתמקד בלוגיקה וביכולות של הסוכן.
מודל AI וזמני ריצה של מודלים לצורך מילוי בקשות, הסוכנים בארכיטקטורה לדוגמה הזו משתמשים במודל AI ב-Vertex AI. בארכיטקטורה מוצגים Cloud Run ו-GKE כסביבות ריצה חלופיות למודל ה-AI שבוחרים להשתמש בו.
Model Armor ‫הגנה מוגברת על המודל מאפשרת בדיקה וניקוי של קלט ותשובות למודלים שנפרסו ב-Vertex AI וב-GKE. מידע נוסף זמין במאמר בנושא שילוב של הגנה מוגברת על המודל עם שירותי Google Cloud .
לקוחות, שרתים וכלים של MCP Model Context Protocol‏ (MCP) מאפשר גישה לכלים על ידי סטנדרטיזציה של האינטראקציה בין סוכנים לכלים. לכל צמד של סוכן וכלי, לקוח MCP שולח בקשות לשרת MCP שדרכו הסוכן ניגש לכלי כמו מסד נתונים, מערכת קבצים או API.

תהליך סוכני

בדוגמה של מערכת מרובת סוכנים בארכיטקטורה הקודמת, התהליך הוא כזה:

  1. משתמש מזין הנחיה דרך ממשק קצה, כמו ממשק צ'אט, שפועל כשירות ללא שרת (serverless) ב-Cloud Run.
  2. הקצה הקדמי מעביר את ההנחיה לסוכן מתאם.
  3. הסוכן המתאם מתחיל אחד מהתהליכים הבאים שמבוססים על סוכנים, בהתאם לכוונה שמופיעה בהנחיה.

    • Sequential:
      1. סוכן משנה של משימה-א' מבצע משימה.
      2. סוכן משנה של משימה א' מפעיל סוכן משנה של משימה א'.1.
    • שיפורים איטרטיביים:

      1. הסוכן המשני של משימה ב' מבצע משימה.
      2. סוכן המשנה להערכת איכות בודק את הפלט של סוכן המשנה task-B.
      3. אם הפלט לא מספק, בודק האיכות מפעיל את סוכן המשנה לשיפור ההנחיות כדי לשפר את ההנחיה.
      4. סוכן המשנה task-B מבצע שוב את המשימה שלו באמצעות ההנחיה המשופרת.

      התהליך הזה נמשך עד שהפלט משביע רצון או עד שמגיעים למספר המקסימלי של האיטרציות.

    ארכיטקטורת הדוגמה כוללת נתיב human-in-the-loop שמאפשר למשתמשים אנושיים להתערב בתהליך של הסוכן כשצריך.

  4. הסוכן המשנה task-A.1 והסוכן המשנה quality evaluator מפעילים באופן עצמאי את הסוכן המשנה response generator.

  5. סוכן המשנה ליצירת תשובות יוצר תשובה, מבצע בדיקות אימות וביסוס, ואז שולח את התשובה הסופית למשתמש דרך סוכן המתאם.

מוצרים וכלים שבהם נעשה שימוש

ארכיטקטורת ההפניה הזו משתמשת במוצרים ובכלים הבאים של Google Cloud ושל צד שלישי:

  • Cloud Run: פלטפורמת מחשוב ללא שרת שמאפשרת להריץ קונטיינרים ישירות על גבי התשתית הניתנת להרחבה של Google.
  • Vertex AI: פלטפורמה ללמידת מכונה שמאפשרת לאמן ולפרוס מודלים של למידת מכונה ואפליקציות מבוססות-AI, ולהתאים אישית מודלים גדולים של שפה (LLM) לשימוש באפליקציות מבוססות-AI.
  • Google Kubernetes Engine‏ (GKE): שירות Kubernetes שבו אפשר להשתמש כדי לפרוס אפליקציות בקונטיינרים ולהפעיל אותן בהיקף גדול באמצעות התשתית של Google.
  • הגנה מוגברת על המודל: שירות שמספק הגנה למשאבי AI גנרטיבי ו-AI אקטיבי מפני החדרת הנחיות, דליפות נתונים ותוכן פוגעני.
  • ערכת פיתוח סוכנים (ADK): קבוצה של כלים וספריות לפיתוח, לבדיקה ולפריסה של סוכני AI.
  • פרוטוקול Agent2Agent (A2A): פרוטוקול פתוח שמאפשר תקשורת ויכולת פעולה הדדית בין סוכנים, ללא קשר לשפת התכנות ולזמן הריצה שלהם.
  • Model Context Protocol‏ (MCP): תקן קוד פתוח לחיבור אפליקציות AI למערכות חיצוניות.

תרחישים לדוגמה

מערכות AI מרובות-סוכנים מתאימות לתרחישי שימוש מורכבים שדורשים שיתוף פעולה ותיאום בין כמה מערכי מיומנויות מיוחדים כדי להשיג יעד עסקי. כדי לזהות תרחישי שימוש שמתאימים למערכות AI מרובות סוכנים, צריך לנתח את התהליכים העסקיים ולזהות משימות ספציפיות ש-AI יכול לשפר. התמקדו בתוצאות עסקיות מוחשיות, כמו הפחתת עלויות ועיבוד מהיר יותר. הגישה הזו עוזרת לכם להתאים את ההשקעות שלכם ב-AI לערך העסקי.

הנה כמה דוגמאות לתרחישי שימוש במערכות AI מרובות סוכנים.

יועץ פיננסי

לספק המלצות מותאמות אישית למסחר במניות ולבצע עסקאות. בתרשים הבא מוצג תרחיש לדוגמה לשימוש בתכונה הזו. בדוגמה הזו נעשה שימוש בתבנית רציפה.

תרחיש שימוש של יועץ פיננסי במערכת עם כמה סוכנים.

בתרשים מוצג התהליך הבא:

  1. סוכן לאחזור נתונים מאחזר בזמן אמת ובאופן היסטורי מחירי מניות, דוחות פיננסיים של חברות ונתונים רלוונטיים אחרים ממקורות מהימנים.
  2. סוכן לניתוח פיננסי מיישם על הנתונים טכניקות מתאימות של ניתוח ותרשימים, מזהה דפוסי תנודות במחירים ומבצע תחזיות.
  3. סוכן להמלצות על מניות משתמש בניתוח ובטבלאות כדי ליצור המלצות מותאמות אישית לקנייה ולמכירה של מניות ספציפיות על סמך פרופיל הסיכון של המשתמש ויעדי ההשקעה שלו.
  4. סוכן לביצוע עסקאות קונה ומוכר מניות בשם המשתמש.

עוזר מחקר

ליצור תוכנית מחקר, לאסוף מידע, להעריך ולשפר את המחקר, ואז לכתוב דוח. בתרשים הבא מוצג תרחיש לדוגמה לשימוש בתבניות: הזרימה הראשית בדוגמה הזו משתמשת בתבנית רציפה. הדוגמה כוללת גם דפוס של שיפור איטרטיבי.

תרחיש שימוש בעוזר דיגיטלי למחקר במערכת מרובת סוכנים.

בתרשים מוצג התהליך הבא:

  1. סוכן מתכנן יוצר תוכנית מחקר מפורטת.
  2. סוכן מחקר משלים את המשימות הבאות:

    1. משתמשים בתוכנית המחקר כדי לזהות מקורות נתונים פנימיים וחיצוניים מתאימים.
    2. המערכת אוספת ומנתחת את הנתונים הנדרשים.
    3. מכין סיכום מחקר ומספק אותו לסוכן מעריך.

    סוכן המחקר חוזר על המשימות האלה עד שסוכן הבדיקה מאשר את המחקר.

  3. סוכן ליצירת דוחות יוצר את דוח המחקר הסופי.

כלי לאופטימיזציה של שרשרת האספקה

אופטימיזציה של המלאי, מעקב אחרי משלוחים ותקשורת עם שותפים בשרשרת האספקה. בתרשים הבא מוצג תרחיש לדוגמה לשימוש בתכונה הזו. בדוגמה הזו נעשה שימוש בתבנית רציפה.

תרחיש שימוש באופטימיזציה של שרשרת אספקה במערכת מרובת סוכנים.

  1. סוכן של מנהל מחסן דואג לרמות מלאי אופטימליות על ידי יצירת הזמנות למילוי מלאי על סמך נתוני מלאי, תחזיות ביקוש וזמני אספקה של ספקים.

    • הנציג מקיים אינטראקציה עם נציג מעקב המשלוחים כדי לעקוב אחרי משלוחים.
    • הנציג מקיים אינטראקציה עם הנציג של ספק התקשורת כדי להודיע לספקים על שינויים בהזמנות.
  2. סוכן למעקב אחר משלוחים משתלב עם פלטפורמות לוגיסטיות של ספקים ומערכות של חברות תובלה כדי להבטיח מילוי יעיל של הזמנות בזמן.

  3. סוכן תקשורת עם ספקים מתקשר עם ספקים חיצוניים בשם הסוכנים האחרים במערכת.

חלופות עיצוב

בהתאם לדרישות שלכם לגבי יכולת ניהול, שליטה וגמישות, אתם יכולים לבחור מתוך מגוון אפשרויות של זמן ריצה ב- Google Cloud עבור סוכני ה-AI והמודל שלכם. מידע נוסף זמין במאמר בנושא בחירת רכיבי הארכיטקטורה של AI אקטיבי.

שיקולים לגבי העיצוב

בקטע הזה מפורטים גורמים שצריך לקחת בחשבון בתכנון, שיטות מומלצות והמלצות לשימוש בארכיטקטורת ההפניה הזו כדי לפתח טופולוגיה שעונה על הדרישות הספציפיות שלכם בנוגע לאבטחה, למהימנות, לעלות ולביצועים.

ההנחיות שבקטע הזה הן לא מלאות. בהתאם לדרישות של עומס העבודה ולמוצרים ולתכונות של צד שלישי שבהם אתם משתמשים, יכול להיות שיש עוד גורמים עיצוביים ופשרות שכדאי לקחת בחשבון. Google Cloud

עיצוב המערכת

בקטע הזה מוסבר איך לבחור Google Cloud אזורים לפריסה ואיך לבחור Google Cloud מוצרים וכלים מתאימים. Google Cloud

בחירת אזור

כשבוחרים Google Cloud אזורים לאפליקציות ה-AI, כדאי להביא בחשבון את הגורמים הבאים:

כדי לבחור מיקומים מתאימים לאפליקציות, אפשר להשתמש בכלים הבאים: Google Cloud

  • Google Cloud כלי לבחירת אזור: כלי אינטראקטיבי מבוסס-אינטרנט לבחירת האזור האופטימלי Google Cloud ליישומים ולנתונים שלכם על סמך גורמים כמו טביעת רגל פחמנית, עלות וזמן אחזור.
  • Cloud Location Finder API: ממשק API ציבורי שמאפשר למצוא באופן פרוגרמטי מיקומי פריסה ב- Google Cloud, ב-Google Distributed Cloud ובספקי ענן אחרים.

תכנון סוכנים

בקטע הזה מפורטות המלצות כלליות לעיצוב סוכני AI. הנחיות מפורטות לגבי כתיבת קוד ולוגיקה של נציגים לא כלולות במסמך הזה.

התמקדות בעיצוב המלצות
הגדרה ועיצוב של סוכנים
  • הגדירו בבירור את היעד העסקי של מערכת ה-AI האקטיבי ואת המשימה שכל סוכן מבצע.
  • בוחרים תבנית עיצוב של סוכן שהכי מתאימה לדרישות שלכם.
  • אפשר להשתמש ב-ADK כדי ליצור, לפרוס ולנהל ביעילות את הארכיטקטורה של הסוכן.
אינטראקציות עם נציג
  • תכננו את הסוכנים שפונים לבני אדם בארכיטקטורה כך שיתמכו באינטראקציות בשפה טבעית.
  • מוודאים שכל סוכן מעביר ללקוחות התלויים בו את הפעולות והסטטוס שלו בצורה ברורה.
  • תכננו את הסוכנים כך שיזהו ויטפלו בשאילתות מעורפלות ובאינטראקציות מורכבות.
הקשר, כלים ונתונים
  • חשוב לוודא שיש לסוכנים מספיק הקשר כדי לעקוב אחרי אינטראקציות מרובות ופרמטרים של סשנים.
  • תארו בצורה ברורה את המטרה, הטיעונים והשימוש בכלי שהסוכנים יכולים להשתמש בהם.
  • חשוב לוודא שהתשובות של הסוכנים מבוססות על מקורות נתונים אמינים כדי לצמצם את התופעה של הזיות.
  • מיישמים לוגיקה לטיפול במצבים שבהם אין התאמה, למשל כשמזינים הנחיה בנושא לא קשור.

אבטחה

בקטע הזה מתוארים שיקולים והמלצות לתכנון טופולוגיה ב- Google Cloud שעומדת בדרישות האבטחה של עומס העבודה.

רכיב שיקולים והמלצות לגבי עיצוב
נציגים

סוכני AI יוצרים סיכוני אבטחה ייחודיים וקריטיים, ששיטות אבטחה קונבנציונליות ודטרמיניסטיות לא יכולות לצמצם באופן מספק. ‫Google ממליצה על גישה שמשלבת את היתרונות של אמצעי בקרה דטרמיניסטיים לאבטחה עם הגנות דינמיות שמבוססות על נימוקים. הגישה הזו מבוססת על שלושה עקרונות מרכזיים: פיקוח אנושי, אוטונומיה מוגדרת בקפידה של הסוכן ויכולת צפייה. בהמשך מופיעות המלצות ספציפיות שתואמות לעקרונות הבסיסיים האלה.

פיקוח אנושי: לפעמים מערכת AI אוטונומית עלולה להיכשל או לא לפעול כמצופה. לדוגמה, המודל עשוי ליצור תוכן לא מדויק או שהסוכן עשוי לבחור כלים לא מתאימים. במערכות AI אקטיבי שחיוניות לעסק, כדאי לשלב תהליך של האדם שבתהליך כדי לאפשר למנהלים אנושיים לעקוב אחרי הסוכנים, לבטל את הפעולות שלהם ולהשהות אותם. לדוגמה, משתמשים אנושיים יכולים לבדוק את הפלט של הסוכנים, לאשר או לדחות את הפלט ולספק הנחיות נוספות לתיקון שגיאות או לקבלת החלטות אסטרטגיות. הגישה הזו משלבת את היעילות של מערכות AI אקטיבי עם החשיבה הביקורתית והמומחיות בתחום של משתמשים אנושיים.

בקרת גישה לסוכנים: אפשר להגדיר הרשאות לסוכנים באמצעות אמצעי בקרה לניהול זהויות והרשאות גישה (IAM). צריך להעניק לכל נציג רק את ההרשאות שהוא צריך כדי לבצע את המשימות שלו ולתקשר עם כלים ועם נציגים אחרים. הגישה הזו עוזרת לצמצם את ההשפעה הפוטנציאלית של פרצת אבטחה, כי לסוכן שנפרץ תהיה גישה מוגבלת לחלקים אחרים במערכת. מידע נוסף זמין במאמרים הגדרת הזהות וההרשאות של הסוכן וניהול הגישה לסוכנים שנפרסו.

ניטור: אפשר לנטר את התנהגות ה-Agent באמצעות יכולות מקיפות של מעקב, שמאפשרות לראות כל פעולה שה-Agent מבצע, כולל תהליך החשיבה הרציונלית, בחירת הכלים ונתיבי ההרצה. מידע נוסף זמין במאמרים בנושא רישום סוכן ב-Vertex AI Agent Engine ורישום ב-ADK.

מידע נוסף על אבטחת סוכני AI זמין במאמר בנושא בטיחות ואבטחה של סוכני AI.

Vertex AI

אחריות משותפת: האבטחה היא אחריות משותפת. ‫Vertex AI מאבטח את התשתית הבסיסית ומספק כלים ואמצעי אבטחה שיעזרו לכם להגן על הנתונים, הקוד והמודלים שלכם. אתם אחראים להגדיר את השירותים בצורה נכונה, לנהל את אמצעי בקרת הגישה ולאבטח את האפליקציות. מידע נוסף זמין במאמר אחריות משותפת ב-Vertex AI.

אמצעי אבטחה: ‏ Vertex AI תומך ב Google Cloud אמצעי אבטחה שבהם אפשר להשתמש כדי לעמוד בדרישות שלכם בנושא מיקום הנתונים, מפתחות הצפנה בניהול הלקוח (CMEK), אבטחת רשת באמצעות VPC Service Controls וAccess Transparency. מידע נוסף זמין במאמרי העזרה הבאים:

בטיחות: מודלים של AI עשויים להפיק תשובות מזיקות, לפעמים בתגובה להנחיות זדוניות.

  • כדי לשפר את הבטיחות ולצמצם את הסיכון לשימוש לרעה במערכת ה-AI האגנטית, אפשר להגדיר מסנני תוכן שישמשו כמחסומים מפני תשומות ותשובות מזיקות. מידע נוסף זמין במאמר בנושא מסנני בטיחות ותוכן.
  • כדי לבדוק בקשות ותגובות של היקש ולסנן אותן מפני איומים כמו החדרת הנחיות ותוכן פוגעני, אפשר להשתמש ב-הגנה מוגברת על המודל. ‫הגנה מוגברת על המודל עוזר למנוע קלט זדוני, לוודא את בטיחות התוכן, להגן על מידע אישי רגיש, לשמור על תאימות ולאכוף את כללי המדיניות בנושא בטיחות ואבטחה באופן עקבי.

גישה למודלים: אתם יכולים להגדיר מדיניות ארגונית כדי להגביל את הסוגים והגרסאות של מודלים של AI שאפשר להשתמש בהם ב Google Cloud פרויקט. מידע נוסף זמין במאמר בנושא שליטה בגישה למודלים ב-Model Garden.

הגנה על נתונים: כדי לגלות ולהסיר פרטי זיהוי של מידע אישי רגיש בהנחיות ובתשובות וגם בנתוני יומן, אפשר להשתמש ב-Cloud Data Loss Prevention API. מידע נוסף זמין בסרטון הבא: הגנה על מידע אישי רגיש באפליקציות AI.

MCP כשמגדירים את ה-Agent-ים לשימוש ב-MCP, חשוב לוודא שהגישה לנתונים ולכלים חיצוניים מאושרת, להטמיע אמצעי בקרה על פרטיות כמו הצפנה, להחיל מסננים כדי להגן על מידע אישי רגיש ולעקוב אחרי האינטראקציות של ה-Agent-ים. מידע נוסף זמין במאמר בנושא MCP ואבטחה.
A2A

אבטחת תעבורה: פרוטוקול A2A מחייב שימוש ב-HTTPS לכל התקשורת בין אפליקציות בסביבות ייצור, ומומלץ להשתמש ב-Transport Layer Security‏ (TLS) בגרסה 1.2 ומעלה.

אימות: פרוטוקול A2A מעביר את האימות למנגנוני אינטרנט סטנדרטיים כמו כותרות HTTP ולתקנים כמו OAuth2 ו-OpenID Connect. כל נציג מפרסם את דרישות האימות בכרטיס הנציג שלו. מידע נוסף זמין במאמר בנושא אימות A2A.

Cloud Run

אבטחת Ingress (בשביל שירות הקצה הקדמי): כדי לשלוט בגישה לאפליקציה, משביתים את כתובת ה-URL run.app שמוגדרת כברירת מחדל בשירות הקצה הקדמי של Cloud Run ומגדירים מאזן עומסים חיצוני אזורי של אפליקציות. בנוסף לאיזון העומסים של התנועה הנכנסת לאפליקציה, מאזן העומסים מטפל בניהול אישורי SSL. כדי להוסיף הגנה, אפשר להשתמש במדיניות האבטחה של Google Cloud Armor כדי לספק סינון בקשות, הגנה מפני מתקפות DDoS והגבלת קצב של יצירת בקשות לשירות.

אימות משתמשים:

  • משתמשים בתוך הארגון: כדי לאמת גישה של משתמשים פנימיים לשירות הקצה הקדמי של Cloud Run, משתמשים בשרת proxy לאימות זהויות (IAP). כשמשתמש מנסה לקבל גישה למשאב שמאובטח באמצעות IAP, האימות ובדיקת ההרשאות מתבצעים על ידי IAP.
  • משתמשים מחוץ לארגון: כדי לאמת את הגישה של משתמשים חיצוניים לשירות הקצה הקדמי, צריך להשתמש ב-Identity Platform או ב-אימות ב-Firebase. כדי לנהל את הגישה של משתמשים חיצוניים, צריך להגדיר את האפליקציה כך שתטפל בתהליך כניסה ותבצע קריאות מאומתות ל-API של שירות Cloud Run.

מידע נוסף זמין במאמר אימות משתמשים.

אבטחת קובצי אימג' של קונטיינרים: כדי לוודא שרק קובצי אימג' מורשים של קונטיינרים נפרסים ב-Cloud Run, אפשר להשתמש ב- Binary Authorization. כדי לזהות ולצמצם סיכוני אבטחה בקובצי אימג' של קונטיינרים, אפשר להשתמש ב-Artifact Analysis כדי להריץ באופן אוטומטי סריקות לאיתור נקודות חולשה. מידע נוסף זמין במאמר סקירה כללית על סריקת קונטיינרים.

מיקום נתונים: Cloud Run עוזר לכם לעמוד בדרישות של מיקום נתונים. פונקציות Cloud Run פועלות באזור שנבחר.

לקבלת הנחיות נוספות בנושא אבטחת קונטיינרים, אפשר לעיין בטיפים כלליים לפיתוח ב-Cloud Run.

כל המוצרים בארכיטקטורה

הצפנת נתונים: כברירת מחדל, Google Cloud מצפין נתונים באחסון באמצעות Google-owned and Google-managed encryption keys. כדי להגן על הנתונים של הסוכנים באמצעות מפתחות הצפנה שאתם שולטים בהם, אתם יכולים להשתמש במפתחות CMEK שאתם יוצרים ומנהלים ב-Cloud KMS. מידע על Google Cloud שירותים שתואמים ל-Cloud KMS זמין במאמר שירותים תואמים.

צמצום הסיכון לזליגת נתונים: כדי לצמצם את הסיכון לזליגת נתונים, צריך ליצור מתחם היקפי של VPC Service Controls מסביב לתשתית. ‫VPC Service Controls תומך בכל השירותים של ארכיטקטורת ההפניה הזו. Google Cloud

בקרת גישה: כשמגדירים הרשאות למשאבים בטופולוגיה, חשוב לפעול לפי העיקרון של הרשאות מינימליות.

אבטחת סביבת הענן: אפשר להשתמש בכלים ב-Security Command Center כדי לזהות נקודות חולשה, לזהות איומים ולצמצם אותם, להגדיר ולפרוס עמדת אבטחה ולייצא נתונים לניתוח נוסף.

אופטימיזציה אחרי הפריסה: אחרי שפורסים את האפליקציה ב- Google Cloud, אפשר לקבל המלצות לשיפור האבטחה באמצעות Active Assist. בודקים את ההמלצות ומיישמים אותן בהתאם לסביבה שלכם. מידע נוסף זמין במאמר בנושא המלצות ב-Active Assist.

עוד המלצות בנושא אבטחה

אמינות

בקטע הזה מפורטים שיקולים והמלצות לתכנון, לבנייה ולהפעלה של תשתית אמינה לפריסה ב- Google Cloud.

רכיב שיקולים והמלצות לגבי עיצוב
נציגים

סובלנות לתקלות: תכנון המערכת מבוסס-הסוכנים כך שתהיה סובלנות לתקלות ברמת הסוכן או טיפול בהן. במקרים שבהם זה אפשרי, כדאי להשתמש בגישה מבוזרת שבה סוכנים יכולים לפעול באופן עצמאי.

סימולציה של כשלים: לפני פריסת מערכת ה-AI האקטיבי בסביבת ייצור, כדאי לאמת אותה באמצעות סימולציה של סביבת ייצור. לזהות ולתקן בעיות בתיאום בין נציגים ובעיות בהתנהגות לא צפויה.

טיפול בשגיאות: כדי לאפשר אבחון ופתרון בעיות של שגיאות, צריך להטמיע רישום ביומן, טיפול בחריגים ומנגנונים לניסיון חוזר.

Vertex AI

ניהול מכסות: ‏ Vertex AI תומך במכסה משותפת דינמית (DSQ) למודלים של Gemini. התכונה DSQ עוזרת לנהל באופן גמיש בקשות לתשלום לפי שימוש, ומבטלת את הצורך לנהל את המכסה באופן ידני או לבקש הגדלות של המכסה. DSQ מקצה באופן דינמי את המשאבים הזמינים למודל ולאזור מסוימים ללקוחות פעילים. ב-DSQ, אין מכסות מוגדרות מראש ללקוחות פרטיים.

תכנון הקיבולת: אם מספר הבקשות למודל חורג מהקיבולת שהוקצתה, מוחזר קוד השגיאה 429. עבור עומסי עבודה שחיוניים לעסק ודורשים תפוקה גבוהה באופן עקבי, אפשר להזמין תפוקה באמצעות הקצאת משאבים לפי התפוקה שנקבעה.

זמינות של נקודת קצה של מודל: אם אפשר לשתף נתונים בכמה אזורים או מדינות, אפשר להשתמש בנקודת קצה גלובלית בשביל המודל.

Cloud Run עמידות בפני הפסקות זמניות בתשתית: Cloud Run הוא שירות אזורי. הוא מאחסן נתונים באופן סינכרוני בכמה אזורים בתוך אזור מסוים, ומבצע איזון עומסים אוטומטי של התנועה בין האזורים. אם מתרחשת הפסקה זמנית בשירות באזור, Cloud Run ממשיך לפעול והנתונים לא אובדים. אם מתרחשת הפסקה זמנית בשירות באזור מסוים, השירות מפסיק לפעול עד ש-Google פותרת את ההפסקה הזמנית בשירות.
כל המוצרים בארכיטקטורה אופטימיזציה אחרי הפריסה: אחרי שפורסים את האפליקציה ב- Google Cloud, אפשר לקבל המלצות לשיפור נוסף של האמינות באמצעות Active Assist. בודקים את ההמלצות ומיישמים אותן בהתאם לסביבה שלכם. מידע נוסף זמין במאמר בנושא המלצות ב-Active Assist.

עקרונות והמלצות בנושא מהימנות שספציפיים לעומסי עבודה של AI ו-ML מופיעים במאמר AI and ML perspective: Reliability (נקודת מבט על AI ו-ML: מהימנות) ב-Well-Architected Framework.

תפעול

בקטע הזה מתוארים הגורמים שכדאי לקחת בחשבון כשמשתמשים בארכיטקטורת ההפניה הזו כדי לעצב טופולוגיה של Google Cloud שאפשר להפעיל ביעילות.

רכיב שיקולים והמלצות לגבי עיצוב
Vertex AI

מעקב באמצעות יומנים: כברירת מחדל, יומני סוכנים שנכתבים לזרמי stdout ו-stderr מנותבים אל Cloud Logging. לרישום מתקדם ביומן, אפשר לשלב את כלי רישום היומנים של Python עם Cloud Logging. אם אתם צריכים שליטה מלאה ביומנים וביומנים מובנים, אתם יכולים להשתמש בלקוח Cloud Logging. מידע נוסף זמין במאמרים רישום סוכן ביומן ורישום ביומן ב-ADK.

הערכה מתמשכת: חשוב לבצע באופן קבוע הערכה איכותית של הפלט של הסוכנים ושל המסלול או השלבים שהסוכנים נקטו כדי ליצור את הפלט. כדי להטמיע הערכה של סוכנים, אפשר להשתמש בשירות ההערכה של AI גנרטיבי או בשיטות ההערכה שנתמכות ב-ADK.

MCP

כלים למסדי נתונים: כדי לנהל ביעילות כלים למסדי נתונים עבור סוכני ה-AI שלכם, ולוודא שהסוכנים מטפלים בצורה מאובטחת במורכבויות כמו איגום חיבורים ואימות, תוכלו להשתמש בערכת הכלים MCP למסדי נתונים. הוא מספק מיקום מרכזי לאחסון ולעדכון של כלי מסד נתונים. אתם יכולים לשתף את הכלים בין סוכנים ולעדכן את הכלים בלי לפרוס מחדש את הסוכנים. ארגז הכלים כולל מגוון רחב של כלים למסדי נתונים כמו AlloyDB ל-PostgreSQL ולמסדי נתונים של צד שלישי כמו MongoDB. Google Cloud

מודלים של AI גנרטיבי: כדי לאפשר לסוכני AI להשתמש במודלים של AI גנרטיבי מבית Google, כמו Imagen ו-Veo, אפשר להשתמש בשרתי MCP עבור ממשקי API של מדיה גנרטיבית Google Cloud.

מוצרי אבטחה וכלים של Google: כדי לאפשר לסוכני ה-AI שלכם לגשת למוצרי אבטחה ולכלים של Google כמו Google Security Operations,‏ Google Threat Intelligence ו-Security Command Center, צריך להשתמש בשרתי MCP למוצרי אבטחה של Google.

כל Google Cloud המוצרים בארכיטקטורה מעקב: איסוף וניתוח רציפים של נתוני מעקב באמצעות Cloud Trace. נתוני מעקב מאפשרים לזהות ולאבחן במהירות שגיאות בתהליכי עבודה מורכבים של סוכנים. אפשר לבצע ניתוח מעמיק באמצעות תרשימים בכלי Trace Explorer. מידע נוסף זמין במאמר מעקב אחרי סוכן.

עקרונות והמלצות למצוינות תפעולית שספציפיים לעומסי עבודה של AI ו-ML מפורטים במאמר AI and ML perspective: Operational excellence ב-Well-Architected Framework.

הוזלת עלויות

בקטע הזה מוסבר איך לבצע אופטימיזציה של העלות של הגדרת טופולוגיה של Google Cloud והפעלתה, שאתם בונים באמצעות ארכיטקטורת ההפניה הזו.

רכיב שיקולים והמלצות לגבי עיצוב
Vertex AI

ניתוח וניהול עלויות: כדי לנתח ולנהל את העלויות של Vertex AI, מומלץ ליצור מדדי בסיס לשאילתות לשנייה (QPS) ולטוקנים לשנייה (TPS). לאחר מכן, עוקבים אחרי המדדים האלה אחרי הפריסה. ערך הבסיס עוזר גם בתכנון הקיבולת. לדוגמה, ערך הבסיס עוזר לכם לקבוע מתי יכול להיות שיהיה צורך בהקצאת משאבים לפי התפוקה שנקבעה.

בחירת מודל: המודל שתבחרו לאפליקציית ה-AI ישפיע ישירות על העלויות ועל הביצועים. כדי לזהות את המודל שמספק איזון אופטימלי בין ביצועים לעלות לתרחיש השימוש הספציפי שלכם, מומלץ לבדוק מודלים באופן איטרטיבי. מומלץ להתחיל עם המודל הכי חסכוני ולעבור בהדרגה לאפשרויות חזקות יותר.

יצירת הנחיות חסכוניות: האורך של ההנחיות (קלט) והתשובות שנוצרות (פלט) משפיע ישירות על הביצועים והעלות. כדאי לכתוב הנחיות קצרות וישירות שמספקות מספיק הקשר. כדאי לעצב את ההנחיות כך שהתשובות מהמודל יהיו תמציתיות. לדוגמה, אפשר להוסיף ביטויים כמו "סכם ב-2 משפטים" או "ציין 3 נקודות עיקריות". מידע נוסף זמין במאמר בנושא שיטות מומלצות ליצירת הנחיות.

שמירת הקשר במטמון: כדי להפחית את העלות של בקשות שמכילות תוכן חוזר עם מספר גבוה של טוקנים של קלט, אפשר להשתמש בשמירת הקשר במטמון.

בקשות רבות בבת אחת: כשזה רלוונטי, כדאי להשתמש בחיזויים רבים בבת אחת. בקשות באצווה כרוכות בעלות נמוכה יותר מאשר בקשות רגילות.

Cloud Run

הקצאת משאבים: כשיוצרים שירות Cloud Run, אפשר לציין את כמות הזיכרון והמעבד שיוקצו לו. מתחילים עם הקצאות ברירת המחדל של המעבד (CPU) והזיכרון. עוקבים אחרי השימוש במשאבים והעלות לאורך זמן, ומשנים את ההקצאה לפי הצורך. מידע נוסף זמין במאמרי העזרה הבאים:

אופטימיזציה של התעריף: אם אתם יכולים לחזות את הדרישות שלכם לגבי מעבד וזיכרון, אתם יכולים לחסוך כסף באמצעות הנחות תמורת התחייבות לשימוש (CUD).

כל המוצרים בארכיטקטורה אופטימיזציה אחרי הפריסה: אחרי שפורסים את האפליקציה ב- Google Cloud, אפשר לקבל המלצות לשיפור נוסף של העלויות באמצעות Active Assist. בודקים את ההמלצות ומיישמים אותן בהתאם לסביבה שלכם. מידע נוסף זמין במאמר בנושא המלצות ב-Active Assist.

כדי להעריך את העלות של המשאבים ב- Google Cloud , אפשר להשתמש בGoogle Cloud מחשבון עלויות.

עקרונות והמלצות לאופטימיזציה של עלויות שספציפיים לעומסי עבודה של AI ו-ML מפורטים במאמר AI and ML perspective: Cost optimization ב-Well-Architected Framework.

אופטימיזציה של הביצועים

בקטע הזה מפורטים שיקולים והמלצות לתכנון טופולוגיה ב- Google Cloud שעומדת בדרישות הביצועים של עומסי העבודה.

רכיב שיקולים והמלצות לגבי עיצוב
נציגים

בחירת מודל: כשבוחרים מודלים למערכת AI אקטיבי, צריך לקחת בחשבון את היכולות הנדרשות למשימות שהסוכנים צריכים לבצע.

אופטימיזציה של הנחיות: כדי לשפר ולאופטימיזציה את הביצועים של ההנחיות במהירות ובקנה מידה גדול, וכדי להימנע מהצורך בשכתוב ידני, אפשר להשתמש בכלי לאופטימיזציה של הנחיות ב-Vertex AI. הכלי לאופטימיזציה עוזר לכם להתאים הנחיות בצורה יעילה למודלים שונים.

Vertex AI

בחירת מודל: המודל שתבחרו לאפליקציית ה-AI ישפיע ישירות על העלויות ועל הביצועים. כדי לזהות את המודל שמספק איזון אופטימלי בין ביצועים לעלות לתרחיש השימוש הספציפי שלכם, מומלץ לבדוק מודלים באופן איטרטיבי. מומלץ להתחיל עם המודל הכי חסכוני ולעבור בהדרגה לאפשרויות חזקות יותר.

הנדסת הנחיות: האורך של ההנחיות (קלט) והתשובות שנוצרות (פלט) משפיע ישירות על הביצועים והעלות. כדאי לכתוב הנחיות קצרות וישירות שמספקות מספיק הקשר. כדאי לעצב את ההנחיות כך שהתשובות מהמודל יהיו תמציתיות. לדוגמה, אפשר להוסיף ביטויים כמו "סכם ב-2 משפטים" או "ציין 3 נקודות עיקריות". מידע נוסף זמין במאמר בנושא שיטות מומלצות ליצירת הנחיות.

שמירת הקשר במטמון: כדי לצמצם את זמן האחזור של בקשות שמכילות תוכן חוזר עם מספר גבוה של טוקנים של קלט, כדאי להשתמש בשמירת הקשר במטמון.

Cloud Run

הקצאת משאבים: בהתאם לדרישות הביצועים, מגדירים את הזיכרון ואת המעבד שיוקצו לשירות Cloud Run. מידע נוסף זמין במאמרי העזרה הבאים:

לקבלת הנחיות נוספות לאופטימיזציה של הביצועים, אפשר לעיין בטיפים כלליים לפיתוח ב-Cloud Run.

כל המוצרים בארכיטקטורה אופטימיזציה אחרי הפריסה: אחרי שפורסים את האפליקציה ב- Google Cloud, אפשר לקבל המלצות לשיפור הביצועים באמצעות Active Assist. בודקים את ההמלצות ומיישמים אותן בהתאם לסביבה שלכם. מידע נוסף זמין במאמר בנושא המלצות ב-Active Assist.

עקרונות והמלצות לאופטימיזציה של ביצועים שספציפיים לעומסי עבודה של AI ו-ML מפורטים במאמר AI and ML perspective: Performance optimization ב-Well-Architected Framework.

פריסה

כדי ללמוד איך ליצור ולפרוס מערכות AI מרובות סוכנים, אפשר להשתמש בדוגמאות הקוד הבאות. דוגמאות הקוד האלה הן נקודות התחלה פונקציונליות מלאות ללמידה ולניסויים. כדי שהקוד יפעל בצורה אופטימלית בסביבות ייצור, צריך להתאים אותו לדרישות העסקיות והטכניות הספציפיות שלכם.

  • יועץ פיננסי: ניתוח נתונים של שוק המניות, יצירת אסטרטגיות מסחר, הגדרת תוכניות ביצוע והערכת סיכונים.
  • עוזר מחקר: תכנון מחקר, ביצוע מחקר, הערכת הממצאים וכתיבת דוח מחקר.
  • סוכן ביטוח: יצירת חברות במועדון, מתן סיוע בצד הדרך וטיפול בתביעות ביטוח.
  • כלי לאופטימיזציה של חיפושים: מציאת מילות מפתח לחיפוש, ניתוח דפי אינטרנט ומתן הצעות לאופטימיזציה של חיפושים.
  • כלי לניתוח נתונים: אחזור נתונים, ביצוע מניפולציות מורכבות, יצירת תרשימים והרצת משימות של למידת מכונה.
  • סוכנות שיווק באינטרנט: בחירת שם דומיין, עיצוב אתר, יצירת קמפיינים והפקת תוכן.
  • Airbnb planner (with A2A and MCP): For a given location and time, find Airbnb listings and get weather information.

כדי לראות קוד לדוגמה שיעזור לכם להתחיל להשתמש ב-ADK יחד עם שרתי MCP, אפשר לעיין במאמר בנושא כלי MCP.

המאמרים הבאים

שותפים ביצירת התוכן

מחבר: קומאר דהנגופל | מפתח פתרונות חוצי-מוצרים

תורמי תוכן אחרים: