Agent Runtime הוא קבוצה של שירותים שמאפשרים למפתחים לפרוס, לנהל ולהרחיב סוכני AI בסביבת ייצור. Agent Runtime מטפל בתשתית כדי להרחיב את הסוכנים בסביבת הייצור, כך שתוכלו להתמקד ביצירת אפליקציות. Agent Runtime מציע את השירותים הבאים שאפשר להשתמש בהם בנפרד או בשילוב:
- Runtime:
- פריסה והרחבה של סוכנים באמצעות זמן ריצה מנוהל ויכולות ניהול מקצה לקצה.
- התאמה אישית של קובץ אימג' של קונטיינר של הסוכן באמצעות סקריפטים להתקנה בזמן ה-build של יחסי תלות במערכת.
- שימוש בתכונות אבטחה, כולל תאימות ל-VPC-SC והגדרת אימות ו-IAM.
- גישה למודלים ולכלים כמו קריאה לפונקציות.
- פריסת סוכנים שנבנו באמצעות מסגרות שונות של Python והפרוטוקול הפתוח Agent2Agent.
- איכות והערכה (גרסת Preview): הערכת איכות הסוכן באמצעות Gen AI Evaluation service המשולב ואופטימיזציה של סוכנים באמצעות הרצות של אימון מודל Gemini.
- Agent Platform Sessions: Agent Platform Sessions מאפשר לכם לאחסן אינטראקציות ספציפיות בין משתמשים לבין נציגים, וכך מספק מקורות מוסמכים להקשר של השיחה.
- Agent Platform Memory Bank: Agent Runtime Agent Platform Memory Bank מאפשר לכם לאחסן ולאחזר מידע מתוך סשנים כדי להתאים אישית את האינטראקציות עם הנציג האוטומטי.
- הרצת קוד: Agent Runtime Code Execution מאפשר ל-Agent Runtime להריץ קוד בסביבת ארגז חול מאובטחת, מבודדת ומנוהלת.
- חנות לדוגמה (תצוגה מקדימה): אחסון של דוגמאות בודדות ואחזור דינמי שלהן כדי לשפר את הביצועים של הסוכן.
- יכולת מעקב: אפשר להבין את התנהגות הסוכן באמצעות Google Cloud Trace (עם תמיכה ב-OpenTelemetry), Cloud Monitoring ו-Cloud Logging.
- שליטה: Agent Runtime תומך בכמה תכונות שיעזרו לכם לשלוט בסוכנים בסביבת הייצור ולעמוד בדרישות האבטחה והצרכים של הארגון שלכם:
- איתור איומים באמצעות Security Command Center: Agent Runtime Threat Detection (גרסת Preview) הוא שירות מובנה של Security Command Center שעוזר לכם לאתר ולחקור מתקפות פוטנציאליות על סוכנים שנפרסו ב-Agent Runtime.
- זהות הסוכן (גרסת Preview): אפשר להשתמש בזהות הסוכן של ניהול זהויות והרשאות גישה (IAM) כדי לספק תכונות אבטחה וניהול גישה כשמשתמשים בסוכנים ב-Agent Runtime.
- Agent Gateway (גרסת Preview): אפשר להשתמש ב-Agent Gateway כדי להגדיר כללים לתקשורת בין סוכנים ולאכוף מדיניות אבטחה ובקרת גישה בין סוכנים, לקוחות וכלים שמתחברים אלGoogle Cloud הפרויקט וממנו.
יצירה ופריסה ב-Agent Runtime
תהליך העבודה ליצירת סוכן ב-Agent Runtime הוא:
- הגדרת הסביבה: מגדירים את הפרויקט ב-Google ומתקינים את הגרסה העדכנית של Agent Platform SDK ל-Python.
- פיתוח סוכן: פיתוח סוכן שאפשר לפרוס ב-Agent Runtime.
- פריסת הסוכן: פריסת הסוכן ב-Agent Runtime המנוהל.
- שימוש בסוכן: שולחים שאילתה לסוכן באמצעות בקשת API.
- ניהול הסוכן שנפרס: ניהול ומחיקה של סוכנים שנפרסו ב-Agent Runtime.
התרשים הבא ממחיש את השלבים:
frameworks נתמכים
בטבלה הבאה מתואר רמת התמיכה ש-Agent Runtime מספק למסגרות שונות של סוכנים:
| רמת תמיכה | מסגרות של סוכנים |
|---|---|
| תבנית מותאמת אישית: אתם יכולים להתאים תבנית מותאמת אישית כדי לתמוך בפריסה ל-Agent Runtime מהמסגרת שלכם. | CrewAI, custom frameworks |
| שילוב של Agent Platform SDK: Agent Runtime מספק תבניות מנוהלות לכל מסגרת ב-Agent Platform SDK ובמסמכי התיעוד. | LangChain, LangGraph, AG2, LlamaIndex |
| שילוב מלא: התכונות משולבות כך שהן פועלות במסגרת, ב-Agent Runtime ובמערכת האקולוגית הרחבה יותר של Google Cloud . | ערכת פיתוח של סוכנים (ADK) |
פריסה בסביבת ייצור באמצעות Agents CLI
Agents CLI הוא ממשק שורת פקודה מאוחד וערכת מיומנויות ל-Gemini Enterprise Agent Platform. הוא מספק למפתחים ולסוכני קידוד נתיב צפוי לאורך מחזור החיים של פיתוח הסוכן: יצירת תשתית, הערכה, פריסה, פרסום וצפייה. Agents CLI מספק את האפשרויות הבאות:
- תבניות מוכנות מראש של סוכנים: תבניות של ReAct, RAG, multi-agent ועוד.
- סביבת בדיקה אינטראקטיבית: אפשר לבדוק את הנציג וליצור איתו אינטראקציה.
- תשתית אוטומטית: משתמשת ב-Terraform לניהול יעיל של משאבים.
- פייפליינים של CI/CD: תהליכי עבודה אוטומטיים לפריסה שמבוססים על Cloud Build.
- Observability: תמיכה מובנית ב-Cloud Trace וב-Cloud Logging.
כדי להתחיל, אפשר לעיין במדריך למתחילים.
תרחישים לדוגמה
כדי לקרוא על Agent Runtime עם דוגמאות מקצה לקצה, אפשר לעיין במקורות המידע הבאים:
לחיצה להרחבת תרחישי שימוש
| תרחיש לדוגמה | תיאור | קישורים | |
|---|---|---|---|
| יצירת סוכנים על ידי התחברות לממשקי API ציבוריים | המרת מטבעות. יצירת פונקציה שמתחברת לאפליקציה להמרת מטבעות, כדי שהמודל יוכל לספק תשובות מדויקות לשאילתות כמו "מה שער החליפין בין אירו לדולר היום?" |
מחברת (notebook) של Agent Platform SDK (Python) – מבוא ליצירה ולפריסה של סוכן באמצעות Agent Runtime | |
| עיצוב מודל סולרי קהילתי. לזהות מיקומים פוטנציאליים, לחפש משרדי ממשלה וספקים רלוונטיים ולעיין בתצלומי לוויין ובפוטנציאל ליצירת אנרגיה סולארית של אזורים ומבנים כדי למצוא את המיקום האופטימלי להתקנת הלוחות הסולאריים. |
מחברת (notebook) של Agent Platform SDK (Python) – יצירה ופריסה של סוכן Google Maps API באמצעות Agent Runtime | ||
| יצירת סוכנים על ידי חיבור למסדי נתונים | שילוב עם AlloyDB ו-Cloud SQL ל-PostgreSQL. | פוסט בבלוג – השקת LangChain ב-Gemini Enterprise Agent Platform ל-AlloyDB ול-Cloud SQL ל-PostgreSQL מחברת (Python) של Agent Platform SDK – פריסת אפליקציית RAG באמצעות Cloud SQL ל-PostgreSQL ב-Agent Runtime מחברת (Python) של Agent Platform SDK – פריסת אפליקציית RAG באמצעות AlloyDB ל-PostgreSQL ב-Agent Runtime |
|
| ליצור סוכנים באמצעות כלים שיכולים לגשת לנתונים במסד הנתונים שלכם. | מחברת (notebook) של Agent Platform SDK (Python) – פריסת סוכן באמצעות Agent Runtime ו-MCP Toolbox for Databases | ||
| שליחת שאילתות למאגרי נתונים מובְנים והבנתם באמצעות שפה טבעית. | מחברת (notebook) של Agent Platform SDK (Python) – יצירת סוכן לחיפוש שיחות באמצעות Agent Runtime ו-RAG בחיפוש מבוסס סוכנים | ||
| יצירת שאילתות והבנת מסדי נתונים של גרפים באמצעות שפה טבעית | פוסט בבלוג – GenAI GraphRAG וסוכני AI באמצעות Agent Runtime עם LangChain ו-Neo4j | ||
| שליחת שאילתות למאגרי וקטורים והבנתם באמצעות שפה טבעית | פוסט בבלוג – פישוט של GenAI RAG באמצעות MongoDB Atlas ו-Agent Runtime | ||
| יצירת סוכנים באמצעות הערכה לפיתוח סוכנים (ADK) | איך יוצרים ופורסים סוכנים באמצעות ערכה לפיתוח סוכנים (ADK). | ערכה לפיתוח סוכנים – פריסה ל-Agent Runtime | |
| יצירת סוכנים באמצעות מסגרות OSS | פיתוח ופריסה של סוכנים באמצעות מסגרת הקוד הפתוח OneTwo. | פוסט בבלוג – OneTwo ו-Agent Runtime: בחינת פיתוח מתקדם של סוכני AI ב- Google Cloud | |
| פיתוח ופריסה של סוכנים באמצעות מסגרת הקוד הפתוח LangGraph. | מחברת (notebook) של Agent Platform SDK (Python) – יצירה ופריסה של אפליקציית LangGraph באמצעות Agent Runtime | ||
| ניפוי באגים וביצוע אופטימיזציה לסוכנים | פיתוח ומעקב אחרי סוכנים באמצעות OpenTelemetry ו-Cloud Trace. | מחברת Agent Platform SDK (Python) – ניפוי באגים באגנטים ואופטימיזציה שלהם: מדריך למעקב ב-Agent Runtime | |
| יצירת מערכות מרובות סוכנים באמצעות פרוטוקול A2A (גרסת Preview) | ליצור סוכנים עם יכולת פעולה הדדית שיכולים לתקשר ולשתף פעולה עם סוכנים אחרים, בלי קשר למסגרת שלהם. | מידע נוסף מופיע במסמכי העזרה בנושא פרוטוקול A2A. | |
אבטחה לארגונים
סביבת זמן הריצה של הסוכן תומכת בכמה תכונות שיעזרו לכם לעמוד בדרישות האבטחה של הארגון, לפעול בהתאם למדיניות האבטחה של הארגון וליישם שיטות מומלצות לאבטחה. התכונות הבאות נתמכות:
VPC Service Controls: Agent Runtime תומך ב-VPC Service Controls כדי לחזק את אבטחת המידע ולצמצם את הסיכונים לזליגת נתונים. מידע נוסף זמין במאמר VPC Service Controls של Agent Runtime.
ממשק Private Service Connect: עבור Agent Runtime, PSC-I מאפשר לסוכנים שלכם ליצור אינטראקציה עם שירותים שמארחים באופן פרטי ב-VPC של משתמש. מידע נוסף זמין במאמר שימוש בממשק Private Service Connect עם Agent Runtime.
מפתחות הצפנה בניהול הלקוח (CMEK): Agent Runtime תומך ב-CMEK כדי להגן על הנתונים שלכם באמצעות מפתחות הצפנה משלכם. כך אתם הבעלים של המפתחות שמגנים על הנתונים במנוחה ב- Google Cloudויש לכם שליטה מלאה בהם. מידע נוסף זמין במאמר בנושא CMEK של Agent Runtime.
מיקום הנתונים (DRZ): Agent Runtime תומך במיקום הנתונים (DRZ) כדי לוודא שכל הנתונים במצב מנוחה מאוחסנים באזור שצוין.
HIPAA: כחלק מ-Agent Platform, Agent Runtime תומך בעומסי עבודה (workloads) של HIPAA.
Access Transparency: שקיפות גישה מספקת לכם יומנים שמתעדים את הפעולות שאנשי הצוות של Google מבצעים כשהם ניגשים לתוכן שלכם. מידע נוסף על הפעלת Access Transparency ב-Agent Runtime זמין במאמר Access Transparency ב-Agent Platform.
בטבלה הבאה מפורטות תכונות האבטחה לארגונים שנתמכות בכל שירות של Agent Platform:
| אמצעי אבטחה | Agent Runtime | סשנים | Memory Bank | חנות לדוגמה | הרצת קוד |
|---|---|---|---|---|---|
| VPC Service Controls | כן | כן | כן | לא | כן |
| מפתחות הצפנה בניהול הלקוח | כן | כן | כן | לא | כן |
| מיקום הנתונים (DRZ) במצב מנוחה | כן | כן | כן | לא | כן |
| HIPAA | כן | כן | כן | כן | כן |
| Access Transparency | כן | כן | כן | לא | לא |
| Access Approval | כן | כן | כן | לא | לא |
אזורים נתמכים
במאמר מיקומים מופיעה רשימה של אזורים נתמכים ב-Agent Runtime.
מכסה
מידע על מכסות של Agent Runtime זמין במאמר מכסות ומגבלות של המערכת.
תמחור
יש מסלול חינמי ל-Agent Runtime. מידע על התמחור של Agent Runtime זמין במאמר בנושא תמחור של Gemini Enterprise Agent Platform.
העברה ל-SDK מבוסס-לקוח
מודול agent_engines ב-Agent Platform SDK עובר שינוי מבנה לעיצוב מבוסס-לקוח, מהסיבות העיקריות הבאות:
- כדי להתאים לערכה לפיתוח סוכנים (ADK) ול-Google Gen AI SDK בייצוגים קנוניים של סוגים. כך אפשר לוודא שסוגי הנתונים מיוצגים בצורה עקבית ותקנית בערכות SDK שונות, מה שמפשט את יכולת הפעולה ההדדית ומפחית את התקורה של ההמרות.
- לשימוש בפרמטרים בהיקף של לקוח באפליקציות מרובות מיקומים ומרובות פרויקטים. Google Cloud כך אפליקציה יכולה לנהל אינטראקציות עם משאבים בפרויקטים שונים של Google Cloud ובמיקומים גיאוגרפיים שונים, על ידי הגדרת כל מופע של לקוח עם ההגדרות הספציפיות של הפרויקט והמיקום שלו.
- כדי לשפר את יכולת הגילוי והלכידות של שירותי Agent Runtime