מכסות ומגבלות

במסמך הזה מפורטות המכסות והמגבלות הנפוצות לשימוש ב-Dialogflow. בהמשך מוסבר איך למצוא רשימה מלאה של מכסות ומגבלות. אנחנו שומרים לעצמנו את הזכות לשנות את המגבלות האלה, ונעדכן את הדף הזה אם יהיו שינויים.

מכסות

מכסות הן אילוצים שמוגדרים כברירת מחדל ומוחלים על הפרויקט. כשמשתמשים בתכונות גנרטיביות, לכל שילוב של מודל ואזור יש מכסת שימוש גנרטיבי משלו. אם אתם משתמשים במהדורה בתשלום, אתם יכולים לבקש להגדיל את המכסה. המטרה של המכסות היא לרסן את עומס השירות לכל לקוח, וכך להגן על השירות מפני עומס יתר ועל הלקוח מפני שימוש לא צפוי במשאבים.

המיכסות ב-Dialogflow משתנות בהתאם למהדורה של הסוכן. המכסות חלות על כל פרויקט ומשותפות לכל האפליקציות וכתובות ה-IP שמשתמשות בפרויקט.

פרטים על גבולות הזמן של המכסה:

  • המכסות החודשיות מתחדשות ב-1 בכל חודש בשעה 00:00 לפי שעון החוף המערבי בארה"ב.
  • המכסות היומיות מתחדשות מדי יום בחצות לפי שעון החוף המערבי בארה"ב. כשמעבר לשעון קיץ באזור זמן פסיפיק מאריך את משך היום, תקבלו בונוס פרופורציונלי למכסת השימוש. עם זאת, לא מתבצע ניכוי מקביל כשיום קצר יותר מתרחש בגלל המעבר לשעון קיץ.
  • מכסות לדקה מתעדכנות כל 60 שניות.

המכסות שמפורטות בטבלת המכסות הן המכסות הנפוצות. כדי לבדוק את כל המכסות, אפשר לעיין בדף Google Cloud מכסות של Dialogflow במסוף.

מכסות גנרטיביות

כשסוכן משתמש ב-Dialogflow CX בתכונות גנרטיביות, לכל שילוב של מודל ואזור יש מכסות ייחודיות.

מזהה המכסה

המיכסה ConversationalAgentLlmTokenConsumption היא מיכסה אזורית שמתעדת את השימוש בטוקנים במודלים גדולים של שפה (LLM) ב-Dialogflow CX. המיכסה הזו נמדדת במודלים שונים של LLM, ובשלב הזה היא תומכת במודלים הבאים:

  • gemini-1.5-pro
  • gemini-1.5-pro-002
  • gemini-1.5-flash
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
  • gemini-2.0-flash-lite-001
  • gemini-2.5-flash
  • gemini-2.5-flash-lite

ConversationalAgentLlmTokenConsumption המכסה עוקבת אחרי השימוש באסימוני LLM בתכונות הבאות של Dialogflow CX:

  • גנרטורים
  • מענה גנרטיבי כגיבוי
  • Playbook
  • Datastore

מגבלת ברירת המחדל של המכסה ConversationalAgentLlmTokenConsumption היא 600,000 טוקנים לדקה.

בקשה להגדלת מכסה במספר אזורים

אם אתם צריכים לבקש הגדלת מכסה לאזור מרובה, אתם צריכים לשלוח את הבקשה לאחד מהאזורים הספציפיים הבאים:

  • לסוכנים באזורים מרובים בארה"ב ובכל העולם, משתמשים ב-us-central1.
  • לסוכנים באזור הרב-אזורי EU, משתמשים ב-europe-west4.

המחשה ויזואלית של השימוש בטוקנים לפי אזור ומודל

כדי לקבל תובנות לגבי צריכת הטוקנים של מודלים גדולים של שפה (LLM) באזורים ובמודלים שונים, פועלים לפי השלבים הבאים באמצעות Metrics Explorer:

  1. כדי לגשת ל-Metrics Explorer: פותחים את Metrics Explorer.
  2. בוחרים את המדד: בוחרים באפשרות Conversational Agent LLM tokens quota usage בתור המדד שרוצים לנתח.
  3. מגדירים את התכונות Aggregation (צבירה) ו-Aligner (התאמה):
    • מגדירים את פונקציית הצבירה ל-Sum כדי לקבל את סך השימוש באסימונים.
    • לוחצים על Configure Aligner כדי להפעיל את החישוב של השינויים בין נקודות נתונים עוקבות בסדרת הזמנים. כך תוכלו להבין את מגמות השימוש לאורך זמן.
  4. הגדרת מאפיינים לצבירת נתונים: כדי לפרק את השימוש באסימונים, בוחרים באפשרויות location ו-base_model כמאפיינים לצבירת נתונים. כך תוכלו לראות את ההבדלים בצריכת הטוקנים באזורים ובמודלים שונים.
  5. הגדרת פונקציית ההתאמה: בוחרים בפונקציה Sum כדי לחשב את השינוי הכולל בשימוש באסימונים בין נקודות נתונים עוקבות.

בקשה להגדלת מכסה

במקרה הצורך, אפשר לבקש התאמה של הגדלת המכסה.

אם אתם משתמשים בפרויקטים שונים לסוכני Dialogflow ולאימות באמצעות חשבונות שירות, אתם צריכים לבקש הגדלה של המכסה לפרויקט הצרכן. מידע נוסף זמין במאמר שימוש בכמה פרויקטים ב-Dialogflow ES או במאמר שימוש בכמה פרויקטים ב-Dialogflow CX.

לגבי סוכני Dialogflow ES, לפני שמבקשים להגדיל את המכסה, צריך לשדרג את הסוכן למהדורת Dialogflow Essentials.

טבלת מכסות

המונחים הבאים משמשים לתיאור התמחור והמכסות:

  • בקשה: בקשה מוגדרת ככל קריאה ל-API של שירות Dialogflow CX, בין אם היא ישירה עם שימוש ב-API או עקיפה עם שימוש בשילוב או במסוף. מספר הבקשות שמשתמש קצה צריך לשלוח כדי לבצע משימה באמצעות סוכן Dialogflow CX משתנה מאוד בהתאם למשימה ולעיצוב של הסוכן.
  • סשן: סשן הוא שיחה בין משתמש קצה לבין סוכן של Dialogflow CX. סשן נשאר פעיל והנתונים שלו נשמרים למשך 30 דקות אחרי הבקשה האחרונה שנשלחה לסשן. סשן יכול להיות סשן צ'אט או סשן קולי.
    • סשן צ'אט: בסשן צ'אט נעשה שימוש בטקסט בלבד גם לבקשות וגם לתשובות.
    • סשן קולי: סשן קולי משתמש באודיו לבקשות, לתשובות או לשניהם.
  • פרויקטים של צרכנים ופרויקטים של משאבים: אם אתם משתמשים בכמה פרויקטים, יכול להיות שהפרויקט שמשויך לאימות הבקשה (פרויקט צרכן) הוא לא אותו פרויקט שמשויך לסוכן בבקשה (פרויקט משאב). במקרה הזה, פרויקט הצרכן משמש לקביעת המחירים והמכסות. מידע נוסף זמין במאמרים שימוש בכמה פרויקטים ב-Dialogflow ES או שימוש בכמה פרויקטים ב-Dialogflow CX.

בטבלאות הבאות מופיעה השוואה בין המכסות של המהדורות לפי סוג הסוכן. אלא אם מצוין שתכונה מסוימת כלולה, המכסות הן מצטברות לכל התכונות שנעשה בהן שימוש בבקשה.

סוכן Dialogflow CX

תכונה מהדורת Dialogflow CX
טקסט
(כולל כל הבקשות מסוג DetectIntent,‏ StreamingDetectIntent ו-FulfillIntent שלא מכילות אודיו)
‫1,200 בקשות לדקה
קלט/פלט של אודיו
(זיהוי דיבור, דיבור לטקסט, STT, סינתזת דיבור, המרת טקסט לדיבור, TTS, טלפוניה)
‫600 בקשות לדקה
פעולות של שאילתות אודיו עם קול באיכות HD של Chirp3
(סינתזת דיבור, המרת טקסט לדיבור, TTS, טלפוניה)
‫25 בקשות בדקה *
תכונות גנרטיביות
(מדריכים, מאגרי נתונים, גנרטורים, מענה גנרטיבי כגיבוי)
‫600,000 טוקנים לדקה, ראו מכסות גנרטיביות
Dialogflow CX Phone Gateway
כולל קלט ופלט של אודיו.
‫100 דקות שיחה בסה"כ לדקה ‡
בקשות כתיבה בזמן עיצוב
לדוגמה, קריאות ליצירה או לעדכון של סוכן.
‫60 בקשות לדקה
בקשות קריאה בזמן העיצוב
לדוגמה, קריאות ליצירת רשימה או לקבלת משאבי סוכן.
‫300 בקשות לדקה
בקשות אחרות לסשן
לדוגמה, הגדרה או קבלה של ישויות סשן.
‫100 בקשות לדקה

סוכן Dialogflow ES

תכונה מהדורת ניסיון מהדורת Essentials
טקסט
(כולל כל הבקשות מסוג DetectIntent ו-StreamingDetectIntent שלא מכילות אודיו)
‫180 בקשות לדקה ¶ ‫600 בקשות לדקה ¶
קלט אודיו
(נקרא גם זיהוי דיבור, המרת דיבור לטקסט, STT)
‫100 בקשות בדקה †

1,000 בקשות ביום †

15,000 בקשות בחודש †

אורך שמע מקסימלי של 60 שניות לכל בקשה †
‫300 בקשות לדקה †

משך האודיו המקסימלי לכל בקשה הוא 60 שניות †
פלט אודיו
(נקרא גם סינתזת דיבור, המרת טקסט לדיבור, TTS)
זהה לקלט האודיו זהה לקלט האודיו
מחברים לידע (בטא) גודל מסמך מקסימלי של 10MB

1,000 בקשות בחודש

100 בקשות ביום
ללא הגבלה #
ניתוח סנטימנטים לא זמין מספר ללא הגבלה
Dialogflow ES phone gateway
כולל קלט ופלט של אודיו.
מספר חינם: לא זמין

3 דקות שיחה בסך הכול לדקה ‡

30 דקות שיחה ביום

500 דקות שיחה בחודש

מספר הטלפון שמור למשך 30 יום
‫100 דקות שיחה בסה"כ לדקה ‡
מגה סוכן ‫1,000 בקשות ביום מספר ללא הגבלה
בקשות כתיבה בזמן עיצוב
לדוגמה, קריאות ליצירה או לעדכון של סוכן.
‫60 בקשות לדקה ‫60 בקשות לדקה
בקשות קריאה בזמן העיצוב
לדוגמה, קריאות ליצירת רשימה או לקבלת משאבי סוכן.
‫60 בקשות לדקה ‫60 בקשות לדקה
בקשות אחרות לביקור
לדוגמה, הגדרה או קבלת ישויות של ביקור או עדכון או שאילתה של הקשר.
‫100 בקשות לדקה ‫100 בקשות לדקה

Agent Assist

אם אתם משתמשים ב-Agent Assist, חלות גם המכסות שמפורטות בכרטיסיות Dialogflow CX Agent ו-Dialogflow ES Agent, בהתאם לסוג הסוכן שבו אתם משתמשים.

תכונה מהדורת ניסיון מהדורת Essentials
Agent Assist conversation other operations
כולל את כל הבקשות לניהול שיחות ומשתתפים.
לא זמין ‫300 בקשות לדקה
Agent Assist analyze text/audio operations
כולל את כל הבקשות של AnalyzeContent או StreamingAnalyzeContent לכל שלב בשיחה. הבקשות האלה כוללות בקשות שקשורות לטקסט, לסינתזת דיבור ו/או לזיהוי דיבור.
לא זמין ‫300 בקשות לדקה
סשנים של סטרימינג דו-כיווני בו-זמני
כולל את כל הבקשות מסוג BidiStreamingAnalyzeContent לכל שלב בשיחה. הדרישה הזו כוללת את כל הבקשות שקשורות לסינתזת דיבור ו/או לזיהוי דיבור.
לא זמין ‫50 בקשות מקבילות
בקשות להצגת הצעות לסיכום שיחה ב-Agent Assist
כולל את כל הבקשות לקבלת סיכומי שיחות.
לא זמין ‫60 בקשות לדקה
בקשות לחיפוש מידע ב-Agent Assist
כולל את כל הבקשות לחיפוש מידע בכל שלב בשיחה.
לא זמין ‫60 בקשות לדקה

מגבלות

מגבלות הן אילוצים קבועים שאי אפשר להגדיל. למשאבים ולשדות רבים יש מגבלות על מספר, משך או אורך, שהן אילוצים קבועים בהטמעה של השירות.

בטבלאות הבאות מפורטות מגבלות נפוצות. יכול להיות שבמאמרי העזרה של תכונות ספציפיות ובמאמרי העזרה של ה-API יצוינו מגבלות נוספות.

מגבלות על מספרים

סוכן Dialogflow CX

תיאור הגבלה
מספר הסוכנים המקסימלי לכל Google Cloud פרויקט 1000
המספר המקסימלי של מספרי טלפון לכל פרויקט (למעט באזור global) 5
המספר המקסימלי של מספרי טלפון לכל פרויקט בכל אזור (חוץ מאזור global) 5
מספר התהליכים המקסימלי לכל סוכן 50
מספר סוגי הישויות המקסימלי לכל סוכן 250
מספר ה-webhook המקסימלי לכל נציג 100
מספר הסביבות המקסימלי לכל סוכן 20
מספר מקסימלי של תרחישי בדיקה לכל סוכן 2000
מספר השינויים המקסימלי לכל סוכן 20,000
המספר המקסימלי של דפים בכל זרימה 250
המספר המקסימלי של קבוצות מסלולים לכל זרימה 100
מספר הגרסאות המקסימלי לכל זרימה 20
מספר הכוונות המקסימלי לסוכן 10,000
מספר הכוונות המקסימלי שאפשר להפנות אליהן בכל זרימת שיחה 2000
מספר מקסימלי של ביטויי אימון לכל כוונה ולכל שפה (חוץ מ'כוונה שלילית שמוגדרת כברירת מחדל') 2000
מספר מקסימלי של ביטויי אימון לכל תהליך ולכל שפה 100,000
מספר הפרמטרים המקסימלי לכל כוונה 20
מספר מקסימלי של רשומות ישות לכל ישות 30,000
מספר המילים הנרדפות המקסימלי לישות בכל ערך של ישות 200
מספר הערכים המקסימלי של הפניות לישויות ומילים נרדפות לכל סוכן ולכל שפה 1,000,000
מספר הפרמטרים המקסימלי בכל דף 20
המספר המקסימלי של מסלולים בכל דף 2000
מספר מקסימלי של רכיבי Event Handler בכל דף 100
מספר המסלולים המקסימלי לכל קבוצת מסלולים 2000
מספר המחזורי המכירה המקסימלי לכל סוכן 50
המספר המקסימלי של הפעלות של תסריטי הפעלה בתור אחד של שיחה 3
המספר המקסימלי של קריאות ל-LLM לכל הפעלה של פלייבוק באותו תור שיחה 10
מספר מקסימלי של דוגמאות של תרחישי שימוש לכל נציג באמצעות אסטרטגיית אחזור הדוגמאות שמוגדרת כברירת מחדל, המערכת תגביל באופן אוטומטי את מספר הדוגמאות כך שיתאימו למגבלת הטוקנים של המודל שבו נעשה שימוש, על סמך הרלוונטיות של הדוגמאות להקשר של הסשן.
המספר המקסימלי של גרסאות לכל ספר הפעלה 100
מספר הכלים המקסימלי לכל סוכן 100
מספר השלבים המקסימלי בכל שיחה 100

סוכן Dialogflow ES

תיאור הגבלה
מספר הסוכנים המקסימלי לכל אזור ולכל פרויקט בענן של Google ¶ 1
המספר המקסימלי של מספרי טלפון לכל פרויקט (למעט באזור global) 5
המספר המקסימלי של מספרי טלפון לכל פרויקט בכל אזור (חוץ מאזור global) 5
מספר הכוונות המקסימלי 2000
מספר מקסימלי של סוגי ישויות 250
מספר מקסימלי של ביטויי אימון לכל כוונה ולכל שפה 2000
מספר הביטויים לאימון המקסימלי לכל סוכן ולכל שפה 100,000
המספר המקסימלי של ערכי ישויות 30000
מספר המילים הנרדפות המקסימלי לישות לכל רשומה של ישות 200
מספר המקסימלי של ערכי הפניה לישות ומילים נרדפות לכל סוכן ולכל שפה 1,000,000
מספר הפרמטרים המקסימלי לכל כוונה 20
מספר מקסימלי של הקשרים של קלט לכל כוונה 5
מספר מקסימלי של הקשרים לפלט לכל כוונת משתמש 30
מספר התשובות המקסימלי בטקסט לכל כוונה ולכל שפה 30
מספר ההנחיות המקסימלי לכל פרמטר ולכל שפה 30
מספר הסביבות המקסימלי לכל סוכן 10
מספר הגרסאות המקסימלי לכל סוכן 1000

Agent Assist

אם אתם משתמשים ב-Agent Assist, המגבלות שמפורטות בכרטיסיות Dialogflow CX Agent ו-Dialogflow ES חלות גם עליכם, בהתאם לסוג הסוכן שבו אתם משתמשים.

תיאור הגבלה
מספר השיחות המינימלי שנדרש לאימון המודל 30,000
מספר המודלים המקסימלי שאפשר לאמן בו-זמנית בכל פרויקט 1
המספר המקסימלי של מספרי טלפון לכל פרויקט (למעט באזור global) 5
המספר המקסימלי של מספרי טלפון לכל פרויקט בכל אזור (חוץ מאזור global) 5
מספר שעות ה-GPU המקסימלי של צומת אימון בחודש 4200
מספר מקסימלי של פרופילים של שיחות 100

מגבלות משך

סוכן Dialogflow CX

תיאור הגבלה
פרק הזמן המקסימלי להמתנה לתגובה מאתר אחר (webhook) ‫30 שניות
משך קלט האודיו המקסימלי ‫120 שניות

סוכן Dialogflow ES

תיאור הגבלה
זמן קצוב לתגובה לפעולה מאתר אחר (webhook) ‫5 שניות
משך שיחה מקסימלי בטלפון 3.5 hours

מגבלות אורך

סוכן Dialogflow CX

תיאור הגבלה
אורך מקסימלי של ביטוי הדרכה ‫768 תווים
אורך מקסימלי של תשובה טקסטואלית ‫4,000 תווים
אורך הקלט המקסימלי של טקסט לזיהוי כוונות שתואמות לפרמטרים או לכוונות לא גנרטיביות ‫256 תווים

סוכן Dialogflow ES

תיאור הגבלה
אורך מינימלי של שם הסוכן תו אחד
אורך מקסימלי של שם הסוכן ‫150 תווים
אורך מקסימלי של תיאור הסוכן ‫500 תווים
אורך מקסימלי של שם כוונת רכישה ‫100 תווים
האורך המקסימלי של שם סוג הישות ‫30 תווים
אורך מקסימלי של ביטוי הדרכה ‫768 תווים
אורך מקסימלי של שם פעולה ‫250 תווים
אורך מקסימלי של שם ההקשר ‫250 תווים
אורך מקסימלי של ערך בשדה ‫512 תווים
אורך מקסימלי של שם הפרמטר ‫30 תווים
אורך מקסימלי של תשובה טקסטואלית ‫4,000 תווים
האורך המקסימלי של קלט הטקסט לזיהוי כוונות * ‫256 תווים
אורך מקסימלי של שם אירוע ‫150 תווים

מגבלות גודל

סוכן Dialogflow CX

תיאור הגבלה
הגודל המקסימלי של בקשה לסינתזת דיבור מגבלות על תוכן ב-TTS API
גודל מקסימלי של מפרטי כלי ‫20KB

סוכן Dialogflow ES

תיאור הגבלה
הגודל המקסימלי של סוכן (תוכן לא דחוס) עבור ייבוא/שחזור סוכן 50MB
הגודל המקסימלי של בקשה לסינתזת דיבור מגבלות על תוכן ב-TTS API