במסמך הזה מפורטות המכסות והמגבלות הנפוצות לשימוש ב-Dialogflow. בהמשך מוסבר איך למצוא רשימה מלאה של מכסות ומגבלות. אנחנו שומרים לעצמנו את הזכות לשנות את המגבלות האלה, ונעדכן את הדף הזה אם יהיו שינויים.
מכסות
מכסות הן אילוצים שמוגדרים כברירת מחדל ומוחלים על הפרויקט. כשמשתמשים בתכונות גנרטיביות, לכל שילוב של מודל ואזור יש מכסת שימוש גנרטיבי משלו. אם אתם משתמשים במהדורה בתשלום, אתם יכולים לבקש להגדיל את המכסה. המטרה של המכסות היא לרסן את עומס השירות לכל לקוח, וכך להגן על השירות מפני עומס יתר ועל הלקוח מפני שימוש לא צפוי במשאבים.
המיכסות ב-Dialogflow משתנות בהתאם למהדורה של הסוכן. המכסות חלות על כל פרויקט ומשותפות לכל האפליקציות וכתובות ה-IP שמשתמשות בפרויקט.
פרטים על גבולות הזמן של המכסה:
- המכסות החודשיות מתחדשות ב-1 בכל חודש בשעה 00:00 לפי שעון החוף המערבי בארה"ב.
- המכסות היומיות מתחדשות מדי יום בחצות לפי שעון החוף המערבי בארה"ב. כשמעבר לשעון קיץ באזור זמן פסיפיק מאריך את משך היום, תקבלו בונוס פרופורציונלי למכסת השימוש. עם זאת, לא מתבצע ניכוי מקביל כשיום קצר יותר מתרחש בגלל המעבר לשעון קיץ.
- מכסות לדקה מתעדכנות כל 60 שניות.
המכסות שמפורטות בטבלת המכסות הן המכסות הנפוצות. כדי לבדוק את כל המכסות, אפשר לעיין בדף Google Cloud מכסות של Dialogflow במסוף.
מכסות גנרטיביות
כשסוכן משתמש ב-Dialogflow CX בתכונות גנרטיביות, לכל שילוב של מודל ואזור יש מכסות ייחודיות.
מזהה המכסה
המיכסה ConversationalAgentLlmTokenConsumption היא מיכסה אזורית שמתעדת את השימוש בטוקנים במודלים גדולים של שפה (LLM) ב-Dialogflow CX.
המיכסה הזו נמדדת במודלים שונים של LLM,
ובשלב הזה היא תומכת במודלים הבאים:
- gemini-1.5-pro
- gemini-1.5-pro-002
- gemini-1.5-flash
- gemini-1.5-flash-002
- gemini-2.0-flash-001
- gemini-2.0-flash-lite-001
- gemini-2.5-flash
- gemini-2.5-flash-lite
ConversationalAgentLlmTokenConsumption המכסה עוקבת אחרי השימוש באסימוני LLM בתכונות הבאות של Dialogflow CX:
- גנרטורים
- מענה גנרטיבי כגיבוי
- Playbook
- Datastore
מגבלת ברירת המחדל של המכסה ConversationalAgentLlmTokenConsumption היא 600,000 טוקנים לדקה.
בקשה להגדלת מכסה במספר אזורים
אם אתם צריכים לבקש הגדלת מכסה לאזור מרובה, אתם צריכים לשלוח את הבקשה לאחד מהאזורים הספציפיים הבאים:
- לסוכנים באזורים מרובים בארה"ב ובכל העולם, משתמשים ב-us-central1.
- לסוכנים באזור הרב-אזורי EU, משתמשים ב-europe-west4.
המחשה ויזואלית של השימוש בטוקנים לפי אזור ומודל
כדי לקבל תובנות לגבי צריכת הטוקנים של מודלים גדולים של שפה (LLM) באזורים ובמודלים שונים, פועלים לפי השלבים הבאים באמצעות Metrics Explorer:
- כדי לגשת ל-Metrics Explorer: פותחים את Metrics Explorer.
- בוחרים את המדד:
בוחרים באפשרות
Conversational Agent LLM tokens quota usageבתור המדד שרוצים לנתח. - מגדירים את התכונות Aggregation (צבירה) ו-Aligner (התאמה):
- מגדירים את פונקציית הצבירה ל-
Sumכדי לקבל את סך השימוש באסימונים. - לוחצים על
Configure Alignerכדי להפעיל את החישוב של השינויים בין נקודות נתונים עוקבות בסדרת הזמנים. כך תוכלו להבין את מגמות השימוש לאורך זמן.
- מגדירים את פונקציית הצבירה ל-
- הגדרת מאפיינים לצבירת נתונים: כדי לפרק את השימוש באסימונים, בוחרים באפשרויות
locationו-base_modelכמאפיינים לצבירת נתונים. כך תוכלו לראות את ההבדלים בצריכת הטוקנים באזורים ובמודלים שונים. - הגדרת פונקציית ההתאמה:
בוחרים בפונקציה
Sumכדי לחשב את השינוי הכולל בשימוש באסימונים בין נקודות נתונים עוקבות.
בקשה להגדלת מכסה
במקרה הצורך, אפשר לבקש התאמה של הגדלת המכסה.
אם אתם משתמשים בפרויקטים שונים לסוכני Dialogflow ולאימות באמצעות חשבונות שירות, אתם צריכים לבקש הגדלה של המכסה לפרויקט הצרכן. מידע נוסף זמין במאמר שימוש בכמה פרויקטים ב-Dialogflow ES או במאמר שימוש בכמה פרויקטים ב-Dialogflow CX.
לגבי סוכני Dialogflow ES, לפני שמבקשים להגדיל את המכסה, צריך לשדרג את הסוכן למהדורת Dialogflow Essentials.
טבלת מכסות
המונחים הבאים משמשים לתיאור התמחור והמכסות:
- בקשה: בקשה מוגדרת ככל קריאה ל-API של שירות Dialogflow CX, בין אם היא ישירה עם שימוש ב-API או עקיפה עם שימוש בשילוב או במסוף. מספר הבקשות שמשתמש קצה צריך לשלוח כדי לבצע משימה באמצעות סוכן Dialogflow CX משתנה מאוד בהתאם למשימה ולעיצוב של הסוכן.
- סשן:
סשן הוא שיחה בין משתמש קצה לבין סוכן של Dialogflow CX.
סשן נשאר פעיל והנתונים שלו נשמרים למשך 30 דקות אחרי הבקשה האחרונה שנשלחה לסשן.
סשן יכול להיות סשן צ'אט או סשן קולי.
- סשן צ'אט: בסשן צ'אט נעשה שימוש בטקסט בלבד גם לבקשות וגם לתשובות.
- סשן קולי: סשן קולי משתמש באודיו לבקשות, לתשובות או לשניהם.
- פרויקטים של צרכנים ופרויקטים של משאבים: אם אתם משתמשים בכמה פרויקטים, יכול להיות שהפרויקט שמשויך לאימות הבקשה (פרויקט צרכן) הוא לא אותו פרויקט שמשויך לסוכן בבקשה (פרויקט משאב). במקרה הזה, פרויקט הצרכן משמש לקביעת המחירים והמכסות. מידע נוסף זמין במאמרים שימוש בכמה פרויקטים ב-Dialogflow ES או שימוש בכמה פרויקטים ב-Dialogflow CX.
בטבלאות הבאות מופיעה השוואה בין המכסות של המהדורות לפי סוג הסוכן. אלא אם מצוין שתכונה מסוימת כלולה, המכסות הן מצטברות לכל התכונות שנעשה בהן שימוש בבקשה.
סוכן Dialogflow CX
| תכונה | מהדורת Dialogflow CX |
|---|---|
|
טקסט (כולל כל הבקשות מסוג DetectIntent, StreamingDetectIntent ו-FulfillIntent שלא מכילות אודיו) |
1,200 בקשות לדקה |
|
קלט/פלט של אודיו (זיהוי דיבור, דיבור לטקסט, STT, סינתזת דיבור, המרת טקסט לדיבור, TTS, טלפוניה) |
600 בקשות לדקה |
|
פעולות של שאילתות אודיו עם קול באיכות HD של Chirp3 (סינתזת דיבור, המרת טקסט לדיבור, TTS, טלפוניה) |
25 בקשות בדקה * |
|
תכונות גנרטיביות (מדריכים, מאגרי נתונים, גנרטורים, מענה גנרטיבי כגיבוי) |
600,000 טוקנים לדקה, ראו מכסות גנרטיביות |
|
Dialogflow CX Phone Gateway כולל קלט ופלט של אודיו. |
100 דקות שיחה בסה"כ לדקה ‡ |
|
בקשות כתיבה בזמן עיצוב לדוגמה, קריאות ליצירה או לעדכון של סוכן. |
60 בקשות לדקה |
|
בקשות קריאה בזמן העיצוב לדוגמה, קריאות ליצירת רשימה או לקבלת משאבי סוכן. |
300 בקשות לדקה |
|
בקשות אחרות לסשן לדוגמה, הגדרה או קבלה של ישויות סשן. |
100 בקשות לדקה |
| סמל | תיאור |
|---|---|
| * | אם תחרגו מהמכסה, יכול להיות שהקולות באיכות HD של Chirp 3 יוחלפו בקולות רגילים או בקולות מבוססי-רשת עצבית |
| ‡ | המדד 'דקות שיחה בטלפון לדקה' הוא הסכום הכולל של הזמן לדקה שבו השתמשו כל המשתמשים שביצעו שיחות דרך מערכת הטלפון. לדוגמה: במהלך תקופה של 60 שניות, משתמש אחד נמצא באתר במשך 60 שניות, משתמש שני במשך 30 שניות ומשתמש שלישי במשך 30 שניות. החישוב הוא 2 דקות לכל דקה. יותר דקות בכל דקה מאפשרות ליותר משתמשים להשתמש במערכת בו-זמנית. |
סוכן Dialogflow ES
| תכונה | מהדורת ניסיון | מהדורת Essentials |
|---|---|---|
|
טקסט (כולל כל הבקשות מסוג DetectIntent ו-StreamingDetectIntent שלא מכילות אודיו) |
180 בקשות לדקה ¶ | 600 בקשות לדקה ¶ |
|
קלט אודיו (נקרא גם זיהוי דיבור, המרת דיבור לטקסט, STT) |
100 בקשות בדקה † 1,000 בקשות ביום † 15,000 בקשות בחודש † אורך שמע מקסימלי של 60 שניות לכל בקשה † |
300 בקשות לדקה † משך האודיו המקסימלי לכל בקשה הוא 60 שניות † |
|
פלט אודיו (נקרא גם סינתזת דיבור, המרת טקסט לדיבור, TTS) |
זהה לקלט האודיו | זהה לקלט האודיו |
| מחברים לידע (בטא) | גודל מסמך מקסימלי של 10MB 1,000 בקשות בחודש 100 בקשות ביום |
ללא הגבלה # |
| ניתוח סנטימנטים | לא זמין | מספר ללא הגבלה |
|
Dialogflow ES phone gateway כולל קלט ופלט של אודיו. |
מספר חינם: לא זמין 3 דקות שיחה בסך הכול לדקה ‡ 30 דקות שיחה ביום 500 דקות שיחה בחודש מספר הטלפון שמור למשך 30 יום |
100 דקות שיחה בסה"כ לדקה ‡ |
| מגה סוכן | 1,000 בקשות ביום | מספר ללא הגבלה |
|
בקשות כתיבה בזמן עיצוב לדוגמה, קריאות ליצירה או לעדכון של סוכן. |
60 בקשות לדקה | 60 בקשות לדקה |
|
בקשות קריאה בזמן העיצוב לדוגמה, קריאות ליצירת רשימה או לקבלת משאבי סוכן. |
60 בקשות לדקה | 60 בקשות לדקה |
|
בקשות אחרות לביקור לדוגמה, הגדרה או קבלת ישויות של ביקור או עדכון או שאילתה של הקשר. |
100 בקשות לדקה | 100 בקשות לדקה |
| סמל | תיאור |
|---|---|
| † | כל שידור StreamingDetectIntent נחשב לבקשה אחת, גם אם השידור כולל כמה פריימים של אודיו StreamingDetectIntentRequest בתוך השידור. |
| ‡ | המדד 'דקות שיחה בטלפון לדקה' הוא הסכום הכולל של הזמן לדקה שבו השתמשו כל המשתמשים שביצעו שיחות דרך מערכת הטלפון. לדוגמה: במהלך תקופה של 60 שניות, משתמש אחד נמצא באתר במשך 60 שניות, משתמש שני במשך 30 שניות ומשתמש שלישי במשך 30 שניות. החישוב הוא 2 דקות לכל דקה. יותר דקות בכל דקה מאפשרות ליותר משתמשים להשתמש במערכת בו-זמנית. |
| # | התכונות שמסומנות כבלתי מוגבלות עדיין עשויות להיות מוגבלות בגלל שימוש בתכונות אחרות. לדוגמה, אם המהדורה שלכם מספקת מכסה בלתי מוגבלת למחברי ידע, בקשת טקסט שמשתמשת במחברי ידע עדיין מוגבלת על ידי המכסה לבקשות טקסט. |
| ¶ | קלט ופלט של אודיו ב-Google Assistant נחשבים לבקשת טקסט. |
Agent Assist
אם אתם משתמשים ב-Agent Assist, חלות גם המכסות שמפורטות בכרטיסיות Dialogflow CX Agent ו-Dialogflow ES Agent, בהתאם לסוג הסוכן שבו אתם משתמשים.
| תכונה | מהדורת ניסיון | מהדורת Essentials |
|---|---|---|
|
Agent Assist conversation other operations כולל את כל הבקשות לניהול שיחות ומשתתפים. |
לא זמין | 300 בקשות לדקה |
|
Agent Assist analyze text/audio operations כולל את כל הבקשות של AnalyzeContent או StreamingAnalyzeContent לכל שלב בשיחה. הבקשות האלה כוללות בקשות שקשורות לטקסט, לסינתזת דיבור ו/או לזיהוי דיבור. |
לא זמין | 300 בקשות לדקה |
|
סשנים של סטרימינג דו-כיווני בו-זמני כולל את כל הבקשות מסוג BidiStreamingAnalyzeContent לכל שלב בשיחה. הדרישה הזו כוללת את כל הבקשות שקשורות לסינתזת דיבור ו/או לזיהוי דיבור. |
לא זמין | 50 בקשות מקבילות |
|
בקשות להצגת הצעות לסיכום שיחה ב-Agent Assist כולל את כל הבקשות לקבלת סיכומי שיחות. |
לא זמין | 60 בקשות לדקה |
|
בקשות לחיפוש מידע ב-Agent Assist כולל את כל הבקשות לחיפוש מידע בכל שלב בשיחה. |
לא זמין | 60 בקשות לדקה |
מגבלות
מגבלות הן אילוצים קבועים שאי אפשר להגדיל. למשאבים ולשדות רבים יש מגבלות על מספר, משך או אורך, שהן אילוצים קבועים בהטמעה של השירות.
בטבלאות הבאות מפורטות מגבלות נפוצות. יכול להיות שבמאמרי העזרה של תכונות ספציפיות ובמאמרי העזרה של ה-API יצוינו מגבלות נוספות.
מגבלות על מספרים
סוכן Dialogflow CX
| תיאור | הגבלה |
|---|---|
| מספר הסוכנים המקסימלי לכל Google Cloud פרויקט | 1000 |
המספר המקסימלי של מספרי טלפון לכל פרויקט (למעט באזור global) |
5 |
המספר המקסימלי של מספרי טלפון לכל פרויקט בכל אזור (חוץ מאזור global) |
5 |
| מספר התהליכים המקסימלי לכל סוכן | 50 |
| מספר סוגי הישויות המקסימלי לכל סוכן | 250 |
| מספר ה-webhook המקסימלי לכל נציג | 100 |
| מספר הסביבות המקסימלי לכל סוכן | 20 |
| מספר מקסימלי של תרחישי בדיקה לכל סוכן | 2000 |
| מספר השינויים המקסימלי לכל סוכן | 20,000 |
| המספר המקסימלי של דפים בכל זרימה | 250 |
| המספר המקסימלי של קבוצות מסלולים לכל זרימה | 100 |
| מספר הגרסאות המקסימלי לכל זרימה | 20 |
| מספר הכוונות המקסימלי לסוכן | 10,000 |
| מספר הכוונות המקסימלי שאפשר להפנות אליהן בכל זרימת שיחה | 2000 |
| מספר מקסימלי של ביטויי אימון לכל כוונה ולכל שפה (חוץ מ'כוונה שלילית שמוגדרת כברירת מחדל') | 2000 |
| מספר מקסימלי של ביטויי אימון לכל תהליך ולכל שפה | 100,000 |
| מספר הפרמטרים המקסימלי לכל כוונה | 20 |
| מספר מקסימלי של רשומות ישות לכל ישות | 30,000 |
| מספר המילים הנרדפות המקסימלי לישות בכל ערך של ישות | 200 |
| מספר הערכים המקסימלי של הפניות לישויות ומילים נרדפות לכל סוכן ולכל שפה | 1,000,000 |
| מספר הפרמטרים המקסימלי בכל דף | 20 |
| המספר המקסימלי של מסלולים בכל דף | 2000 |
| מספר מקסימלי של רכיבי Event Handler בכל דף | 100 |
| מספר המסלולים המקסימלי לכל קבוצת מסלולים | 2000 |
| מספר המחזורי המכירה המקסימלי לכל סוכן | 50 |
| המספר המקסימלי של הפעלות של תסריטי הפעלה בתור אחד של שיחה | 3 |
| המספר המקסימלי של קריאות ל-LLM לכל הפעלה של פלייבוק באותו תור שיחה | 10 |
| מספר מקסימלי של דוגמאות של תרחישי שימוש לכל נציג | באמצעות אסטרטגיית אחזור הדוגמאות שמוגדרת כברירת מחדל, המערכת תגביל באופן אוטומטי את מספר הדוגמאות כך שיתאימו למגבלת הטוקנים של המודל שבו נעשה שימוש, על סמך הרלוונטיות של הדוגמאות להקשר של הסשן. |
| המספר המקסימלי של גרסאות לכל ספר הפעלה | 100 |
| מספר הכלים המקסימלי לכל סוכן | 100 |
| מספר השלבים המקסימלי בכל שיחה | 100 |
סוכן Dialogflow ES
| תיאור | הגבלה |
|---|---|
| מספר הסוכנים המקסימלי לכל אזור ולכל פרויקט בענן של Google ¶ | 1 |
המספר המקסימלי של מספרי טלפון לכל פרויקט (למעט באזור global) |
5 |
המספר המקסימלי של מספרי טלפון לכל פרויקט בכל אזור (חוץ מאזור global) |
5 |
| מספר הכוונות המקסימלי | 2000 |
| מספר מקסימלי של סוגי ישויות | 250 |
| מספר מקסימלי של ביטויי אימון לכל כוונה ולכל שפה | 2000 |
| מספר הביטויים לאימון המקסימלי לכל סוכן ולכל שפה | 100,000 |
| המספר המקסימלי של ערכי ישויות | 30000 |
| מספר המילים הנרדפות המקסימלי לישות לכל רשומה של ישות | 200 |
| מספר המקסימלי של ערכי הפניה לישות ומילים נרדפות לכל סוכן ולכל שפה | 1,000,000 |
| מספר הפרמטרים המקסימלי לכל כוונה | 20 |
| מספר מקסימלי של הקשרים של קלט לכל כוונה | 5 |
| מספר מקסימלי של הקשרים לפלט לכל כוונת משתמש | 30 |
| מספר התשובות המקסימלי בטקסט לכל כוונה ולכל שפה | 30 |
| מספר ההנחיות המקסימלי לכל פרמטר ולכל שפה | 30 |
| מספר הסביבות המקסימלי לכל סוכן | 10 |
| מספר הגרסאות המקסימלי לכל סוכן | 1000 |
| ¶ | המספר המקסימלי של סוכנים בכל חשבון תלוי במספר הפרויקטים של Google שאפשר ליצור בחשבון. איך מבקשים להגדיל את מספר הפרויקטים |
Agent Assist
אם אתם משתמשים ב-Agent Assist, המגבלות שמפורטות בכרטיסיות Dialogflow CX Agent ו-Dialogflow ES חלות גם עליכם, בהתאם לסוג הסוכן שבו אתם משתמשים.
| תיאור | הגבלה |
|---|---|
| מספר השיחות המינימלי שנדרש לאימון המודל | 30,000 |
| מספר המודלים המקסימלי שאפשר לאמן בו-זמנית בכל פרויקט | 1 |
המספר המקסימלי של מספרי טלפון לכל פרויקט (למעט באזור global) |
5 |
המספר המקסימלי של מספרי טלפון לכל פרויקט בכל אזור (חוץ מאזור global) |
5 |
| מספר שעות ה-GPU המקסימלי של צומת אימון בחודש | 4200 |
| מספר מקסימלי של פרופילים של שיחות | 100 |
מגבלות משך
סוכן Dialogflow CX
| תיאור | הגבלה |
|---|---|
| פרק הזמן המקסימלי להמתנה לתגובה מאתר אחר (webhook) | 30 שניות |
| משך קלט האודיו המקסימלי | 120 שניות |
סוכן Dialogflow ES
| תיאור | הגבלה |
|---|---|
| זמן קצוב לתגובה לפעולה מאתר אחר (webhook) | 5 שניות |
| משך שיחה מקסימלי בטלפון | 3.5 hours |
מגבלות אורך
סוכן Dialogflow CX
| תיאור | הגבלה |
|---|---|
| אורך מקסימלי של ביטוי הדרכה | 768 תווים |
| אורך מקסימלי של תשובה טקסטואלית | 4,000 תווים |
| אורך הקלט המקסימלי של טקסט לזיהוי כוונות שתואמות לפרמטרים או לכוונות לא גנרטיביות | 256 תווים |
סוכן Dialogflow ES
| תיאור | הגבלה |
|---|---|
| אורך מינימלי של שם הסוכן | תו אחד |
| אורך מקסימלי של שם הסוכן | 150 תווים |
| אורך מקסימלי של תיאור הסוכן | 500 תווים |
| אורך מקסימלי של שם כוונת רכישה | 100 תווים |
| האורך המקסימלי של שם סוג הישות | 30 תווים |
| אורך מקסימלי של ביטוי הדרכה | 768 תווים |
| אורך מקסימלי של שם פעולה | 250 תווים |
| אורך מקסימלי של שם ההקשר | 250 תווים |
| אורך מקסימלי של ערך בשדה | 512 תווים |
| אורך מקסימלי של שם הפרמטר | 30 תווים |
| אורך מקסימלי של תשובה טקסטואלית | 4,000 תווים |
| האורך המקסימלי של קלט הטקסט לזיהוי כוונות * | 256 תווים |
| אורך מקסימלי של שם אירוע | 150 תווים |
| * | המגבלה הזו נאכפת על ידי שירות Dialogflow. אם אתם משתמשים באינטגרציה, יכול להיות שמגבלת הגודל בפלטפורמת האינטגרציה תהיה קטנה יותר. הצגת הפרטים של השילוב. |
מגבלות גודל
סוכן Dialogflow CX
| תיאור | הגבלה |
|---|---|
| הגודל המקסימלי של בקשה לסינתזת דיבור | מגבלות על תוכן ב-TTS API |
| גודל מקסימלי של מפרטי כלי | 20KB |
סוכן Dialogflow ES
| תיאור | הגבלה |
|---|---|
| הגודל המקסימלי של סוכן (תוכן לא דחוס) עבור ייבוא/שחזור סוכן | 50MB |
| הגודל המקסימלי של בקשה לסינתזת דיבור | מגבלות על תוכן ב-TTS API |