In diesem Dokument sind die Kontingente und Systemlimits für Gemini Enterprise aufgeführt. Systemlimits sind feste Werte, die nicht geändert werden können. Im Gegensatz zu anderen Google Cloud-Diensten müssen Gemini Enterprise-Kontingente nicht manuell erhöht werden. Kontingente werden automatisch an die Anzahl der Lizenzen oder Arbeitsplätze angepasst, die Sie erwerben.
Google Cloud nutzt Kontingente, um für Fairness zu sorgen und Spitzen bei der Ressourcennutzung und ‑verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einerGoogle Cloud Ressource Ihr Google Cloud Projekt nutzen kann. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt nebenläufig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community derGoogle Cloud Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud Ressourcen.
Das Cloud-Kontingentsystem tut Folgendes:
- Es überwacht Ihren Verbrauch von Google Cloud Produkten und Diensten.
- Es schränkt Ihren Verbrauch dieser Ressourcen ein.
- Es bietet eine Möglichkeit, Änderungen am Kontingentwert zu beantragen und Kontingentanpassungen zu automatisieren.
Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie auszuführen versuchen, schlägt dann fehl.
Kontingente gelten in der Regel auf Google Cloud Projektebene. Die Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf das verfügbare Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.
Weitere Informationen finden Sie unter Cloud-Kontingente – Übersicht.
Für Gemini Enterprise-Ressourcen gelten außerdem Systemlimits. Systemlimits können nicht geändert werden.
Informationen zu den Überschreitungsgebühren für Gemini Enterprise finden Sie unter Kontingente und Überschreitungen.
Zuteilungskontingente
In der folgenden Tabelle sind die Kontingente für die Discovery Engine API aufgeführt. Diese Kontingente werden nicht nach Ablauf einer bestimmten Zeit zurückgesetzt. Stattdessen werden sie freigegeben, wenn Sie die Ressource freigeben.
| Kontingent | Wert |
|---|---|
| Gesamtzahl der Datenspeicher pro Projekt | 1001 |
| Gesamtzahl der Engines pro Projekt | 1502 |
| Regionale Anzahl von Datenspeichern pro Projekt und Standort (Global, USA, EU) | 100 |
| Regionale Anzahl von Dokumenten pro Projekt und Standort (global, USA, EU) | 10.000.000 |
| Regionale Anzahl von Engines pro Projekt und Standort (global, USA, EU) | 150 |
1 Aufgrund einer technischen Einschränkung beträgt das maximale Kontingent für Datenspeicher 500 pro Projekt. Wenn Sie weitere Datenspeicher benötigen, verwenden Sie neue Projekte.
Jede Entität in einem Datenspeicher wird als Datenspeicherinstanz gezählt und trägt daher zu diesem Kontingent bei. Ein Datenspeicher mit drei Entitäten wird beispielsweise als drei Datenspeicher auf Ihr Kontingent angerechnet.
2 Aus technischen Gründen beträgt das maximale Kontingent für Engines 500 pro Projekt. Wenn Sie mehr Engines benötigen, verwenden Sie neue Projekte.
Ratenkontingente
Für Discovery Engine API-Anfragen gelten die folgenden Kontingente.
| Kontingent | Wert |
|---|---|
| Abgeschlossene Anfragen pro Minute und Projekt | 300 |
| Regionale Suchanfragen pro Minute und Projekt pro Standort (global, USA, EU) | 300 |