In diesem Dokument sind die Kontingente und Systemlimits für Gemini für Google Cloudaufgeführt.
- Kontingente haben Standardwerte, aber Sie können in der Regel Anpassungen anfordern.
- Systemlimits sind feste Werte, die nicht geändert werden können.
Google Cloud nutzt Kontingente, um für Fairness zu sorgen und Spitzen bei der Ressourcennutzung und ‑verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einerGoogle Cloud Ressource Ihr Google Cloud Projekt nutzen kann. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt nebenläufig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community derGoogle Cloud Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud Ressourcen.
Das Cloud-Kontingentsystem tut Folgendes:
- Es überwacht Ihren Verbrauch von Google Cloud Produkten und Diensten.
- Es schränkt Ihren Verbrauch dieser Ressourcen ein.
- Es bietet eine Möglichkeit, Änderungen am Kontingentwert zu beantragen und Kontingentanpassungen zu automatisieren.
Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie auszuführen versuchen, schlägt dann fehl.
Kontingente gelten in der Regel auf Google Cloud Projektebene. Die Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf das verfügbare Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.
Weitere Informationen finden Sie unter Cloud-Kontingente – Übersicht.
Für Gemini-Ressourcen gelten außerdem Systemlimits. Systemlimits können nicht geändert werden.
Anfragen pro Sekunde
Für Gemini for Google Cloud werden Kontingente für jeden Nutzer in einem Projekt für Anfragen pro Sekunde erzwungen.
| Kontingent | Wert |
|---|---|
| Anfragen pro Sekunde | 2 |
Anfragen pro Tag
Bei Gemini for Google Cloud werden Kontingente für die Gesamtzahl der Anfragen pro Tag für jeden Nutzer in einem Projekt erzwungen.
| Kontingent | Wert |
|---|---|
| Anfragen pro Tag für Gemini Code Assist- oder Gemini in BigQuery-Codeanfragen, z. B. Codegenerierung und Codevervollständigung. | 6000 |
| Anfragen pro Tag für Chat, Visualisierung, Tabellenscans für Datenstatistiken, Metadatengenerierung, Datenaufbereitung und andere Anfragen, für die Antworten in der Google Cloud Console im Cloud Assist-Bereich und in IDEs angezeigt werden. | 960 |
Kontingente für Gemini Code Assist
Für bestimmte Funktionen von Gemini Code Assist gelten Kontingente.
| Kontingent | Wert |
|---|---|
| Einbeziehung der lokalen Codebasis | Kontextfenster mit 1.000.000 Tokens |
| Repositories für die Codeanpassung | 20.000 |
Kontingente für den KI-Agentenmodus und die Gemini CLI
Kontingente für Anfragen des Gemini Code Assist-KI-Agentenmodus und der Gemini CLI werden kombiniert. Im KI-Agentenmodus oder bei Verwendung der Gemini CLI kann ein Prompt zu mehreren Modellanfragen führen. Anfragen sind pro Nutzer und Minute begrenzt und unterliegen der Verfügbarkeit des Dienstes bei hoher Nachfrage. Diese täglichen Anfragebeschränkungen werden für alle Interaktionen mit einer Modellversion oder ‑familie (z. B. Pro, Flash) zusammengefasst, die mit der Gemini CLI oder dem KI-Agentenmodus verwendet werden. Sobald die maximale Anzahl von Anfragen pro Tag erreicht ist, können bis zum Zurücksetzen des Kontingents keine weiteren Anfragen über diese Schnittstellen an ein beliebiges Modell gesendet werden.
| Kontingent | Gemini Code Assist-Version | Wert |
|---|---|---|
| Maximale Anzahl von Anfragen pro Nutzer und Tag | Standard | 1500 |
| Enterprise | 2000 |
Kontingente für Gemini Code Assist in GitHub
Die Nutzung von Gemini Code Assist in GitHub wird nicht auf die allgemeinen Kontingente für Gemini Code Assist angerechnet.
Bei einer Installation der Gemini Code Assist in GitHub App für Privatnutzer gilt ein Kontingent von 33 Pull-Anfrage-Prüfungen pro Tag.
Eine Installation der Unternehmensversion von Gemini Code Assist in der GitHub-App (Vorabversion) hat ein Kontingent von mindestens 100 Pull-Anfrage-Prüfungen pro Tag.
- Die genaue Anzahl der Pull-Anfrage-Prüfungen hängt von der Codebasis und der Anzahl der Modellaufrufe ab, die für die einzelnen Code Reviews erforderlich sind. Aus diesem Grund kann das Kontingent in einigen Fällen deutlich über 100 liegen.
Die Kontingente für Gemini Code Assist in GitHub werden entsprechend den Kontingenten für Google Cloud zurückgesetzt.
Kontingenterhöhung anfordern
Verwenden Sie die Google Cloud Console, um die meisten Kontingente anzupassen. Weitere Informationen finden Sie unter Kontingentanpassung anfordern.