Kontingente und Limits

In diesem Dokument sind die Kontingente und Systemlimits für Gemini für Google Cloudaufgeführt.

  • Kontingente haben Standardwerte, aber Sie können in der Regel Anpassungen anfordern.
  • Systemlimits sind feste Werte, die nicht geändert werden können.

Google Cloud nutzt Kontingente, um für Fairness zu sorgen und Spitzen bei der Ressourcennutzung und ‑verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einerGoogle Cloud Ressource Ihr Google Cloud Projekt nutzen kann. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt nebenläufig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community derGoogle Cloud Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud Ressourcen.

Das Cloud-Kontingentsystem tut Folgendes:

Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie auszuführen versuchen, schlägt dann fehl.

Kontingente gelten in der Regel auf Google Cloud Projektebene. Die Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf das verfügbare Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.

Weitere Informationen finden Sie unter Cloud-Kontingente – Übersicht.

Für Gemini-Ressourcen gelten außerdem Systemlimits. Systemlimits können nicht geändert werden.

Anfragen pro Sekunde

Für Gemini for Google Cloud werden Kontingente für jeden Nutzer in einem Projekt für Anfragen pro Sekunde erzwungen.

Kontingent Wert
Anfragen pro Sekunde 2

Anfragen pro Tag

Bei Gemini for Google Cloud werden Kontingente für die Gesamtzahl der Anfragen pro Tag für jeden Nutzer in einem Projekt erzwungen.

Kontingent Wert
Anfragen pro Tag für Gemini Code Assist- oder Gemini in BigQuery-Codeanfragen, z. B. Codegenerierung und Codevervollständigung. 6000
Anfragen pro Tag für Chat, Visualisierung, Tabellenscans für Datenstatistiken, Metadatengenerierung, Datenaufbereitung und andere Anfragen, für die Antworten in der Google Cloud Console im Cloud Assist-Bereich und in IDEs angezeigt werden. 960

Kontingente für Gemini Code Assist

Für bestimmte Funktionen von Gemini Code Assist gelten Kontingente.

Kontingent Wert
Einbeziehung der lokalen Codebasis Kontextfenster mit 1.000.000 Tokens
Repositories für die Codeanpassung 20.000

Kontingente für den KI-Agentenmodus und die Gemini CLI

Kontingente für Anfragen des Gemini Code Assist-KI-Agentenmodus und der Gemini CLI werden kombiniert. Im KI-Agentenmodus oder bei Verwendung der Gemini CLI kann ein Prompt zu mehreren Modellanfragen führen. Anfragen sind pro Nutzer und Minute begrenzt und unterliegen der Verfügbarkeit des Dienstes bei hoher Nachfrage. Diese täglichen Anfragebeschränkungen werden für alle Interaktionen mit einer Modellversion oder ‑familie (z. B. Pro, Flash) zusammengefasst, die mit der Gemini CLI oder dem KI-Agentenmodus verwendet werden. Sobald die maximale Anzahl von Anfragen pro Tag erreicht ist, können bis zum Zurücksetzen des Kontingents keine weiteren Anfragen über diese Schnittstellen an ein beliebiges Modell gesendet werden.

Kontingent Gemini Code Assist-Version Wert
Maximale Anzahl von Anfragen pro Nutzer und Tag Standard 1500
Enterprise 2000

Kontingente für Gemini Code Assist in GitHub

Die Nutzung von Gemini Code Assist in GitHub wird nicht auf die allgemeinen Kontingente für Gemini Code Assist angerechnet.

  • Bei einer Installation der Gemini Code Assist in GitHub App für Privatnutzer gilt ein Kontingent von 33 Pull-Anfrage-Prüfungen pro Tag.

  • Eine Installation der Unternehmensversion von Gemini Code Assist in der GitHub-App (Vorabversion) hat ein Kontingent von mindestens 100 Pull-Anfrage-Prüfungen pro Tag.

    • Die genaue Anzahl der Pull-Anfrage-Prüfungen hängt von der Codebasis und der Anzahl der Modellaufrufe ab, die für die einzelnen Code Reviews erforderlich sind. Aus diesem Grund kann das Kontingent in einigen Fällen deutlich über 100 liegen.

Die Kontingente für Gemini Code Assist in GitHub werden entsprechend den Kontingenten für Google Cloud zurückgesetzt.

Kontingenterhöhung anfordern

Verwenden Sie die Google Cloud Console, um die meisten Kontingente anzupassen. Weitere Informationen finden Sie unter Kontingentanpassung anfordern.