Kontingente

In diesem Dokument sind die für Document AI geltenden Kontingente und Limits aufgeführt.

  • Kontingente haben Standardwerte, aber Sie können in der Regel Anpassungen anfordern.
  • Systemlimits sind feste Werte, die nicht geändert werden können.

Google Cloud nutzt Kontingente, um für Fairness zu sorgen und Spitzen bei der Ressourcennutzung und ‑verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einerGoogle Cloud Ressource Ihr Google Cloud Projekt nutzen kann. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt nebenläufig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community derGoogle Cloud Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud Ressourcen.

Das Cloud-Kontingentsystem tut Folgendes:

Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie auszuführen versuchen, schlägt dann fehl.

Kontingente gelten in der Regel auf Google Cloud Projektebene. Die Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf das verfügbare Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.

Weitere Informationen finden Sie unter dem Cloud-Kontingente – Übersicht.

Informationen zum Erhöhen der verfügbaren Kapazität für Ihre Projekte finden Sie unter Anfragen zur Kapazitätsreservierung.

Online-Dienststufen

Document AI unterstützt zwei Dienststufen und die zugehörigen Kontingente für Onlineanfragen zur Verarbeitung an Prozessoren, die auf generativer KI basieren: die Dienststufen „Aktiv“ und „Beste Leistung“.

Das Kontingent der Dienststufe „Aktiv“ bietet 120 Seiten pro Minute für Basisprozessorversionen wie benutzerdefinierter Extrahierer v1.4 und v1.5 und 30 Seiten pro Minute für Basisprozessorversionen wie benutzerdefinierter Extrahierer v1.5 Pro.

Das Kontingent der Dienststufe „Beste Leistung“ bietet 120 Seiten pro Minute für Basisprozessorversionen wie benutzerdefinierter Extrahierer v1.4 und v1.5 und 60 Seiten pro Minute für Pro-Prozessorversionen wie benutzerdefinierter Extrahierer v1.5 Pro. Es wird erst verwendet, wenn das Kontingent der Dienststufe „Aktiv“ ausgeschöpft ist. Dies gilt für die Kontingente BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS (Messwert best_effort_online_process_document_pages_us) und BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU (Messwert best_effort_online_process_document_pages_eu) in der Console.

Hinweise Prozessoren auf Basis von Gemini 2.0 Flash Prozessoren auf Basis von Gemini 2.5 Flash Prozessoren auf Basis von Gemini 2.5 Pro
Prozessoren wie: Benutzerdefinierter Extrahierer v1.4 Benutzerdefinierter Extrahierer v1.5 Alle Pro-Versionen wie benutzerdefinierter Extrahierer v1.5 Pro und v1.6 Pro
Aktiv 120 120 30
Beste Leistung 120 120 60
Beste Leistung mit Anfrage zur Kontingenterhöhung 240 240 120
Aktiv auf Organisationsebene 240 240 60
Reservierte Kapazität, gekauft Verfügbar Verfügbar Nicht verfügbar

Wenn Sie mehr als die in den Kontingenten der Dienststufe „Beste Leistung“ aufgeführten Werte benötigen, können Sie eine Anfrage zur Kontingenterhöhung stellen. Wenden Sie sich dazu an das Vertriebsteam.

Informationen zum Sichern von mehr verfügbarer Kapazität bei hohem Traffic finden Sie im Abschnitt zu Anfragen zur Kapazitätsreservierung.

Für die Dienststufe „Beste Leistung“ gibt es kein Service Level Agreement.

Liste der Kontingente

Für Document AI gelten die folgenden Kontingente. Die Kontingente gelten für alle Google Cloud Console-Projekte sowie für alle Anwendungen und IP-Adressen, die dieses Projekt verwenden.

Wenn Sie mehr Anfragen verarbeiten möchten, senden Sie in der Google Cloud Console eine Document AI-Kontingent anfrage für Ihr Projekt.

Geben Sie in der Anfrage Informationen zu Ihren spezifischen Anforderungen und Ihrem Anwendungsfall an.

Basisanfragen pro Minute (RPM) Standardwert Hinweise
Anfragen pro Minute 1.800 pro Nutzer1 Kontingent in der Google Cloud Console ansehen
Aktiv, synchrone generische RPM
Onlineanfragen zur Verarbeitung pro Minute (USA) 120 pro Projekt und Prozessortyp Kontingent in der Google Cloud Console ansehen
Onlineanfragen zur Verarbeitung pro Minute (EU) 120 pro Projekt und Prozessortyp Kontingent in der Google Cloud Console ansehen
Onlineanfragen zur Verarbeitung pro Minute (einzelne Region) 6 pro Projekt und Prozessortyp Kontingent in der Google Cloud Console ansehen
Generative KI, synchrone PPM
Anzahl der Seiten für die Onlineverarbeitung von Dokumenten (USA) pro Minute und Prozessortyp und Modellversion (nur benutzerdefinierter Extrahierer v1.4 mit Gemini 2.0 Flash) 120 Seiten pro Minute2 Kontingent in der Google Cloud Console ansehen
Anzahl der Seiten für die Onlineverarbeitung von Dokumenten (EU) pro Minute und Prozessortyp und Modellversion (nur benutzerdefinierter Extrahierer v1.4 mit Gemini 2.0 Flash) 120 Seiten pro Minute2 Kontingent in der Google Cloud Console ansehen
Anzahl der Seiten für die Onlineverarbeitung von Dokumenten (USA) pro Minute und Prozessortyp und Modellversion (nur benutzerdefinierter Extrahierer v1.5 mit Gemini 2.5 Flash) 120 Seiten pro Minute2 Kontingent in der Google Cloud Console ansehen
Anzahl der Seiten für die Onlineverarbeitung von Dokumenten (EU) pro Minute und Prozessortyp und Modellversion (nur benutzerdefinierter Extrahierer v1.5 mit Gemini 2.5 Flash) 120 Seiten pro Minute2 Kontingent in der Google Cloud Console ansehen
Beste Leistung, synchrone PPM
Anzahl der Seiten für die Onlineverarbeitung von Dokumenten (USA) mit bester Leistung pro Minute und Prozessortyp und Modellversion 120 Seiten pro Minute4 Kontingent in der Google Cloud Console ansehen
Anzahl der Seiten für die Onlineverarbeitung von Dokumenten (EU) mit bester Leistung pro Minute und Prozessortyp und Modellversion 120 Seiten pro Minute4 Kontingent in der Google Cloud Console ansehen
Anzahl der Seiten für die Onlineverarbeitung von Dokumenten (einzelne Region) mit bester Leistung pro Minute und Prozessortyp und Modellversion 120 Seiten pro Minute4 Kontingent in der Google Cloud Console ansehen
Gleichzeitige Batches
Gleichzeitige Batchanfragen zur Verarbeitung pro Projekt und Region (USA) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Batchanfragen zur Verarbeitung pro Projekt und Region (EU) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Batchanfragen zur Verarbeitung pro Prozessor (einzelne Region) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitiges Training
Gleichzeitige Anfragen zum Training von Prozessorversionen (USA) 1 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen zum Training von Prozessorversionen (EU) 1 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen zum Training von Prozessorversionen (einzelne Region) 1 pro Projekt3 Kontingent in der Google Cloud Console ansehen
Bereitgestellte Prozessoren
Bereitgestellte benutzerdefinierte Prozessorversionen (USA) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Bereitgestellte benutzerdefinierte Prozessorversionen (EU) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Bereitgestellte benutzerdefinierte Prozessorversionen (einzelne Region) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Bereitgestellte Prozessoren auf Basis von generativer KI
Bereitgestellte Prozessorversionen auf Basis von generativer KI (USA) 100 pro Projekt und benutzerdefiniertem Extraktionsprozessor Kontingent in der Google Cloud Console ansehen
Bereitgestellte Prozessorversionen auf Basis von generativer KI (EU) 100 pro Projekt und benutzerdefiniertem Extraktionsprozessor Kontingent in der Google Cloud Console ansehen
Bereitgestellte Prozessorversionen auf Basis von generativer KI (einzelne Region) 100 pro Projekt und benutzerdefiniertem Extraktionsprozessor Kontingent in der Google Cloud Console ansehen
Gleichzeitiger Import
Gleichzeitige Anfragen zum Importieren von Dokumenten (USA) 3 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen zum Importieren von Dokumenten (EU) 3 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen zum Importieren von Dokumenten (einzelne Region) 3 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitiger Export
Gleichzeitige Anfragen zum Exportieren von Dokumenten (USA) 1 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen zum Exportieren von Dokumenten (EU) 1 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen zum Exportieren von Dokumenten (einzelne Region) 1 pro Projekt Kontingent in der Google Cloud Console ansehen
  1. Das Kontingent für Anfragen pro Minute gilt für die Anzahl der Dokumente, die pro Minute angefordert werden, nicht für die Anzahl der Seiten oder `batchProcess`-API-Aufrufe.
  2. Anfragen zur Kontingentanpassung werden für diese Version noch nicht unterstützt.
  3. Wird in australia-southeast1 mit einer Anfrage zur Kontingentanpassung unterstützt.
  4. Variiert je nach Gemini-Version. Weitere Informationen finden Sie unter Dienststufen. Informationen zum Stellen einer Anfrage zur Kapazitätsreservierung

Wenn Ihr Projekt mehr Kapazität benötigt, lesen Sie den Abschnitt Kapazitäts reservierung.