Kontingente

In diesem Dokument sind die Kontingente und Systemlimits für Document AI aufgeführt.

  • Kontingente haben Standardwerte, aber Sie können in der Regel Anpassungen anfordern.
  • Systemlimits sind feste Werte, die nicht geändert werden können.

Google Cloud nutzt Kontingente, um für Fairness zu sorgen und Spitzen bei der Ressourcennutzung und ‑verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einerGoogle Cloud Ressource Ihr Google Cloud Projekt nutzen kann. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt nebenläufig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community derGoogle Cloud Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud Ressourcen.

Das Cloud-Kontingentsystem tut Folgendes:

Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie auszuführen versuchen, schlägt dann fehl.

Kontingente gelten in der Regel auf Google Cloud Projektebene. Die Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf das verfügbare Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.

Weitere Informationen finden Sie unter Cloud-Kontingente – Übersicht.

Informationen zum Erhöhen der verfügbaren Kapazität für Ihre Projekte finden Sie unter Anträge auf Kapazitätsreservierung.

Dienststufen

Document AI unterstützt zwei Service-Stufen und die zugehörigen Kontingente für Online-Verarbeitungsanfragen an auf generativer KI basierende Prozessorversionen: die Stufen „Bereitgestellt“ und „Best Effort“.

Das Kontingent für die bereitgestellte Stufe umfasst 120 Seiten pro Minute für Basisprozessorversionen wie Custom Extractor v1.4 und v1.5 sowie 30 Seiten pro Minute für Basisprozessorversionen wie Custom Extractor v1.5 Pro.

Das Kontingent für die Best-Effort-Stufe umfasst 120 für Basisprozessorversionen wie benutzerdefinierte Extraktoren v1.4 und v1.5 sowie 60 für Pro-Prozessorversionen wie benutzerdefinierte Extraktoren v1.5 Pro. Es wird erst verwendet, wenn das bereitgestellte Kontingent aufgebraucht ist. Dies gilt für Kontingente BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS (Messwert best_effort_online_process_document_pages_us) und BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU (Messwert best_effort_online_process_document_pages_eu) in der Console.

Hinweise Benutzerdefinierter Extrahierer v1.4 (basierend auf Gemini 2.0 Flash) Benutzerdefinierter Extraktor v1.5 (basierend auf Gemini 2.5 Flash) Benutzerdefinierter Extraktor v1.5 Pro (basierend auf Gemini 2.5 Pro)
Aktiv 120 120 30
Beste Leistung 120 120 60
Auf Organisationsebene bereitgestellt 240 240 60

Wenn Sie mehr als die in den Best-Effort-Kontingenten aufgeführten Werte benötigen, können Sie eine Anfrage zur Kontingenterhöhung stellen, indem Sie sich an das Vertriebsteam wenden.

Wenn Sie sich mehr verfügbare Kapazität bei hohem Traffic sichern möchten, lesen Sie den Abschnitt zum Stellen einer Anfrage für eine Kapazitätsreservierung.

Für die Best-Effort-Stufe gibt es kein Service Level Agreement.

Liste der Kontingente

Für Document AI gelten die folgenden Kontingente. Die Kontingente gelten für alle Google Cloud Console-Projekte sowie für alle Anwendungen und IP-Adressen, die dieses Projekt verwenden.

Wenn Sie mehr Anfragen verarbeiten möchten, senden Sie in der Google Cloud -Konsole eine Document AI-Kontingentanfrage für Ihr Projekt.

Geben Sie in der Anfrage Informationen zu Ihren spezifischen Anforderungen und Ihrem Anwendungsfall an.

Anfragekontingent Standardwert Hinweise
Anfragen pro Minute 1.800 pro Nutzer Kontingent in der Google Cloud Console ansehen
Onlineanfragen pro Minute (USA) 120 pro Projekt und Prozessortyp Kontingent in der Google Cloud Console ansehen
Onlineanfragen pro Minute (EU) 120 pro Projekt und Prozessortyp Kontingent in der Google Cloud Console ansehen
Anzahl der Seiten von Online-Dokumenten (USA) pro Minute und Prozessortyp und Modellversion (nur Custom Extractor v1.4 mit Gemini 2.0 Flash) 120 Seiten pro Minute* Kontingent in der Google Cloud Console ansehen
Anzahl der Seiten für die Onlineverarbeitung von Dokumenten (EU) pro Minute und Prozessortyp und Modellversion (nur Custom Extractor v1.4 mit Gemini 2.0 Flash) 120 Seiten pro Minute* Kontingent in der Google Cloud Console ansehen
Anzahl der Seiten von Online-Dokumenten (USA) pro Minute und Prozessortyp und Modellversion (nur Custom Extractor v1.5 mit Gemini 2.5 Flash) 120 Seiten pro Minute* Kontingent in der Google Cloud Console ansehen
Anzahl der Dokumentseiten für die Onlineverarbeitung (EU) pro Minute und Prozessortyp und Modellversion (nur Custom Extractor v1.5 mit Gemini 2.5 Flash) 120 Seiten pro Minute* Kontingent in der Google Cloud Console ansehen
Anzahl der Seiten von Dokumenten, die mit dem Online-Best-Effort-Verfahren verarbeitet werden (USA), pro Minute und Prozessortyp und ‑modellversion 120 Seiten pro Minute Kontingent in der Google Cloud Console ansehen
Anzahl der Seiten für die Onlineverarbeitung von Dokumenten (EU) pro Minute und Prozessortyp und Modellversion 120 Seiten pro Minute Kontingent in der Google Cloud Console ansehen
Anzahl der Seiten für die Onlineverarbeitung von Dokumenten (Best Effort, einzelne Region) pro Minute pro Prozessortyp und Modellversion 120 Seiten pro Minute Kontingent in der Google Cloud Console ansehen
Onlineanfragen pro Minute verarbeiten (einzelne Region) 6 pro Projekt und Prozessortyp Kontingent in der Google Cloud Console ansehen
Gleichzeitige Batchprozessanfragen pro Projekt und Region (USA) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Batchprozessanfragen pro Projekt und Region (EU) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Batchprozessanfragen pro Prozessor (einzelne Region) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen für das Training von Prozessorversionen (USA) 1 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen für das Training von Prozessorversionen (EU) 1 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Trainingsanfragen für Prozessorversionen (einzelne Region) 1 pro Projekt Kontingent in der Google Cloud Console ansehen
Bereitgestellte benutzerdefinierte Prozessorversionen (USA) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Bereitgestellte benutzerdefinierte Prozessorversionen (EU) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Bereitgestellte benutzerdefinierte Prozessorversionen (einzelne Region) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Bereitgestellte generative Prozessorversionen (USA) 100 pro Projekt und benutzerdefiniertem Extraktionsprozessor Kontingent in der Google Cloud Console ansehen
Bereitgestellte generative Prozessorversionen (EU) 100 pro Projekt und benutzerdefiniertem Extraktionsprozessor Kontingent in der Google Cloud Console ansehen
Bereitgestellte generative Prozessorversionen (Einzelregion) 100 pro Projekt und benutzerdefiniertem Extraktionsprozessor Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen für Importdokumente (USA) 3 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen zum Importieren von Dokumenten (EU) 3 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen zum Importieren von Dokumenten (einzelne Region) 3 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen für Exportdokumente (USA) 1 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen für den Export von Dokumenten (EU) 1 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen für den Export von Dokumenten (einzelne Region) 1 pro Projekt Kontingent in der Google Cloud Console ansehen

* Anfragen zur Kontingentanpassung werden für diese Version noch nicht unterstützt.

 Wird in australia-southeast1 mit einer Anfrage zur Kontingentanpassung unterstützt.

 Variiert je nach Gemini-Version. Weitere Informationen finden Sie unter Dienststufen. Kapazitätsreservierungsanfrage stellen

Wenn Ihr Projekt mehr Kapazität erfordert, lesen Sie den Abschnitt Kapazitätsreservierung.