In diesem Dokument sind die Kontingente und Systemlimits für AI Hypercomputer aufgeführt.
- Kontingente haben Standardwerte, aber Sie können in der Regel Anpassungen anfordern.
- Systemlimits sind feste Werte, die nicht geändert werden können.
Google Cloud nutzt Kontingente, um für Fairness zu sorgen und Spitzen bei der Ressourcennutzung und ‑verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einerGoogle Cloud Ressource Ihr Google Cloud Projekt nutzen kann. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt nebenläufig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community derGoogle Cloud Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud Ressourcen.
Das Cloud-Kontingentsystem tut Folgendes:
- Es überwacht Ihren Verbrauch von Google Cloud Produkten und Diensten.
- Es schränkt Ihren Verbrauch dieser Ressourcen ein.
- Es bietet eine Möglichkeit, Änderungen am Kontingentwert zu beantragen und Kontingentanpassungen zu automatisieren.
Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie auszuführen versuchen, schlägt dann fehl.
Kontingente gelten in der Regel auf Google Cloud Projektebene. Die Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf das verfügbare Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.
Weitere Informationen finden Sie unter Cloud-Kontingente – Übersicht.
Zuteilungskontingente
Die folgenden Kontingente werden im Laufe der Zeit nicht zurückgesetzt und stattdessen freigegeben, wenn Sie die Ressource freigeben:
| Kontingent | Wert |
|---|---|
| Weiterleitungsregeln für interne Load-Balancer pro VPC-Netzwerk | 30 |
Ratenkontingente
Für AI Hypercomputer-Anfragen gelten die folgenden Kontingente:
| Kontingent | Wert |
|---|---|
| Anfragen pro Sekunde | 10 |
| Bilder pro Element und Tag | 700.000 |
| Bilder pro Element und Monat | 20.000.000 |
Systemlimits
Für AI Hypercomputer gelten die folgenden Systemlimits:
| Systemlimit | Wert |
|---|---|
| MB pro Bild | 4 MB |
| MB pro Anfrage | 8 MB |
| Bilder pro Anfrage | 16 |
Kontingentanpassung anfordern
Die meisten Kontingente können Sie in der Google Cloud Console anpassen. Weitere Informationen finden Sie unter Kontingentanpassung anfordern.