Auf dieser Seite werden einige Aspekte erläutert, die Sie bei der Konfiguration Ihrer Cloud Run-Dienste berücksichtigen sollten. Es gibt keine Universallösung für die Kostenoptimierung. Es ist wichtig, Ihre Anforderungen, Ihr Budget und Ihre Ressourcen im Blick zu behalten, um herauszufinden, was für Sie am besten funktioniert.
Die in diesem Dokument beschriebenen Best Practices gelten speziell für Cloud Run. Diese umfassen keine anderen Google Cloud Produkte.
Ressourcenkonfigurationen
Um die Kosten Ihrer Dienste zu optimieren, müssen Sie viele verschiedene Konfigurationen berücksichtigen. Passen Sie diese Konfigurationen an Ihre Anforderungen an, um zuverlässige und kosteneffiziente Dienste zu erstellen.
Die geeignete Region auswählen
Der Bereitstellungsort Ihres Dienstes wirkt sich auf die Gesamtkosten aus. Cloud Run verwendet ein zweistufiges regionales Preismodell. Regionen der Stufe 1 bieten niedrigere Kosten pro vCPU und Arbeitsspeicher als Regionen der Stufe 2. Erwägen Sie daher, die Bereitstellung in einer Region der Stufe 1 vorzunehmen.
Authentifizierung anfordern
Beim Konfigurieren eines Cloud Run-Dienstes können Sie eine der beiden Authentifizierungsoptionen auswählen:
- Öffentlichen Zugriff erlauben: Authentifizierungsprüfungen sind nicht erforderlich.
- Authentifizierung erforderlich: Nur authentifizierte Nutzer können auf Ihren Cloud Run-Dienst zugreifen.
Wir empfehlen, eine Authentifizierung zu verlangen, es sei denn, Sie haben einen bestimmten Grund, öffentlichen Zugriff zu erlauben. So werden unerwünschte Anfragen verhindert, die Kosten verursachen könnten.
Wenn Sie Nutzer mit Identity-Aware Proxy (IAP) verwalten, können für IAP eigene Kosten anfallen.
Instanzbasierte und anfragebasierte Abrechnung vergleichen
Cloud Run-Dienste haben zwei Abrechnungseinstellungen:
- Anfragebasierte Abrechnung (Standard): Sie zahlen pro Anfrage sowie einen höheren Preis pro Sekunde für vCPU und Arbeitsspeicher, die während der Anfrageverarbeitung verbraucht werden.
- Instanzbasierte Abrechnung: Ihnen wird die gesamte Lebensdauer einer Instanz in Rechnung gestellt. Es fallen keine Gebühren pro Anfrage an und die sekundengenauen Preise für vCPU und Arbeitsspeicher sind niedriger.
Für Dienste mit stabilem, langsam variierendem Traffic sollten Sie die instanzbasierte Abrechnung in Betracht ziehen. Die Einsparungen durch niedrigere Rechenraten und den Wegfall der Gebühr pro Anfrage überwiegen die Kosten für die Bezahlung der Leerlaufzeit zwischen Anfragen. Für Dienste mit sporadischem, stoßweisem oder sprunghaftem Traffic empfiehlt sich die anfragebasierte Abrechnung. Wenn Sie sich immer noch nicht sicher sind, welche Abrechnungseinstellung Sie verwenden sollen, lesen Sie den Abschnitt Recommender. Der Recommender prüft den Traffic, der von Ihrem Cloud Run-Dienst im letzten Monat empfangen wurde, und gibt Empfehlungen für die Umstellung von der anfragebasierten Abrechnung auf die instanzbasierte Abrechnung, wenn dies kostengünstiger ist.
Dienstskalierung auf Dienstebene konfigurieren
Um eine Kosten-Sicherheits-Baseline festzulegen, konfigurieren Sie die maximale Anzahl von Instanzen für Ihren Dienst. Wenn Sie eine höhere maximale Anzahl festlegen, wird die Verfügbarkeit priorisiert. Es besteht jedoch das Risiko, dass durch unerwartete Trafficspitzen oder Fehlkonfigurationen Abrechnungsprobleme entstehen. Sie sollten diese Einstellung auf Dienstebene konfigurieren, wenn Sie Ihren Dienst zum ersten Mal bereitstellen, um eine Kostenbasis zu schaffen. Weitere Tools zur Kostenkontrolle finden Sie unter Kontingente für die Ressourcenzuweisung oder Abrechnungsbudgets und ‑benachrichtigungen.
CPU- und Arbeitsspeicherauslastung optimieren
Die Kosten für Ihren Cloud Run-Dienst hängen unter anderem von der CPU-/Arbeitsspeicherkonfiguration und der Dauer ab, in der Ihr Dienst aktiv ist. Wenn Sie Ihre Ressourcen überdimensionieren, können Ihre Kosten steigen. So ermitteln Sie, welche Konfiguration für Ihren Dienst am besten geeignet ist:
- Basiskonfiguration einrichten
- Behalten Sie Ihre Messwerte im Blick, während Sie die Messwerte zur CPU- und Arbeitsspeichernutzung in Cloud Monitoring testen.
- Passen Sie die Konfiguration nach Bedarf an.
Wenn die CPU-Auslastung bei Spitzenlast konstant niedrig ist, sollten Sie die Zuweisung von vCPUs reduzieren. Wenn die Latenz hoch ist, sollten Sie die vCPU-Zuweisung erhöhen.
Wenn die Arbeitsspeichernutzung konstant niedrig ist, sollten Sie den zugewiesenen Arbeitsspeicher reduzieren. Wenn die Latenz hoch und die Arbeitsspeicherauslastung nahe 100 % ist, sollten Sie den zugewiesenen Arbeitsspeicher erhöhen. Wenn Sie OOM-Fehler („Out of Memory“) erhalten, sollten Sie den zugewiesenen Arbeitsspeicher erhöhen oder Ihre Anwendung so ändern, dass Speicherlecks vermieden werden oder weniger Arbeitsspeicher verwendet wird. Weitere Informationen zur Speichernutzung finden Sie im Cloud Monitoring-Dashboard.
GPU konfigurieren
Für alle Cloud Run-Dienste, die GPUs verwenden, muss die instanzbasierte Abrechnung konfiguriert sein. Das bedeutet, dass Cloud Run-Instanzen für den gesamten Lebenszyklus von Instanzen abgerechnet werden, auch wenn keine Anfragen eingehen. Die für GPUs erforderlichen Mindestkonfigurationen für CPU und Arbeitsspeicher wirken sich auch auf die Kosten Ihres Cloud Run-Dienstes aus. Die zonale GPU-Redundanz ist standardmäßig aktiviert. Wenn Sie die zonale GPU-Redundanz deaktivieren, sinken die Kosten pro GPU-Sekunde. Es wird jedoch keine reservierte Kapazität für Failover-Szenarien garantiert.
Netzwerkkosten optimieren
Berücksichtigen Sie bei der Konfiguration der Netzwerkoptionen für Ihren Dienst Folgendes:
- Ressourcen am selben Standort bereitstellen: Stellen Sie Ihre Cloud Run-Dienste in derselben Region wie Ihre Backend-Datenbanken (z. B. Cloud SQL oder Firestore) und Cloud Storage-Buckets bereit. Die Datenübertragung zwischen Google Cloud Ressourcen innerhalb derselben Region ist kostenlos.
- Auf Direct VPC-Traffic umstellen: Wenn Sie Traffic sicher an interne VPC-Netzwerkressourcen weiterleiten, sollten Sie von Connectors für Serverloser VPC-Zugriff auf Direct VPC-Traffic umstellen. Ausgehender Direct VPC-Traffic wird auf null skaliert. Dadurch entfallen der Rechenaufwand für die Baseline und die Leerlaufkosten, die mit Connector-Instanzen verbunden sind.
- Cloud CDN verwenden: Lagern Sie statische Assets und Inhalte, die sich gut im Cache speichern lassen, aus, indem Sie Cloud CDN vor Ihre Cloud Run-Dienste stellen. Die Bereitstellung von Daten über den Edge-Standort ist deutlich günstiger als die Zahlung für den Standard-Internetausgang direkt über Cloud Run.
- Ausgehenden Internettraffic im Blick behalten: Eingehender Traffic ist immer kostenlos. Sie erhalten 1 GiB kostenlose ausgehende Internetdatenübertragung pro Monat innerhalb von Nordamerika. Konzentrieren Sie sich beim Monitoring auf ausgehenden Traffic, der Regionsgrenzen überschreitet oder das kostenlose Kontingent übersteigt.
Gleichzeitigkeitseinstellungen konfigurieren
Wenn mehr Instanzen Anfragen verarbeiten, weist Cloud Run mehr CPU- und Arbeitsspeicherressourcen zu, was zu höheren Kosten führt. Bei einer höheren Einstellung für die Nebenläufigkeit können weniger Instanzen dasselbe Anfragevolumen verarbeiten, was die Kosten senken kann. Der Anwendungscode muss jedoch in der Lage sein, parallele Anfragen effizient zu verarbeiten. Weitere Informationen finden Sie unter Nebenläufigkeit für Autoscaling und Ressourcennutzung optimieren.
Rabatte für zugesicherte Nutzung
Rabatte für zugesicherte Nutzung (Committed Use Discounts, CUDs) sind Preisnachlässe für Nutzer, die sich verpflichten, Cloud Run für einen bestimmten Zeitraum kontinuierlich zu nutzen. CUDs gelten auf Cloud-Rechnungskontoebene. Sie können flexible Compute-CUDs für Cloud Run-Ressourcen erwerben. Flexible CUDs für Compute gelten nicht für GPUs oder das Netzwerk. Weitere Informationen finden Sie unter Flexiblen Compute-Rabatt für zugesicherte Nutzung berechnen.
Nützliche Tools
Mit den folgenden Tools können Sie Ihre Kosten besser nachvollziehen und Kostenüberschreitungen vermeiden.
Cloud Run – Übersicht: Abrechnung
Auf der Cloud Run-Übersichtsseite werden im Abrechnungsbereich die Kosten pro Ressourcenname angezeigt. Die Zahlen spiegeln die Bruttokosten für ausgewählte Zeiträume pro Ressource wider. Mit diesem Tool können Sie besser nachvollziehen, wie viel Ihre Ressourcen kosten.
Budgetbenachrichtigungen
Erstellen Sie Budgetbenachrichtigungen in Cloud Billing, um Ihre tatsächlichen Kosten mit Ihren geplanten Kosten zu vergleichen. Ein Budget ist ein Benachrichtigungsmechanismus, der Benachrichtigungen auslöst, wenn Ausgabenschwellenwerte überschritten werden. Es ist keine harte Ausgabenobergrenze. Es gibt eine Verzögerung bei den Abrechnungsdaten, die sich darauf auswirken kann, wann Sie Benachrichtigungen erhalten.
Cloud Billing
Cloud Billing ist eine Sammlung von Tools, mit denen Sie Ihre Google Cloud -Ausgaben verfolgen und nachvollziehen können. Mit diesen Tools können Sie Ihre Nutzungskosten im Blick behalten, Ausgaben prognostizieren und Einsparpotenziale identifizieren.
Kosten-Explorer
Mit dem Cost Explorer können Sie die Kosten und Nutzung Ihrer Ressourcen nachvollziehen. Mit dem Kosten-Explorer können Sie:
- Filtern Sie Ihre Ressourcen nach Kosten, um zu sehen, welche Ressourcen am teuersten sind.
- Sie können nachvollziehen, welcher Anteil der Kosten auf Konfigurationen wie vCPU, GPU und Netzwerk zurückzuführen ist.
- Sie können nachvollziehen, wie sich Änderungen an Ihrer Ressourcenkonfiguration auf Ihre monatliche Rechnung auswirken.
Google Cloud Preisrechner
Die Google Cloud Preisübersicht enthält Informationen, die Ihnen helfen, das Google Cloud Preismodell besser zu verstehen. Dort finden Sie auch die detaillierte Preisliste. Mit dem Preisrechner können Sie Ihre Kosten schätzen, indem Sie Produkte hinzufügen und konfigurieren.
Recommender
Recommender ist ein Tool, das Nutzungsempfehlungen und ‑statistiken für Cloud-Produkte bietet.
Recommender prüft automatisch den Traffic, der von Ihrem Cloud Run-Dienst im letzten Monat empfangen wurde, und empfiehlt die Umstellung von der anfragebasierten Abrechnung auf die instanzbasierte Abrechnung, wenn dies günstiger ist.Cloud Hub-Optimierung
Auf der Optimierungsseite von Cloud Hub können Sie zusammenfassende Kostendaten, Nutzungsdaten und Empfehlungen zur Kostenoptimierung für Google Cloud -Dienste ansehen.