Informationen zu Slots

Ein BigQuery-Slot ist eine virtuelle Recheneinheit, die von BigQuery zum Ausführen von SQL-Abfragen, Python-Code oder anderen Jobtypen verwendet wird. Während der Ausführung einer Abfrage ermittelt BigQuery automatisch, wie viele Slots von der Abfrage verwendet werden. Die Anzahl der verwendeten Slots hängt von der Menge der verarbeiteten Daten, der Komplexität der Abfrage und der Anzahl der verfügbaren Slots ab. Im Allgemeinen können Sie durch den Zugriff auf mehr Slots mehr gleichzeitige Abfragen ausführen und komplexe Abfragen schneller ausführen.

On-Demand- und kapazitätsbasierte Preise

Für alle Abfragen werden Slots verwendet. Sie haben jedoch zwei Optionen für die Abrechnung der Nutzung: das On-Demand-Preismodell oder das kapazitätsbasierte Preismodell.

Standardmäßig erfolgt die Abrechnung nach dem On-Demand-Modell. Bei diesem Modell wird Ihnen die Datenmenge in Rechnung gestellt, die bei jeder Abfrage verarbeitet wird (gemessen in TiB). Projekte, die das On-Demand-Modell verwenden, unterliegen Slot-Limits pro Projekt und Organisation mit vorübergehender Burst-Funktion. Die meisten Nutzer des On-Demand-Modells finden die Slotkapazitätslimits mehr als ausreichend. Abhängig von Ihrer Arbeitslast kann der Zugriff auf mehr Slots jedoch die Abfrageleistung verbessern. Informationen zum Prüfen der Slot-Nutzung Ihres Kontos finden Sie unter Zustand, Ressourcennutzung und Jobs überwachen.

Beim kapazitätsbasierten Modell bezahlen Sie für die Slotkapazität, die Ihren Abfragen im Laufe der Zeit zugewiesen wird. Dieses Modell ermöglicht Ihnen die explizite Kontrolle über die gesamte Slotkapazität. Sie wählen die Anzahl der zu verwendenden Slots explizit über eine Reservierung aus. Sie können die Anzahl der Slots in einer Reservierung als Referenzmenge angeben, die immer zugewiesen wird, oder als automatisch skalierte Menge, die bei Bedarf zugewiesen wird. Reservierungen mit Autoscaling-Slots skalieren ihre Kapazität entsprechend den Arbeitslastanforderungen. BigQuery weist Slots zu, wenn sich Arbeitslasten ändern. So können Sie die Anzahl der Slots in einer Reservierung basierend auf der Leistung oder der kritischen Natur der Arbeitslast konfigurieren, für die die Reservierung verwendet wird.

Abfrage mit Slots ausführen

Bei der Ausführung eines Abfragejobs in BigQuery wird die SQL-Anweisung in einen Ausführungsplan umgewandelt, der aus einer Reihe von Abfragephasen besteht. Phasen bestehen wiederum aus einer Reihe von Ausführungsschritten. BigQuery nutzt eine verteilte parallele Architektur zum Ausführen von Abfragen. In den Phasen werden die Arbeitseinheiten modelliert, die parallel ausgeführt werden können. Daten werden zwischen den Phasen über eine verteilte Shuffle-Architektur übergeben. Diese wird in diesem Google Cloud -Blogpost ausführlicher beschrieben.

Das Ausführen von Abfragen erfolgt in BigQuery dynamisch. Ein Abfrageplan kann während der Verarbeitung der Abfrage geändert werden. Die Arbeitsverteilung kann für die Datenverteilung optimiert werden, wenn Phasen hinzugefügt werden. Außerdem kann sich die Kapazität für die Ausführung einer Abfrage ändern, wenn andere Abfragen gestartet oder beendet werden oder wenn der Autoscaler einer Reservierung Slots hinzufügt.

BigQuery kann mehrere Phasen gleichzeitig ausführen, eine spekulative Ausführung nutzen, um eine Abfrage zu beschleunigen, und eine Phase dynamisch neu partitionieren, um eine optimale Parallelisierung zu erzielen.

Slotressourcen

Wenn eine Abfrage mehr Slots benötigt als verfügbar sind, stellt BigQuery einzelne Arbeitseinheiten in die Warteschlange und wartet auf verfügbare Slots. Während der Ausführung der Abfragen werden diese zurückgestellten Arbeitseinheiten dynamisch für die Ausführung ausgewählt.

BigQuery kann für eine bestimmte Phase einer Abfrage eine beliebige Anzahl an Slots anfordern. Die Anzahl der angeforderten Slots hat nichts mit der Kapazität zu tun, die Sie erwerben, sondern weist eher auf den optimalen Parallelisierungsfaktor hin, den BigQuery für diese Phase ausgewählt hat. Arbeitseinheiten werden in die Warteschlange aufgenommen und ausgeführt, sobald Slots verfügbar werden.

Überschreiten Abfrageanforderungen die von Ihnen erworbenen Slots, werden Ihnen keine zusätzlichen Slots in Rechnung gestellt und Ihnen wird kein zusätzlicher On-Demand-Preis berechnet. Stattdessen werden Ihre Arbeitseinheiten in die Warteschlange verschoben.

Beispiel:

In einer Abfragephase werden 2.000 Slots angefordert, es sind jedoch nur 1.000 verfügbar.
BigQuery nutzt alle 1.000 Slots, während die verbleibenden Arbeitseinheiten in der Warteschlange auf die übrigen 1.000 Slots warten.
Ist die Arbeit von 100 Slots abgeschlossen, werden diese dynamisch an 100 Arbeitseinheiten von den 1.000 Arbeitseinheiten in der Warteschlange vergeben. 900 Arbeitseinheiten verbleiben in der Warteschlange.
Ist danach die Arbeit von 500 weiteren Slots erledigt, werden 500 Arbeitseinheiten dieser 900 Arbeitseinheiten dynamisch aus der Warteschlange genommen. 400 Arbeitseinheiten verbleiben in der Warteschlange.

BigQuery-Slots werden in die Warteschlange gestellt, wenn der Bedarf die Verfügbarkeit übersteigt. — BigQuery-Slots in der Warteschlange – der Bedarf übersteigt die Verfügbarkeit

Wenn für die Arbeitslast mehr Slots erforderlich sind, als für die Reservierung verfügbar sind, kann sich die Laufzeit des Jobs verlängern, da die Jobs darauf warten, dass Slots verfügbar werden. Dies wird als Slot-Konflikt bezeichnet. Slot-Konflikte können zunehmen, wenn die Nachfrage nach Arbeitslasten viel höher ist als die für die Reservierung verfügbaren Slots.

Kapazitätspriorisierung

Wenn in einer bestimmten Region eine hohe Nachfrage nach Slotressourcen besteht, wird die Ressourcenkonkurrenz durch Priorisierung der Kapazität verwaltet. Durch diese Priorisierung wird sichergestellt, dass Kunden mit Kapazitätsmodellen der höheren Stufe weniger betroffen sind. Das System priorisiert die Kapazität in der folgenden Reihenfolge:

Baselines und zugesicherte Kapazität für Enterprise Plus und Enterprise.
Automatisch skalierte Kapazität von Enterprise Plus.
Autoscaling-Kapazität der Enterprise-Version.
Standardversion und On-Demand-Kapazität

Bei Engpässen in einer Region kommt es bei Anfragen für die Standard Edition und On-Demand-Kapazität eher zu Verzögerungen beim Zugriff, da das System Ressourcen zuerst für höherwertige Editionen zuweist.

Faire Planung in BigQuery

BigQuery weist die Slotkapazität innerhalb einer einzelnen Reservierung mithilfe eines Algorithmus namens faire Planung zu.

Der BigQuery-Planer erzwingt die gleichmäßige Aufteilung von Slots zwischen Projekten mit in Ausführung befindlichen Abfragen innerhalb einer Reservierung und anschließend zwischen Jobs eines bestimmten Projekts. Der Planer sorgt für eine finale Gleichmäßigkeit. Während kurzer Zeit können einige Jobs einen unverhältnismäßig hohen Anteil an Slots erhalten, aber der Planer korrigiert dies schließlich. Das Ziel des Planers besteht darin, ein Gleichgewicht zwischen aggressiven Beenden von laufenden Aufgaben (was zu einer Verschwendung von Slot-Zeit führt) und zu viel Nachsicht (was dazu führt, dass Jobs mit lang andauernden Aufgaben einen unverhältnismäßig hohen Anteil an Slot-Zeit erhalten) zu finden.

Die faire Planung sorgt dafür, dass jede Abfrage jederzeit Zugriff auf alle verfügbaren Slots hat und dass die Kapazität dynamisch und automatisch zwischen den aktiven Abfragen neu zugewiesen wird, wenn sich die Kapazitätsanforderungen der Abfragen ändern. Unter den folgenden Bedingungen werden Abfragen abgeschlossen und neue Abfragen zur Ausführung gesendet:

Wenn eine neue Abfrage gesendet worden ist, wird die Kapazität automatisch neu an die ausgeführten Abfragen zugewiesen. Einzelne Arbeitseinheiten können unterbrochen, fortgesetzt und in die Warteschlange aufgenommen werden, je nachdem, wie viel Kapazität für die einzelnen Abfragen zur Verfügung steht.
Sobald eine Abfrage abgeschlossen worden ist, wird die von dieser Abfrage genutzte Kapazität für alle anderen Abfragen verfügbar.
Wenn sich die Kapazitätsanforderungen einer Abfrage aufgrund von Änderungen im dynamischen DAG der Abfrage ändern, bewertet BigQuery die Kapazitätsverfügbarkeit für diese und alle anderen Abfragen automatisch neu. Wenn nötig, werden Slots neu zugewiesen oder unterbrochen.

Faire Planung von BigQuery-Slots zwischen mehreren Abfragen. — Faire Planung in BigQuery

Je nach Komplexität und Größe benötigt eine Abfrage eventuell nicht alle Slots, die ihr zustehen, oder sie benötigt mehr. BigQuery stellt unter Beachtung der fairen Planung dynamisch sicher, dass alle Slots jederzeit voll genutzt werden können.

Wenn ein wichtiger Job durchgängig mehr Slots benötigt, als der Planer ihm bereitstellt, sollten Sie eventuell eine zusätzliche Reservierung mit der erforderlichen Anzahl von Slots erstellen und den Job der Reservierung zuweisen.

Angenommen, Sie haben die folgende Reservierungskonfiguration:

Reservierung A mit 1.000 Referenz-Slots ohne Autoscaling
Projekt A und Projekt B, die Ihrer Reservierung zugewiesen sind

Szenario 1: Im Projekt A führen Sie die Abfrage A (eine gleichzeitige Abfrage) aus, die eine hohe Slot-Auslastung erfordert. Im Projekt B führen Sie 20 gleichzeitige Abfragen aus. Obwohl insgesamt 21 Abfragen die Reservierung A verwenden, sieht die Slot-Verteilung so aus:

Projekt A erhält 500 Slots und die Abfrage A wird mit 500 Slots ausgeführt.
Projekt B erhält 500 Slots, die auf die 20 Abfragen aufgeteilt werden.

Szenario 2: In Projekt A führen Sie die Abfrage A (eine gleichzeitige Abfrage) aus, für die 100 Slots erforderlich sind. In Projekt B führen Sie 20 gleichzeitige Abfragen aus. Da für die Abfrage A nicht 50% der Reservierung erforderlich sind, sieht die Verteilung der Slots so aus:

Projekt A erhält 100 Slots und die Abfrage A wird mit 100 Slots ausgeführt.
Projekt B erhält 900 Slots, die auf die 20 Abfragen aufgeteilt werden.

Betrachten Sie im Gegensatz dazu die folgende Reservierungskonfiguration:

Reservierung B mit 1.000 Referenz-Slots ohne Autoscaling.
10 Projekte, die alle der Reservierung B zugewiesen sind.

Angenommen, in den 10 Projekten werden Abfragen mit ausreichendem Slotbedarf ausgeführt. Dann erhält jedes Projekt 1/10 der gesamten Reservierungsslots (also 100 Slots), unabhängig davon, wie viele Abfragen in den einzelnen Projekten ausgeführt werden.

Kontingente und Limits für Slots

Slot-Kontingente und -Limits schützen BigQuery. Bei den verschiedenen Preismodellen werden unterschiedliche Slot-Kontingenttypen verwendet:

On-Demand-Preismodell: Sie unterliegen einem Pro-Projekt- und Organisations-Slot-Limit mit vorübergehender Burst-Funktion. Abhängig von Ihren Arbeitslasten kann der Zugriff auf mehr Slots die Abfrageleistung verbessern.
Kapazitätsbasiertes Preismodell: Reservierungskontingente und -limits definieren die maximale Anzahl von Slots, die Sie allen Reservierungen an einem Standort zuweisen können. Wenn Sie Autoscaling verwenden, darf die Summe Ihrer maximalen Reservierungsgrößen dieses Limit nicht überschreiten. Ihnen werden nur die Reservierungen und Zusicherungen in Rechnung gestellt, nicht die Kontingente. Informationen zum Erhöhen des Slot-Kontingents finden Sie unter Kontingenterhöhung anfordern.

Informationen darüber, wie viele Slots Sie nutzen, finden Sie unter BigQuery-Monitoring.

Inaktive Slots

Es kann jederzeit vorkommen, dass einige Slots inaktiv sind. Beispiel:

Slotzusicherungen, die keiner Reservierungsreferenz zugewiesen sind.
Slots, die einer Reservierungsreferenz zugewiesen sind, aber nicht verwendet werden.

Bei Verwendung des On-Demand-Preismodells sind keine Leerlauf-Slots verfügbar.

Standardmäßig verwenden Abfragen, die in einer Reservierung ausgeführt werden, inaktive Slots aus anderen Reservierungen innerhalb derselben Region und desselben Administrationsprojekts automatisch. BigQuery weist einer zugewiesenen Reservierung sofort freie Slots zu, wenn sie benötigt werden. Inaktive Slots, die von einer anderen Reservierung verwendet wurden, werden schnell aufgelöst, wenn sie von der ursprünglichen Reservierung benötigt werden. Es kann vorkommen, dass die Gesamtzahl der verwendeten Slots für kurze Zeit das für alle Reservierungen angegebene Maximum überschreitet. Diese zusätzliche Slotnutzung wird Ihnen jedoch nicht in Rechnung gestellt.

Angenommen, Sie haben folgende Reservierungseinstellungen:

project_a ist reservation_a zugewiesen, das 500 Referenz-Slots ohne Autoscaling hat.
project_b ist reservation_b zugewiesen, das 100 Referenz-Slots ohne Autoscaling hat.
Beide Reservierungen befinden sich in derselben Region und im selben Verwaltungsprojekt und es sind keine anderen Projekte zugewiesen.

Sie führen query_b in project_b aus. Wenn in project_a keine Abfrage ausgeführt wird, hat query_b Zugriff auf die 500 inaktiven Slots von reservation_a. Solange query_b noch ausgeführt wird, können bis zu 600 Slots belegt werden: 100 Referenz-Slots plus 500 inaktive Slots.

Angenommen, Sie führen während der Ausführung von query_b query_a in project_a aus, das 500 Slots nutzen kann.

Da Sie 500 Referenz-Slots für project_a reserviert haben, wird query_a sofort gestartet und erhält 500 Slots.
Die Anzahl der query_b zugewiesenen Slots sinkt schnell auf 100 Referenz-Slots.
Zusätzliche Abfragen, die in project_b ausgeführt werden, teilen sich diese 100 Slots. Wenn für nachfolgende Abfragen nicht genügend Slots verfügbar sind, werden sie in die Warteschlange gestellt, bis die derzeit ausgeführten Abfragen abgeschlossen sind und Slots frei werden.

Wenn project_b in diesem Beispiel einer Reservierung ohne Baseline-Slots oder Autoscaling zugewiesen wurde, hat query_b nach dem Start von query_a keine Slots mehr. BigQuery würde query_b pausieren, bis inaktive Slots verfügbar sind oder die Abfrage abläuft. Zusätzliche Abfragen in project_b werden in die Warteschlange gestellt, bis inaktive Slots verfügbar sind.

Damit eine Reservierung nur die bereitgestellten Slots verwendet, setzen Sie ignore_idle_slots auf true. Wenn ignore_idle_slots für Reservierungen auf true gesetzt ist, können diese ihre inaktiven Slots jedoch für andere Reservierungen freigeben.

Inaktive Slots können nicht zwischen Reservierungen verschiedener Versionen geteilt werden. Sie können nur die Referenzslots oder die zugesicherten Slots freigeben. Automatisch skalierte Slots sind möglicherweise vorübergehend verfügbar, können aber nicht als inaktive Slots für andere Reservierungen freigegeben werden, da sie herunterskaliert werden können.

Solange ignore_idle_slots "false" ist, kann eine Reservierung mit der Slot-Anzahl 0 trotzdem auf ungenutzte Slots zugreifen. Wenn Sie nur die default-Reservierung verwenden, deaktivieren Sie ignore_idle_slots als Best Practice. Sie können dieser Reservierung dann ein Projekt oder einen Ordner zuweisen, der nur inaktive Slots verwendet.

Aufgaben vom Typ ML_EXTERNAL bilden eine Ausnahme, da Slots, die von externen BigQuery ML-Modellerstellungsjobs verwendet werden, nicht auf Abruf sind. Die Slots in einer Reservierung mit den Zuweisungstypen ML_EXTERNAL und QUERY sind nur für andere Abfragejobs verfügbar, wenn die Slots nicht von den ML_EXTERNAL-Jobs belegt werden. Darüber hinaus können diese Jobs keine inaktiven Slots aus anderen Reservierungen verwenden.

Reservierungsbasierte Fairness

Bei der reservierungsbasierten Fairness priorisiert BigQuery inaktive Slots und weist sie gleichmäßig allen Reservierungen im selben Administrationsprojekt zu, unabhängig von der Anzahl der Projekte, in denen Jobs in den einzelnen Reservierungen ausgeführt werden. Jede Reservierung erhält einen ähnlichen Anteil der verfügbaren Kapazität im Pool mit inaktiven Slots. Die Slots werden dann gleichmäßig auf die Projekte der Reservierung verteilt. Diese Funktion wird nur in den Enterprise- oder Enterprise Plus-Versionen unterstützt.

Das folgende Diagramm zeigt, wie inaktive Slots ohne aktivierte reservierungsbasierte Fairness verteilt werden:

Inaktive Slots werden projektübergreifend freigegeben.

In diesem Diagramm werden inaktive Slots gleichmäßig auf die Projekte verteilt.

Wenn die reservierungsbasierte Fairness nicht aktiviert ist, werden die verfügbaren inaktiven Slots gleichmäßig auf die Projekte in den Reservierungen verteilt.

Das folgende Diagramm zeigt, wie inaktive Slots verteilt werden, wenn die reservierungsbasierte Fairness aktiviert ist:

Inaktive Slots werden für alle Reservierungen freigegeben.

In diesem Diagramm werden inaktive Slots gleichmäßig auf Reservierungen, nicht auf Projekte aufgeteilt.

Wenn die reservierungsbasierte Fairness aktiviert ist, werden die verfügbaren inaktiven Slots gleichmäßig auf die Reservierungen verteilt.

Wenn Sie die reservierungsbasierte Fairness aktivieren, sollten Sie Ihren Ressourcenverbrauch im Blick behalten, um die Verfügbarkeit von Slots und die Abfrageleistung zu optimieren.

Verlassen Sie sich bei Produktionsarbeitslasten mit strengen Zeitvorgaben nicht ausschließlich auf inaktive Slots. Für diese Jobs müssen Baseline- oder Autoscaling-Slots verwendet werden. Wir empfehlen, inaktive Slots für Jobs mit niedrigerer Priorität zu verwenden, da die Slots jederzeit unterbrochen werden können.

Slot-Autoscaling

Im folgenden Abschnitt wird das Autoscaling von Slots und die Verwendung von Reservierungen beschrieben.

Autoscaling-Reservierungen verwenden

Sie müssen keine Slot-Zusicherungen erwerben, bevor Sie Autoscaling-Reservierungen erstellen. Slot-Zusicherungen bieten einen ermäßigten Preis für konsistent verwendete Slots, sind aber bei Autoscaling-Reservierungen optional. Zum Erstellen einer Autoscaling-Reservierung weisen Sie einer Reservierung eine maximale Anzahl von Slots (die maximale Reservierungsgröße) zu. Sie können die maximale Anzahl von Autoscaling-Slots ermitteln. Dazu ziehen Sie die maximale Reservierungsgröße von allen optionalen Referenz-Slots ab, die der Reservierung zugewiesen sind.

Beachten Sie beim Erstellen von Autoscaling-Reservierungen Folgendes:

BigQuery skaliert Reservierungen nahezu sofort, bis die Anzahl der Slots erreicht ist, die zum Ausführen der Jobs erforderlich sind, oder die maximale Anzahl an für die Reservierung verfügbaren Slots erreicht ist. Slots werden immer automatisch auf ein Vielfaches von 50 skaliert.
Die Skalierung nach oben basiert auf der tatsächlichen Nutzung und wird auf die nächste 50-Slot-Schrittweite aufgerundet.
Ihre automatisch skalierten Slots werden bei der vertikalen Skalierung zum Preis für die Kapazitätsberechnung für Ihre Version abgerechnet. Ihnen wird die Anzahl der skalierten Slots in Rechnung gestellt, nicht die Anzahl der verwendeten Slots. Diese Gebühr gilt auch dann, wenn der Job, der BigQuery hochskaliert, fehlschlägt. Verwenden Sie daher nicht das Informationsschema für Jobs, um die Abrechnung abzugleichen. Stattdessen finden Sie Informationen unter Autoscaling mit Informationsschema überwachen.
Die Skalierung der Anzahl der Slots erfolgt zwar immer in Schritten von 50, es können aber auch mehr als 50 Slots in einem Schritt skaliert werden. Wenn Ihre Arbeitslast beispielsweise zusätzliche 450 Slots benötigt, kann BigQuery versuchen, gleichzeitig um 450 Slots zu skalieren, um die Kapazitätsanforderungen zu erfüllen.
BigQuery skaliert herunter, wenn die mit der Reservierung verknüpften Jobs die Kapazität nicht mehr benötigen. Dies gilt für ein Minimum von einer Minute.

Die automatisch skalierte Kapazität wird mindestens 60 Sekunden lang beibehalten. Dieser Zeitraum von 60 Sekunden wird als Herunterskalierungsfenster bezeichnet. Bei einem neuen Kapazitätsspitzen wird das Fenster für die Kapazitätsminderung zurückgesetzt und die gesamte Kapazitätsstufe wird als neuer Zuschuss behandelt. Wenn jedoch seit der letzten Kapazitätssteigerung mindestens 60 Sekunden vergangen sind und die Nachfrage sinkt, reduziert das System die Kapazität, ohne das Fenster für das Herunterskalieren zurückzusetzen. So sind aufeinanderfolgende Herunterskalierungen ohne Verzögerung möglich.

Wenn Ihre anfängliche Arbeitslastkapazität beispielsweise auf 100 Slots skaliert wird, wird der Spitzenwert mindestens 60 Sekunden lang beibehalten. Wenn Ihre Arbeitslast während dieses Zeitraums auf einen neuen Höchstwert von 200 Slots skaliert wird, beginnt ein neuer Zeitraum von 60 Sekunden für das Herunterskalieren. Wenn es während dieses Zeitraums keine neue Spitze gibt, wird die Arbeitslast nach 60 Sekunden herunterskaliert.

Betrachten Sie das folgende detaillierte Beispiel: Um 12:00:00 Uhr wird Ihre anfängliche Kapazität auf 100 Slots skaliert und die Nutzung dauert eine Sekunde. Dieser Spitzenwert wird ab 12:00:00 Uhr mindestens 60 Sekunden lang beibehalten. Nach Ablauf der 60 Sekunden (um 12:01:01 Uhr) skaliert BigQuery die Anzahl der Slots auf 50, wenn die neue Nutzung 50 Slots beträgt. Wenn die neue Nutzung um 12:01:02 Uhr 0 Slots beträgt, wird BigQuery sofort wieder auf 0 Slots herunterskaliert. Nach Ablauf des Zeitfensters für das Herunterskalieren kann BigQuery mehrmals hintereinander herunterskaliert werden, ohne dass ein neues Zeitfenster für das Herunterskalieren erforderlich ist.

Informationen zur Arbeit mit Autoscaling finden Sie unter Mit Autoscaling-Slots arbeiten.

Reservierungen mit Baseline- und Autoscaling-Slots verwenden

Zusätzlich zur maximalen Reservierungsgröße können Sie optional eine Basisanzahl von Slots pro Reservierung angeben. Die Referenz ist die Mindestanzahl an Slots, die immer der Reservierung zugewiesen werden. Diese werden Ihnen immer in Rechnung gestellt. Autoscaling-Slots werden erst hinzugefügt, wenn alle Referenz-Slots (und gegebenenfalls inaktive Slots) verbraucht wurden. Sie können inaktive Referenz-Slots in einer Reservierung für andere Reservierungen freigeben, die Kapazitäten benötigen.

Sie können die Anzahl der Referenz-Slots in einer Reservierung alle paar Minuten erhöhen. Wenn Sie die Referenz-Slots verringern möchten, ist die Anzahl auf eine Stunde begrenzt, wenn Sie die Kapazität der Referenz-Slots kürzlich geändert haben und die Referenz-Slots die zugesicherten Slots überschreiten. Andernfalls können Sie die Referenz-Slots alle paar Minuten verringern.

Referenz- und Autoscaling-Slots sollen Kapazitäten basierend auf Ihrer letzten Arbeitslast bereitstellen. Wenn Sie eine große Arbeitslast erwarten, die sich stark von Ihren Arbeitslasten in der jüngeren Vergangenheit unterscheidet, empfehlen wir, Ihre Referenzkapazität vor dem Ereignis zu erhöhen, anstatt sich auf Autoscaling-Slots zu verlassen, um die Arbeitslastkapazität abzudecken. Wenn beim Erhöhen der Grundkapazität ein Problem auftritt, wiederholen Sie die Anfrage nach 15 Minuten.

Wenn die Reservierung keine Referenz-Slots hat oder nicht so konfiguriert ist, dass inaktive Slots aus anderen Reservierungen übernommen werden, versucht BigQuery zu skalieren. Andernfalls müssen Referenz-Slots vor der Skalierung vollständig ausgelastet sein.

Reservierungen verwenden und fügen Slots in der folgenden Priorität hinzu:

Referenz-Slots:
Freigabe inaktiver Slots (falls aktiviert). Reservierungen können nur inaktive Referenz- oder zugesicherte Slots aus anderen Reservierungen teilen, die mit derselben Version und in derselben Region erstellt wurden.
Autoscaling-Slots:

Im folgenden Beispiel werden Slots von einem angegebenen Referenzbetrag skaliert. Die Reservierungen etl und dashboard haben eine Basisgröße von 700 bzw. 300 Slots.

Beispiel für Autoscaling ohne Zusicherungen.

In diesem Beispiel kann die Reservierung etl auf 1.300 Slots (700 Referenz-Slots plus 600 Autoscaling-Slots) skaliert werden. Wenn die Reservierung dashboard nicht verwendet wird, kann die Reservierung etl die 300 Slots aus der Reservierung dashboard verwenden, wenn dort kein Job ausgeführt wird, was zu einer maximalen Anzahl von 1600 möglichen Slots führt.

Die Reservierung dashboard kann auf 1.100 Slots (300 Referenz-Slots plus 800 Autoscaling-Slots) skaliert werden. Wenn die Reservierung etl vollständig inaktiv ist, kann die Reservierung dashboard auf maximal 1.800 Slots skaliert werden (300 Baseline-Slots plus 800 Autoscale-Slots plus 700 ungenutzte Slots in der etl-Reservierung).

Wenn für die etl-Reservierung mehr als 700 Referenz-Slots erforderlich sind, die immer verfügbar sind, wird versucht, Slots mit den folgenden Methoden der Reihe nach hinzuzufügen:

700 Referenz-Slots:
Inaktiver Slot mit den 300 Referenz-Slots in der dashboard-Reservierung. Ihre Reservierung teilt nur inaktive Referenz-Slots mit anderen Reservierungen, die mit derselben Version erstellt werden.
600 zusätzliche Slots auf die maximale Reservierungsgröße hochskalieren

Slot-Zusicherungen verwenden

Das folgende Beispiel zeigt das Autoscaling von Slots mit Kapazitätszusicherungen.

Autoscaling-Reservierungen mit Kapazitätszusicherungen.

Wie Reservierungs-Baselines können Sie mit Slot-Zusicherungen eine feste Anzahl an Slots zuweisen, die allen Reservierungen zur Verfügung stehen. Im Gegensatz zu Referenz-Slots kann eine Zusicherung während der Laufzeit nicht reduziert werden. Slot-Zusicherungen sind optional, können jedoch Kosten sparen, wenn Referenz-Slots für einen längeren Zeitraum erforderlich sind. Slotzusicherungen werden verwendet, um Referenzslots für Ihre Reservierungen abzudecken. Nicht verwendete Slotkapazität wird dann als inaktive Slots für andere Reservierungen freigegeben. Slotzusicherungen gelten nicht für Autoscaling-Slots. Damit Sie den Rabatt für Ihre zugesicherten Slots erhalten, müssen Ihre Zusicherungen für Slots ausreichen, um Ihre Baseline-Slots abzudecken.

In diesem Beispiel wird Ihnen ein vordefinierter Preis für die Slots für die Kapazitätszusicherung berechnet. Ihnen wird die Autoscaling-Rate für die Anzahl der Autoscaling-Slots in Rechnung gestellt, nachdem Autoscaling aktiviert ist und Reservierungen sich in einem erweiterten Status befinden. Ihnen wird die Autoscaling-Rate für die Anzahl der skalierten Slots in Rechnung gestellt, nicht die Anzahl der verwendeten Slots.

Das folgende Beispiel zeigt Reservierungen, bei denen die Anzahl der Referenzslots die Anzahl der zugesicherten Slots überschreitet.

Die Anzahl der Referenzslots überschreitet die Anzahl der zugesicherten Slots.

In diesem Beispiel gibt es insgesamt 1.000 Referenz-Slots zwischen den beiden Reservierungen, 500 aus der Reservierung etl und 500 aus der Reservierung dashboard. Die Zusicherung umfasst jedoch nur 800 Slots. In diesem Szenario werden die zusätzlichen Slots zum PAYG-Preis (Pay as you go) abgerechnet.

Maximal verfügbare Slots

Sie können die maximale Anzahl von Slots, die eine Reservierung verwenden kann, berechnen. Dazu fügen Sie die Referenz-Slots, die maximale Anzahl von Autoscaling-Slots und alle Slots in Zusicherungen hinzu, die mit der gleichen Version erstellt wurden und nicht durch die Referenz-Slots abgedeckt sind. Das Beispiel im vorherigen Image wird so eingerichtet:

Eine Kapazitätszusicherung von 1.000 Slots pro Jahr. Diese Slots werden in der Reservierung etl und der Reservierung dashboard als Referenz-Slots zugewiesen.
700 Referenz-Slots, die der Reservierung etl zugewiesen sind.
300 Referenz-Slots, die der Reservierung dashboard zugewiesen sind.
Skalieren Sie Slots von 600 für die Reservierung etl automatisch.
Skalieren Sie Slots von 800 für die Reservierung dashboard automatisch.

Für die Reservierung etl entspricht die maximal mögliche Anzahl von Slots den etl-Referenz-Slots (700) plus den Referenz-Slots dashboard (300, wenn alle Slots inaktiv sind) plus der maximalen Anzahl von Autoscale-Slots (600). Die maximale Anzahl von Slots, die die Reservierung etl in diesem Beispiel verwenden könnte, ist also 1.600. Diese Zahl überschreitet die Zahl in der Kapazitätszusicherung.

Im folgenden Beispiel überschreitet die jährliche Zusicherung die zugewiesenen Referenz-Slots.

So berechnen Sie die maximal verfügbaren Slots in einer Reservierung.

In diesem Beispiel ist:

Eine Kapazitätszusicherung von 1.600 Slots pro Jahr.
Maximale Reservierungsgröße von 1.500 (einschließlich 500 Autoscaling-Slots).
1.000 Referenz-Slots, die der Reservierung etl zugewiesen sind.

Die maximale Anzahl der für die Reservierung verfügbaren Slots entspricht den Referenz-Slots (1.000) plus der Anzahl der zugesicherten inaktiven Slots, die nicht den Referenz-Slots zugeordnet sind (1.600 Slots pro Jahr – 1.000 Referenz-Slots = 600) plus der Anzahl der Autoscaling-Slots (500). Die maximalen potenzielle Slots in dieser Reservierung beträgt also 2.100. Die automatisch skalierten Slots sind zusätzliche Slots, die über die Kapazitätszusicherung hinausgehen.

Best Practices für das Autoscaling

Legen Sie bei der erstmaligen Verwendung des Autoscalings die Anzahl der Autoscaling-Slots anhand der bisherigen und erwarteten Leistung auf einen sinnvollen Wert fest. Beobachten Sie nach dem Erstellen der Reservierung aktiv die Fehlerrate, Leistung und Rechnung und passen Sie die Anzahl der Autoscaling-Slots nach Bedarf an.
Das Autoscaling hat ein Minimum von einer Minute vor dem Herunterskalieren. Daher ist es wichtig, die maximale Anzahl von automatisch skalierten Slots festzulegen, um ein Gleichgewicht zwischen Leistung und Kosten zu schaffen. Wenn die maximale Anzahl von Autoscaling-Slots zu groß ist und Ihr Job alle Slots verwenden kann, um einen Job in Sekunden abzuschließen, fallen dennoch Kosten für die maximale Anzahl an Slots für die volle Minute an. Wenn Sie die maximale Anzahl von Slots auf die Hälfte des aktuellen Werts senken, wird Ihre Reservierung auf eine niedrigere Anzahl skaliert und der Job kann in dieser Minute mehr slot_seconds nutzen, was die Auslastung reduziert. Informationen zum Ermitteln der Slot-Anforderungen finden Sie unter Jobleistung überwachen. Eine alternative Möglichkeit zur Bestimmung Ihrer Slotanforderungen finden Sie unter Slot-Empfehlungen für Editionen ansehen.
Die Slot-Nutzung kann gelegentlich die Summe Ihrer Referenz plus der skalierten Slots überschreiten. Ihnen werden keine Slot-Nutzung in Rechnung gestellt, die über Ihrer Referenz liegt, plus die skalierten Slots.
Autoscaling ist am besten für große Arbeitslasten mit langer Laufzeit geeignet, z. B. für Arbeitslasten mit mehreren gleichzeitigen Abfragen. Vermeiden Sie das Senden einzelner Abfragen, da jede Abfrage die Reservierung skaliert, bei der sie für mindestens eine Minute skaliert wird. Wenn Sie kontinuierlich Abfragen senden, was eine konstante Arbeitslast verursacht, erhalten Sie durch Festlegen einer Referenz und Kauf einer Zusicherung eine konstante Kapazität zu einem reduzierten Preis.
BigQuery-Autoscaling unterliegt der Kapazitätsverfügbarkeit. BigQuery versucht, die Kapazitätsanforderungen der Kunden anhand der bisherigen Nutzung zu erfüllen. Wenn Sie Kapazitätsgarantien erreichen möchten, können Sie eine optionale Slot-Baseline festlegen. Dies ist die Anzahl der garantierten Slots in einer Reservierung. Mit Baselines sind Slots sofort verfügbar. Sie werden unabhängig davon von Ihnen bezahlt, ob Sie sie verwenden oder nicht. Wenden Sie sich einige Wochen im Voraus an das BigQuery-Team, damit die Kapazität für große, unorganische Anforderungen, z. B. an Feiertagen mit hohem Traffic, verfügbar ist.
Für Baseline-Slots werden immer Gebühren berechnet. Wenn eine Kapazitätszusicherung abläuft, müssen Sie möglicherweise die Anzahl der Baseline-Slots in Ihren Reservierungen manuell anpassen, um unerwünschte Gebühren zu vermeiden. Beispiel: Sie haben eine 1-jährige Zusicherung mit 100 Slots und eine Reservierung mit 100 Baseline-Slots. Die Zusicherung läuft ab und hat keinen Verlängerungstarif. Nach Ablauf der Zusicherung zahlen Sie für 100 Baseline-Slots zum Pay-As-You-Go-Preis.

Autoscaling überwachen

Informationen zum Überwachen der Slot-Nutzung und der Jobleistung mit Autoscaling finden Sie unter Autoscaling überwachen.

Übermäßige Slot-Nutzung

Wenn ein Job zu lange Slots belegt, kann er einen unverhältnismäßig hohen Anteil an Slots erhalten. Um Verzögerungen zu vermeiden, können andere Jobs in BigQuery zusätzliche Slots ausleihen, was zu Zeiträumen führt, in denen die Gesamtnutzung der Slots über der angegebenen Slotkapazität liegt. Eine übermäßige Slot-Nutzung wird nur den Jobs zugeordnet, die mehr als ihren gerechten Anteil erhalten.

Die zusätzlichen Slots werden Ihnen nicht direkt in Rechnung gestellt. Stattdessen werden Jobs weiter ausgeführt und die Slotnutzung wird nach ihrem Anteil aufgerechnet, bis die gesamte zusätzliche Nutzung durch Ihre zugewiesene Kapazität abgedeckt ist. Überschüssige Slots werden von der gemeldeten Slotnutzung ausgeschlossen, mit Ausnahme bestimmter detaillierter Ausführungsstatistiken.

Beachten Sie, dass einige Slots vorab geliehen werden können, um zukünftige Verzögerungen zu vermeiden und andere Vorteile zu bieten, z. B. eine geringere Slotspreisvariabilität und eine geringere Tail-Latenz. Die Ausleihe von Slots ist auf einen kleinen Teil Ihrer gesamten Slotkapazität beschränkt.