Erweiterte BigQuery-Laufzeit verwenden
Die erweiterte BigQuery-Laufzeit umfasst eine Reihe von Leistungsverbesserungen, die darauf ausgelegt sind, Analysearbeitslasten automatisch zu beschleunigen, ohne dass Nutzeraktionen oder Codeänderungen erforderlich sind. In diesem Dokument werden diese Leistungsverbesserungen beschrieben, darunter die verbesserte Vektorisierung und Optimierungen für kurze Anfragen.
Rollen und Berechtigungen
Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle BigQuery-Administrator (roles/bigquery.admin
) für Ihr Projekt oder Ihre Organisation zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Angeben einer Konfigurationseinstellung benötigen.
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.
Verbesserte Vektorisierung
Die vektorisierte Ausführung ist ein Modell zur Verarbeitung von Abfragen, bei dem Spalten von Daten in Blöcken verarbeitet werden, die mit der CPU-Cachegröße übereinstimmen. Außerdem werden SIMD-Befehle (Single Instruction, Multiple Data) verwendet. Die erweiterte Vektorisierung erweitert die vektorisierte Abfrageausführung in BigQuery auf die folgenden Aspekte der Abfrageverarbeitung:
- Durch die Verwendung spezieller Datenkodierungen im Capacitor-Speicherformat können Filterauswertungsvorgänge für die codierten Daten ausgeführt werden.
- Spezialisierte Codierungen werden im Abfrageplan weitergegeben, sodass mehr Daten verarbeitet werden können, während sie noch codiert sind.
- Durch die Implementierung von Expression Folding zum Auswerten deterministischer Funktionen und konstanter Ausdrücke kann BigQuery komplexe Prädikate in konstante Werte vereinfachen.
Optimierungen für kurze Abfragen
BigQuery führt Abfragen in der Regel in einer verteilten Umgebung mit einer Shuffle-Zwischenschicht aus. Durch die Optimierung kurzer Abfragen werden dynamisch Abfragen identifiziert, die als einzelne Phase ausgeführt werden können. Dadurch werden Latenz und Slot-Verbrauch reduziert. Spezialisierte Codierungen können effektiver verwendet werden, wenn eine Abfrage in einer einzigen Phase ausgeführt wird. Diese Optimierungen sind am effektivsten, wenn sie mit dem optionalen Modus zum Erstellen von Jobs verwendet werden, der die Latenz beim Starten und Warten von Jobs sowie beim Abrufen von Ergebnissen minimiert.
Die Berechtigung für Optimierungen für kurze Abfragen ist dynamisch und wird von den folgenden Faktoren beeinflusst:
- Die voraussichtliche Größe des Datenscans.
- Die erforderliche Datenverschiebung.
- Die Selektivität von Abfragefiltern.
- Art und physisches Layout der gespeicherten Daten.
- Die allgemeine Abfragestruktur.
- Die Verlaufsstatistiken der bisherigen Abfrageausführungen.
Erweiterte Laufzeit aktivieren
Zwischen dem 15. September 2025 und Anfang 2026 wird die erweiterte Laufzeit zur Standardlaufzeit für alle Projekte in BigQuery. Wenn Sie die erweiterte Laufzeit jetzt in einem vorhandenen Projekt oder einer vorhandenen Organisation aktivieren möchten, verwenden Sie die Anweisung ALTER PROJECT
oder ALTER ORGANIZATION
, um die Standardkonfiguration zu ändern. Legen Sie in der Anweisung das Argument query_runtime
auf 'advanced'
fest. Beispiel:
ALTER PROJECTPROJECT_NAME
SET OPTIONS ( `region-LOCATION
.query_runtime` = 'advanced' );
Ersetzen Sie Folgendes:
PROJECT_NAME
ist der Name des Projekts.LOCATION
: Der Standort des Projekts.
Es kann einige Minuten dauern, bis die Änderung wirksam wird.
Nachdem Sie die erweiterte Laufzeit aktiviert haben, verwenden entsprechende Abfragen im Projekt oder in der Organisation die erweiterte Laufzeit, unabhängig davon, welcher Nutzer den Abfragejob erstellt hat.