In dieser Anleitung erfahren Sie, wie Sie die AI.FORECAST-Funktion mit dem integrierten univariaten TimesFM-Modell von BigQuery ML verwenden, um den zukünftigen Wert für eine bestimmte Spalte auf Grundlage des historischen Werts dieser Spalte zu prognostizieren.
In dieser Anleitung werden Daten aus der öffentlichen Tabelle bigquery-public-data.san_francisco_bikeshare.bikeshare_trips verwendet.
Ziele
In dieser Anleitung erfahren Sie, wie Sie die Funktion AI.FORECAST mit dem integrierten TimesFM-Modell verwenden, um Fahrten mit Leihfahrrädern vorherzusagen. In den ersten beiden Abschnitten wird beschrieben, wie Sie Ergebnisse für eine einzelne Zeitreihe prognostizieren und visualisieren. Im dritten Abschnitt wird beschrieben, wie Sie Prognosen für mehrere Zeitreihen erstellen.
Kosten
In dieser Anleitung werden kostenpflichtige Komponenten von Google Cloudverwendet, darunter:
- BigQuery
- BigQuery ML
Weitere Informationen zu den Kosten von BigQuery finden Sie auf der Seite BigQuery-Preise.
Weitere Informationen zu den Kosten für BigQuery ML finden Sie unter BigQuery ML-Preise.
Hinweis
- Melden Sie sich in Ihrem Google Cloud -Konto an. Wenn Sie mit Google Cloudnoch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
- BigQuery ist in neuen Projekten automatisch aktiviert.
So aktivieren Sie BigQuery in einem bestehenden Projekt:
Aktivieren Sie die BigQuery API.
Rollen, die zum Aktivieren von APIs erforderlich sind
Zum Aktivieren von APIs benötigen Sie die IAM-Rolle „Service Usage-Administrator“ (
roles/serviceusage.serviceUsageAdmin), die die Berechtigungserviceusage.services.enableenthält. Weitere Informationen zum Zuweisen von Rollen
Prognose für eine einzelne Zeitreihe für Fahrten mit Leihfahrrädern erstellen
Mit der Funktion AI.FORECAST können Sie zukünftige Zeitachsenwerte prognostizieren.
Mit der folgenden Abfrage wird die Anzahl der Fahrten mit Leihfahrrädern pro Stunde für den nächsten Monat (ca. 720 Stunden) auf Grundlage der Verlaufsdaten der letzten vier Monate prognostiziert. Das Argument confidence_level gibt an, dass die Abfrage ein Vorhersageintervall mit einem Konfidenzniveau von 95% generiert.
So prognostizieren Sie Daten mit dem TimesFM-Modell:
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Fügen Sie die folgende Abfrage in den Abfrageeditor ein und klicken Sie auf Ausführen:
SELECT * FROM AI.FORECAST( ( SELECT TIMESTAMP_TRUNC(start_date, HOUR) as trip_hour, COUNT(*) as num_trips FROM `bigquery-public-data.san_francisco_bikeshare.bikeshare_trips` WHERE subscriber_type = 'Subscriber' AND start_date >= TIMESTAMP('2018-01-01') GROUP BY TIMESTAMP_TRUNC(start_date, HOUR) ), horizon => 720, confidence_level => 0.95, timestamp_col => 'trip_hour', data_col => 'num_trips');
Die Ergebnisse sehen in etwa so aus:
+-------------------------+-------------------+------------------+---------------------------------+---------------------------------+--------------------+ | forecast_timestamp | forecast_value | confidence_level | prediction_interval_lower_bound | prediction_interval_upper_bound | ai_forecast_status | +-------------------------+-------------------+------------------+---------------------------------+---------------------------------+--------------------+ | 2018-05-01 00:00:00 UTC | 26.3045959... | 0.95 | 21.7088378... | 30.9003540... | | +-------------------------+-------------------+------------------+---------------------------------+---------------------------------+--------------------+ | 2018-05-01 01:00:00 UTC | 34.0890502... | 0.95 | 2.47682913... | 65.7012714... | | +-------------------------+-------------------+------------------+---------------------------------+---------------------------------+--------------------+ | 2018-05-01 02:00:00 UTC | 24.2154693... | 0.95 | 2.87621605... | 45.5547226... | | +-------------------------+-------------------+------------------+---------------------------------+---------------------------------+--------------------+ | ... | ... | ... | ... | ... | | +-------------------------+-------------------+------------------+---------------------------------+---------------------------------+--------------------+
Prognostizierte Daten mit Eingabedaten vergleichen
Stellen Sie die Ausgabe der Funktion AI.FORECAST zusammen mit einer Teilmenge der Eingabedaten der Funktion in einem Diagramm dar, um zu sehen, wie sie sich vergleichen.
So stellen Sie die Funktionsausgabe in einem Diagramm dar:
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Fügen Sie die folgende Abfrage in den Abfrageeditor ein und klicken Sie auf Ausführen:
SELECT * FROM AI.FORECAST( ( SELECT TIMESTAMP_TRUNC(start_date, HOUR) as trip_hour, COUNT(*) as num_trips FROM `bigquery-public-data.san_francisco_bikeshare.bikeshare_trips` WHERE subscriber_type = 'Subscriber' AND start_date >= TIMESTAMP('2018-01-01') GROUP BY TIMESTAMP_TRUNC(start_date, HOUR) ), horizon => 720, confidence_level => 0.95, timestamp_col => 'trip_hour', data_col => 'num_trips', output_historical_time_series => true);
Wenn die Abfrage abgeschlossen ist, klicken Sie im Bereich Abfrageergebnisse auf den Tab Visualisierung. Wählen Sie als Visualisierungstyp die Option Linie aus. Wählen Sie für Dimension die Option
time_series_timestampaus. Wählen Sie für Messungen die Optionentime_series_data,prediction_interval_lower_boundundprediction_interval_upper_boundaus. Das resultierende Diagramm sieht etwa so aus:
Die Eingabedaten und die prognostizierten Daten zeigen eine ähnliche Nutzung des Bikesharing. Außerdem sehen Sie, dass die Unter- und Obergrenze des Vorhersageintervalls mit zunehmender Entfernung der prognostizierten Zeitpunkte in der Zukunft steigen.
Prognosen für mehrere Zeitreihen von Bike-Sharing-Fahrten
Mit der folgenden Abfrage wird die Anzahl der Fahrten mit Leihfahrrädern nach Abonnententyp und Stunde für den nächsten Monat (ca. 720 Stunden) auf Grundlage der historischen Daten der letzten vier Monate prognostiziert. Das Argument confidence_level gibt an, dass die Abfrage ein Vorhersageintervall mit einem Konfidenzniveau von 95% generiert.
So prognostizieren Sie Daten mit dem TimesFM-Modell:
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Fügen Sie die folgende Abfrage in den Abfrageeditor ein und klicken Sie auf Ausführen:
SELECT * FROM AI.FORECAST( ( SELECT TIMESTAMP_TRUNC(start_date, HOUR) as trip_hour, subscriber_type, COUNT(*) as num_trips FROM `bigquery-public-data.san_francisco_bikeshare.bikeshare_trips` WHERE start_date >= TIMESTAMP('2018-01-01') GROUP BY TIMESTAMP_TRUNC(start_date, HOUR), subscriber_type ), horizon => 720, confidence_level => 0.95, timestamp_col => 'trip_hour', data_col => 'num_trips', id_cols => ['subscriber_type']);
Die Ergebnisse sehen in etwa so aus:
+---------------------+--------------------------+------------------+------------------+---------------------------------+---------------------------------+--------------------+ | subscriber_type | forecast_timestamp | forecast_value | confidence_level | prediction_interval_lower_bound | prediction_interval_upper_bound | ai_forecast_status | +---------------------+--------------------------+------------------+------------------+---------------------------------+---------------------------------+--------------------+ | Subscriber | 2018-05-01 00:00:00 UTC | 26.3045959... | 0.95 | 21.7088378... | 30.9003540... | | +---------------------+--------------------------+------------------+------------------+---------------------------------+---------------------------------+--------------------+ | Subscriber | 2018-05-01 01:00:00 UTC | 34.0890502... | 0.95 | 2.47682913... | 65.7012714... | | +---------------------+-------------------+------------------+-------------------------+---------------------------------+---------------------------------+--------------------+ | Subscriber | 2018-05-01 02:00:00 UTC | 24.2154693... | 0.95 | 2.87621605... | 45.5547226... | | +---------------------+--------------------------+------------------+------------------+---------------------------------+---------------------------------+--------------------+ | ... | ... | ... | ... | ... | ... | | +---------------------+--------------------------+------------------+------------------+---------------------------------+---------------------------------+--------------------+
Bereinigen
Damit Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen nicht in Rechnung gestellt werden, löschen Sie entweder das Projekt, das die Ressourcen enthält, oder Sie behalten das Projekt und löschen die einzelnen Ressourcen.
Projekt löschen
So löschen Sie das Projekt:
- Wechseln Sie in der Google Cloud -Console zur Seite Ressourcen verwalten.
- Wählen Sie in der Projektliste das Projekt aus, das Sie löschen möchten, und klicken Sie dann auf Löschen.
- Geben Sie im Dialogfeld die Projekt-ID ein und klicken Sie auf Shut down (Beenden), um das Projekt zu löschen.
Nächste Schritte
- Eine Übersicht über BigQuery ML finden Sie unter Einführung in KI und ML in BigQuery.