Beitragsanalyse – Übersicht

In diesem Dokument erfahren Sie mehr über den Anwendungsfall der Beitragsanalyse und die Optionen zum Ausführen einer Beitragsanalyse in BigQuery ML.

Was ist eine Beitragsanalyse?

Die Beitragsanalyse, auch als Analyse der wichtigsten Treiber bezeichnet, ist eine Methode, mit der Sie Informationen zu Änderungen an wichtigen Messwerten in Ihren mehrdimensionalen Daten gewinnen können. Mithilfe der Beitragsanalyse können Sie beispielsweise sehen, welche Daten zu einer Änderung der Umsatzzahlen über zwei Quartale hinweg beigetragen haben, oder zwei Trainingsdatensätze vergleichen, um Änderungen an der Leistung eines ML-Modells zu verstehen.

Die Beitragsanalyse ist eine Form der erweiterten Analyse, bei der künstliche Intelligenz (KI) eingesetzt wird, um die Analyse und Auswertung von Daten zu verbessern und zu automatisieren. Mit der Beitragsanalyse wird eines der Hauptziele der erweiterten Analysen erreicht: Nutzern dabei zu helfen, Muster in ihren Daten zu finden.

Beitragsanalyse mit BigQuery ML

Bei der Beitragsanalyse werden Datensegmente erkannt, die Änderungen bei einem bestimmten Messwert aufweisen. Dazu wird ein Testdatensatz mit einem Kontrolldatensatz verglichen. Sie können beispielsweise einen Tabellen-Snapshot der Verkaufsdaten von Ende 2023 als Testdaten und einen Tabellen-Snapshot von Ende 2022 als Kontrolldaten verwenden und sie vergleichen, um zu sehen, wie sich Ihre Verkäufe im Laufe der Zeit verändert haben. Mit der Beitragsanalyse können Sie sehen, welches Datensegment, z. B. Onlinekunden in einer bestimmten Region, die größte Veränderung beim Umsatz von einem Jahr zum nächsten verursacht hat.

Ein Messwert ist der numerische Wert, mit dem in Modellen zur Beitragsanalyse die Änderungen zwischen den Test- und Kontrolldaten gemessen und verglichen werden. Sie können die folgenden Arten von Messwerten mit einem Modell zur Beitragsanalyse angeben:

  • Summierbar: Summiert die Werte einer von Ihnen angegebenen Messwertspalte und ermittelt dann eine Summe für jedes Datensegment.
  • _Summierbares Verhältnis_: Summiert die Werte von zwei von Ihnen angegebenen numerischen Spalten und ermittelt für jedes Datensegment das Verhältnis zwischen ihnen.
  • Summierbar nach Kategorie: Summiert den Wert einer numerischen Spalte und teilt ihn durch die Anzahl der eindeutigen Werte aus einer kategorialen Spalte.

Ein Segment ist ein Segment der Daten, das durch eine bestimmte Kombination von Dimensionswerten identifiziert wird. Bei einem Beitragsanalysemodell, das auf den Dimensionen store_number, customer_id und day basiert, stellt beispielsweise jede eindeutige Kombination dieser Dimensionswerte ein Segment dar. In der folgenden Tabelle steht jede Zeile für ein anderes Segment:

store_number customer_id day
Geschäft 1
Geschäft 1 Kund*in 1
Geschäft 1 Kund*in 1 Montag
Geschäft 1 Kund*in 1 Dienstag
Geschäft 1 Kund*in 2
Geschäft 2

Daten ohne Modell analysieren

Wenn Sie weniger als 12 Dimensionen haben und einen summierbaren Messwert verwenden, dann können Sie eine Beitragsanalyse mit der AI.KEY_DRIVERS TVF durchführen. Bei den meisten Anwendungen empfehlen wir, die Funktion AI.KEY_DRIVERS zu verwenden, anstatt ein Modell zu erstellen, da sie eine vereinfachte Syntax, schnellere Ergebnisse und eine automatische Bereinigung bietet. Die Funktionsausgabe besteht aus Zeilen mit Informationen, wobei jede Information einem Segment entspricht und die entsprechenden Messwerte des Segments enthält.

Modell zur Beitragsanalyse verwenden

Wenn Sie mehr als 12 Dimensionen oder andere Arten von Messwerten benötigen, können Sie mit der CREATE MODEL Anweisung ein Modell zur Beitragsanalyse erstellen.

Um die Erstellungszeit des Modells zu verkürzen, geben Sie einen Apriori-Supportschwellenwert an. Mit einem Apriori-Supportschwellenwert können Sie kleine und weniger relevante Segmente bereinigen, sodass das Modell nur die größten und relevantesten Segmente verwendet.

Nachdem Sie ein Modell für die Beitragsanalyse erstellt haben, können Sie mit der ML.GET_INSIGHTS Funktion die vom Modell berechneten Messwertinformationen abrufen. Die Funktionsausgabe besteht aus Zeilen mit Informationen, wobei jede Information einem Segment entspricht und die entsprechenden Messwerte des Segments enthält.

Nutzerreise bei der Beitragsanalyse

In der folgenden Tabelle werden die Anweisungen und Funktionen beschrieben, die Sie für die Beitragsanalyse verwenden können:

Anweisung oder Funktion Vorverarbeitung von Features Insights-Generierung Tutorials
AI.KEY_DRIVERS Manuelle Vorverarbeitung Beispiel für eine Beitragsanalyse von Daten zum Spirituosenverkauf in Iowa
CREATE MODEL Manuelle Vorverarbeitung ML.GET_INSIGHTS

Nächste Schritte