Übersicht über die Feature-Vorverarbeitung

Die Feature-Vorverarbeitung ist einer der wichtigsten Schritte im Lebenszyklus des maschinellen Lernens. Sie beinhaltet das Erstellen von Features und das Bereinigen der Trainingsdaten. Das Erstellen von Features wird auch als Feature Engineering bezeichnet.

BigQuery ML bietet die folgenden Techniken zur Vorverarbeitung von Features:

  • Automatische Vorverarbeitung: BigQuery ML führt während des Trainings eine automatische Vorverarbeitung durch. Weitere Informationen finden Sie unter Automatische Feature-Vorverarbeitung.

  • Manuelle Vorverarbeitung. Sie können mit der TRANSFORM-Klausel in der Anweisung CREATE MODEL die benutzerdefinierte Vorverarbeitung mithilfe von manuellen Vorverarbeitungsfunktionen festlegen. Diese Funktionen können auch außerhalb der TRANSFORM-Klausel genutzt werden, um Trainingsdaten vor dem Erstellen des Modells zu verarbeiten.

Feature-Informationen abrufen

Mit der Funktion ML.FEATURE_INFO lassen sich Statistiken aller Eingabefeaturespalten abrufen.

Mit den Standardeinstellungen in den CREATE MODEL-Anweisungen und den Inferenzfunktionen können Sie BigQuery ML-Modelle auch ohne viel ML-Wissen erstellen und verwenden. Grundkenntnisse über den ML-Entwicklungszyklus, z. B. Feature Engineering und Modelltraining, helfen Ihnen jedoch, sowohl Ihre Daten als auch Ihr Modell zu optimieren, um bessere Ergebnisse zu erzielen. Wir empfehlen die folgenden Ressourcen, um sich mit ML-Techniken und -Prozessen vertraut zu machen:

Nächste Schritte