Übersicht über die Feature-Vorverarbeitung
Die Feature-Vorverarbeitung ist einer der wichtigsten Schritte im Lebenszyklus des maschinellen Lernens. Sie beinhaltet das Erstellen von Features und das Bereinigen der Trainingsdaten. Das Erstellen von Features wird auch als Feature Engineering bezeichnet.
BigQuery ML bietet die folgenden Techniken zur Vorverarbeitung von Features:
Automatische Vorverarbeitung: BigQuery ML führt während des Trainings eine automatische Vorverarbeitung durch. Weitere Informationen finden Sie unter Automatische Feature-Vorverarbeitung.
Manuelle Vorverarbeitung. Sie können mit der
TRANSFORM
-Klausel in der AnweisungCREATE MODEL
die benutzerdefinierte Vorverarbeitung mithilfe von manuellen Vorverarbeitungsfunktionen festlegen. Diese Funktionen können auch außerhalb derTRANSFORM
-Klausel genutzt werden, um Trainingsdaten vor dem Erstellen des Modells zu verarbeiten.
Feature-Informationen abrufen
Mit der Funktion ML.FEATURE_INFO
lassen sich Statistiken aller Eingabefeaturespalten abrufen.
Empfohlenes Wissen
Mit den Standardeinstellungen in den CREATE MODEL
-Anweisungen und den Inferenzfunktionen können Sie BigQuery ML-Modelle auch ohne viel ML-Wissen erstellen und verwenden. Grundkenntnisse über den ML-Entwicklungszyklus, z. B. Feature Engineering und Modelltraining, helfen Ihnen jedoch, sowohl Ihre Daten als auch Ihr Modell zu optimieren, um bessere Ergebnisse zu erzielen. Wir empfehlen die folgenden Ressourcen, um sich mit ML-Techniken und -Prozessen vertraut zu machen:
- Crashkurs zum maschinellen Lernen
- Einführung in das maschinelle Lernen
- Datenbereinigung
- Feature Engineering
- Intermediate Machine Learning
Nächste Schritte
- Weitere Informationen zur Featurebereitstellung in BigQuery ML
Weitere Informationen zu unterstützten SQL-Anweisungen und ‑Funktionen für Modelle, die die Vorverarbeitung von Features unterstützen, finden Sie in den folgenden Dokumenten: