Visão geral do pré-processamento de atributos
O pré-processamento de atributos é uma das etapas mais importantes do ciclo de vida de machine learning. Ela consiste em criar atributos e limpar os dados de treinamento. A criação de atributos também é chamada de engenharia de atributos.
O BigQuery ML oferece as seguintes técnicas de pré-processamento de atributos:
Pré-processamento automático. O BigQuery ML realiza o pré-processamento automático durante o treinamento. Para mais informações, consulte Pré-processamento automático de atributos.
Pré-processamento manual. É possível usar a cláusula
TRANSFORM
na instruçãoCREATE MODEL
para definir o pré-processamento personalizado usando funções de pré-processamento manual. Também é possível usar essas funções fora da cláusulaTRANSFORM
para processar dados de treinamento antes de criar o modelo.
Receber informações do atributo
Além disso, é possível usar a função ML.FEATURE_INFO
para recuperar as estatísticas de todas as colunas de atributos de entrada.
Conhecimento recomendado
Ao usar as configurações padrão nas instruções CREATE MODEL
e nas funções de inferência, é possível criar e usar modelos do BigQuery ML mesmo sem muito conhecimento de ML. No entanto, ter conhecimentos básicos sobre o ciclo de vida de desenvolvimento de ML, como engenharia de recursos e treinamento de modelo, ajuda a otimizar seus dados e seu modelo para oferecer resultados melhores. Recomendamos usar os seguintes recursos para se familiarizar com técnicas e processos de ML:
- Curso intensivo de machine learning
- Introdução ao machine learning
- Limpeza de dados
- Feature Engineering
- Machine learning intermediário
A seguir
- Aprenda sobre a disponibilização de recursos no BigQuery ML.
Para mais informações sobre instruções e funções do SQL compatíveis com modelos que aceitam pré-processamento de atributos, consulte os seguintes documentos: