Este documento explica as principais diferenças entre os métodos de preparação disponíveis no Google Cloud. A sua escolha depende da experiência da sua equipa, do nível de controlo de que precisa e da sua preferência de infraestrutura.
Com o AutoML, cria e prepara um modelo com o mínimo de esforço técnico. Pode usar o AutoML para criar protótipos de modelos rapidamente e explorar novos conjuntos de dados antes de investir no desenvolvimento. Por exemplo, pode usá-lo para saber que funcionalidades são melhores para um determinado conjunto de dados.
Com a formação personalizada, pode criar uma aplicação de formação otimizada para o resultado segmentado. Tem controlo total sobre a funcionalidade da aplicação de preparação, desde tarefas de nó único a preparação distribuída de vários nós em grande escala. Ou seja, pode segmentar qualquer objetivo, usar qualquer algoritmo, desenvolver as suas próprias funções de perda ou métricas, ou fazer qualquer outra personalização.
Preparação sem servidor do Vertex AI: esta é uma abordagem sem servidor em que envia a sua tarefa de preparação e o Google Cloud aprovisiona, gere e liberta os recursos de computação por si. É ideal para experimentação e para tarefas em que não precisa de capacidade garantida.
Os clusters de preparação da Vertex AI são uma funcionalidade da preparação personalizada concebida para tarefas de preparação de grande escala e alto desempenho. Permite-lhe reservar um cluster dedicado de recursos de computação avançados (como GPUs A100 ou H100) para sua utilização exclusiva, garantindo a capacidade e o desempenho para tarefas de preparação de longa duração e essenciais.
Com o Ray no Vertex AI, pode usar a framework de computação distribuída do Ray na infraestrutura do Google Cloud . O Ray no Vertex AI oferece um ambiente gerido com recursos de computação configuráveis, integração com serviços como o Vertex AI Inference e o BigQuery, e opções de rede flexíveis para desenvolver e executar cargas de trabalho distribuídas.
Com o BigQuery, pode formar modelos usando os seus dados do BigQuery diretamente no BigQuery. Com os comandos SQL, pode criar rapidamente um modelo e usá-lo para obter inferências em lote.
Para comparar as diferentes funcionalidades e conhecimentos necessários para cada serviço, reveja a tabela seguinte.
| AutoML | Formação sem servidor | Clusters de preparação | Ray no Vertex AI | BigQuery ML | |
|---|---|---|---|---|---|
| É necessária experiência em ciência de dados | Não | Sim, para desenvolver a aplicação de preparação e processar a preparação de dados. | Sim, para desenvolver a aplicação de preparação e processar a preparação de dados. | É útil ter uma compreensão básica dos conceitos de AA e dos fluxos de trabalho de dados. | Não |
| Capacidade de programação necessária | Não. O AutoML não requer código. | Sim, para desenvolver a aplicação de formação. | Sim, para desenvolver a aplicação de formação. | Sim. | Sim. |
| Tempo para preparar o modelo | Inferior. Não é necessária preparação de dados nem desenvolvimento. | Mais elevado. Envolve o desenvolvimento de código e o tempo de aprovisionamento de recursos a pedido para cada tarefa. | Mais elevado. Envolve o desenvolvimento de código, mas o início da tarefa é mais rápido, uma vez que os recursos já estão reservados, o que elimina as filas e o tempo de aprovisionamento. | O tempo de preparação depende da lógica do código (preparação e preparação de dados) e do tempo de aprovisionamento de recursos. | Inferior. A programação de modelos é rápida, uma vez que o BigQuery ML tira partido do motor computacional do BigQuery para preparação, avaliação e inferência. |
| Limites nos objetivos de aprendizagem automática | Sim. Tem de segmentar um dos objetivos predefinidos do AutoML. | Não | Não | Não | Sim |
| Pode otimizar manualmente o desempenho do modelo com o aperfeiçoamento de hiperparâmetros | Não. O AutoML realiza alguns ajustes automáticos, mas não pode modificar os valores. | Sim. Pode otimizar o modelo durante cada execução de preparação para experimentação e comparação. | Sim. Pode otimizar o modelo durante cada execução de preparação para experimentação e comparação. | Sim. Fornece o código de preparação personalizado, o que lhe dá controlo total sobre os valores dos hiperparâmetros. | Sim. O BigQuery ML suporta o ajuste de hiperparâmetros ao preparar modelos. |
| Pode controlar aspetos do ambiente de preparação | Limitado. Pode especificar o orçamento para horas de preparação e ativar a paragem antecipada. | Sim. Especifica o tipo de máquina do Compute Engine, o tamanho do disco e a imagem do contentor para cada tarefa. | Sim. Tem o controlo máximo, reservando tipos de máquinas de alto desempenho específicos (por exemplo, H100s), configurações de disco e definições de rede para sua utilização exclusiva, garantindo a capacidade. | Sim. Tem um controlo significativo, incluindo imagens Docker personalizadas, tipos de máquinas para nós principais e de trabalho, bem como o número e o tipo de aceleradores (GPUs). | Não |
| Limites de tamanho dos dados | Sim. As limitações de tamanho dos dados variam consoante o tipo de conjunto de dados. | Não | Não | Não. No entanto, existe um tamanho máximo de resposta a consultas de 10 GB para leituras do BigQuery. | Sim. O BigQuery ML aplica quotas adequadas por projeto. Para saber mais, consulte o artigo Quotas e limites. |
O que se segue?
- Escolha um tutorial introdutório para começar a usar o Vertex AI Training.
- Saiba mais sobre a preparação de um modelo do AutoML.
- Saiba mais sobre a preparação sem servidor do Vertex AI.
- Saiba mais sobre os clusters de preparação do Vertex AI.
- Saiba mais sobre o Ray no Vertex AI.