Visão geral da criação de conjuntos de dados gerenciados na Vertex AI

É possível usar um conjunto de dados gerenciado para fornecer os dados de origem usados para treinar o AutoML e modelos personalizados na Vertex AI. Um conjunto de dados gerenciado é necessário para o AutoML e é opcional para treinamento personalizado.

Permissões e controle de acesso

Quando você usa dados de um bucket do Cloud Storage para criar um conjunto de dados, a Vertex AI exige permissões para acessar os dados. A Vertex AI usa uma conta de serviço especial gerenciada pelo Google, conhecida como agente de serviço, para acessar seus dados com segurança. Para mais informações sobre os papéis necessários e como o agente de serviço funciona, consulte Controle de acesso com o IAM.

Criar um conjunto de dados gerenciado para modelos do AutoML

É possível criar conjuntos de dados gerenciados para treinar modelos do AutoML usando o consoleGoogle Cloud ou a API Vertex AI. As instruções sobre como fazer isso variam um pouco de acordo com o tipo de dados e o objetivo do modelo. Comece preparando seus dados de treinamento.

Imagem

Saiba como criar um conjunto de dados gerenciado para os seguintes tipos de modelos de imagem do AutoML:

Tabular

Saiba como criar um conjunto de dados gerenciado para os seguintes tipos de modelos tabulares do AutoML:

Vídeo

Saiba como criar um conjunto de dados gerenciado para os seguintes tipos de modelos de vídeo do AutoML:

Criar um conjunto de dados gerenciado para modelos treinados personalizados

As instruções sobre como criar um conjunto de dados gerenciado para treinar modelos personalizados são as mesmas, independentemente do tipo de dados ou do objetivo do modelo.

Para mais detalhes, consulte Usar conjuntos de dados gerenciados.

Acessar conjuntos de dados gerenciados usando o Data Catalog

O Data Catalog é um serviço de metadados escalonável e totalmente gerenciado que oferece um local centralizado para pesquisar conjuntos de dados em projetos e regiões.

Para detalhes, consulte a visão geral Usar o Data Catalog para pesquisar recursos de modelo e conjunto de dados.