Esta página mostra-lhe como criar um conjunto de dados do Vertex AI a partir dos seus dados de imagens para que possa começar a preparar modelos de deteção de objetos. Pode criar um conjunto de dados através da Google Cloud consola ou da API Vertex AI.
Crie um conjunto de dados vazio e importe ou associe os seus dados
Google Cloud consola
Use as instruções seguintes para criar um conjunto de dados vazio e importar ou associar os seus dados.
- Na Google Cloud consola, na secção Vertex AI, aceda à página Conjuntos de dados.
- Clique em Criar para abrir a página de detalhes de criação do conjunto de dados.
- Modifique o campo Nome do conjunto de dados para criar um nome a apresentar do conjunto de dados descritivo.
- Selecione o separador Imagem.
- Selecione a deteção de objetos como o objetivo do modelo.
- Selecione uma região na lista pendente Região.
- Clique em Criar para criar o conjunto de dados vazio e avançar para a página de importação de dados.
- Escolha uma das seguintes opções na secção Selecione um método de importação:
Carregue dados a partir do computador
- Na secção Selecione um método de importação, opte por carregar dados a partir do seu computador.
- Clique em Selecionar ficheiros e escolha todos os ficheiros locais a carregar para um contentor do Cloud Storage.
- Na secção Selecione um caminho do Cloud Storage, clique em Procurar para escolher uma localização do contentor do Cloud Storage para carregar os seus dados.
Carregue um ficheiro de importação a partir do computador
- Clique em Carregar um ficheiro de importação a partir do computador.
- Clique em Selecionar ficheiros e escolha o ficheiro de importação local para carregar para um contentor do Cloud Storage.
- Na secção Selecione um caminho do Cloud Storage, clique em Procurar para escolher uma localização do contentor do Cloud Storage para carregar o ficheiro.
Selecione um ficheiro de importação do Cloud Storage
- Clique em Selecionar um ficheiro de importação do Cloud Storage.
- Na secção Selecione um caminho do Cloud Storage, clique em Procurar para escolher o ficheiro de importação no Cloud Storage.
- Clique em Continuar.
A importação de dados pode demorar várias horas, consoante o tamanho dos seus dados. Pode fechar este separador e voltar a ele mais tarde. Recebe um email quando os dados forem importados.
API
Para criar um modelo de aprendizagem automática, tem de ter primeiro uma coleção representativa de dados para preparar. Depois de importar os dados, pode fazer modificações e iniciar a preparação do modelo.
Crie um conjunto de dados
Use os seguintes exemplos para criar um conjunto de dados para os seus dados.
REST
Antes de usar qualquer um dos dados do pedido, faça as seguintes substituições:
-
LOCATION: região onde o conjunto de dados vai ser armazenado. Tem de ser uma região que suporte recursos de conjuntos de dados. Por exemplo,
us-central1
. Consulte a lista de localizações disponíveis. - PROJECT: o seu ID do projeto.
- DATASET_NAME: nome do conjunto de dados.
Método HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasets
Corpo JSON do pedido:
{ "display_name": "DATASET_NAME", "metadata_schema_uri": "gs://google-cloud-aiplatform/schema/dataset/metadata/image_1.0.0.yaml" }
Para enviar o seu pedido, escolha uma destas opções:
curl
Guarde o corpo do pedido num ficheiro com o nome request.json
,
e execute o seguinte comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasets"
PowerShell
Guarde o corpo do pedido num ficheiro com o nome request.json
,
e execute o seguinte comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasets" | Select-Object -Expand Content
Deverá ver uma saída semelhante à seguinte. Pode usar o OPERATION_ID na resposta para obter o estado da operação.
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION/datasets/DATASET_ID/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.CreateDatasetOperationMetadata", "genericMetadata": { "createTime": "2020-07-07T21:27:35.964882Z", "updateTime": "2020-07-07T21:27:35.964882Z" } } }
Terraform
O exemplo seguinte usa o recurso do Terraform google_vertex_ai_dataset
para criar um conjunto de dados de imagens denominado image-dataset
.
Para saber como aplicar ou remover uma configuração do Terraform, consulte os comandos básicos do Terraform.
Java
Antes de experimentar este exemplo, siga as Javainstruções de configuração no início rápido do Vertex AI com bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API Java Vertex AI.
Para se autenticar no Vertex AI, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Node.js
Antes de experimentar este exemplo, siga as Node.jsinstruções de configuração no início rápido do Vertex AI com bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API Node.js Vertex AI.
Para se autenticar no Vertex AI, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Python
Para saber como instalar ou atualizar o SDK Vertex AI para Python, consulte o artigo Instale o SDK Vertex AI para Python. Para mais informações, consulte a Python documentação de referência da API.
O exemplo seguinte usa o SDK Vertex AI para Python para criar um conjunto de dados e importar dados. Se executar este código de exemplo, pode ignorar a secção Importar dados deste guia.
Este exemplo específico importa dados para a classificação de etiqueta única. Se o seu modelo tiver um objetivo diferente, tem de ajustar o código.
Importar dados
Depois de criar um conjunto de dados vazio, pode importar os seus dados para o conjunto de dados. Se usou o SDK Vertex AI para Python para criar o conjunto de dados, pode já ter importado dados quando criou o conjunto de dados. Se for o caso, pode ignorar esta secção.
REST
Antes de usar qualquer um dos dados do pedido, faça as seguintes substituições:
-
LOCATION: região onde o conjunto de dados está localizado. Por exemplo,
us-central1
. - PROJECT_ID: .
- DATASET_ID: ID do conjunto de dados.
- IMPORT_FILE_URI: caminho para o ficheiro CSV ou JSON Lines no Cloud Storage que lista os itens de dados armazenados no Cloud Storage a usar para a preparação do modelo. Para ver os formatos de ficheiros de importação e as limitações, consulte o artigo Preparar dados de imagens.
Método HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID:import
Corpo JSON do pedido:
{ "import_configs": [ { "gcs_source": { "uris": "IMPORT_FILE_URI" }, "import_schema_uri" : "gs://google-cloud-aiplatform/schema/dataset/ioformat/image_bounding_box_io_format_1.0.0.yaml" } ] }
Para enviar o seu pedido, escolha uma destas opções:
curl
Guarde o corpo do pedido num ficheiro com o nome request.json
,
e execute o seguinte comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID:import"
PowerShell
Guarde o corpo do pedido num ficheiro com o nome request.json
,
e execute o seguinte comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID:import" | Select-Object -Expand Content
Deverá ver uma saída semelhante à seguinte. Pode usar o OPERATION_ID na resposta para obter o estado da operação.
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION/datasets/DATASET_ID/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.ImportDataOperationMetadata", "genericMetadata": { "createTime": "2020-07-08T20:32:02.543801Z", "updateTime": "2020-07-08T20:32:02.543801Z" } } }
Java
Antes de experimentar este exemplo, siga as Javainstruções de configuração no início rápido do Vertex AI com bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API Java Vertex AI.
Para se autenticar no Vertex AI, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Node.js
Antes de experimentar este exemplo, siga as Node.jsinstruções de configuração no início rápido do Vertex AI com bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API Node.js Vertex AI.
Para se autenticar no Vertex AI, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Python
Para saber como instalar ou atualizar o SDK Vertex AI para Python, consulte o artigo Instale o SDK Vertex AI para Python. Para mais informações, consulte a Python documentação de referência da API.
Obtenha o estado da operação
Alguns pedidos iniciam operações de longa duração que requerem tempo para serem concluídas. Estes pedidos devolvem um nome da operação, que pode usar para ver o estado da operação ou cancelar a operação. A Vertex AI fornece métodos auxiliares para fazer chamadas contra operações de longa duração. Para mais informações, consulte o artigo Trabalhar com operações de longa duração.