Nesta página, você vai aprender a executar um aplicativo de treinamento Keras do TensorFlow na Agent Platform. Esse modelo particular treina um modelo de classificação de imagem que classifica flores por tipo.
Este tutorial tem várias páginas:Como treinar um modelo personalizado de classificação de imagens.
Como exibir previsões de um modelo de classificação de imagens personalizado
Cada página pressupõe que você já tenha realizado as instruções das páginas anteriores do tutorial.
O restante deste documento pressupõe que você está usando o mesmo ambiente do Cloud Shell criado ao seguir a primeira página deste tutorial. Se a sessão original do Cloud Shell não estiver mais aberta, será possível retornar ao ambiente fazendo o seguinte:-
No Google Cloud console, ative o Cloud Shell.
-
Na sessão do Cloud Shell, execute o seguinte comando:
cd hello-custom-sample
Executar um pipeline de treinamento personalizado
Nesta seção, descrevemos como usar o pacote de treinamento que você fez upload no Cloud Storage para executar um pipeline de treinamento personalizado da Agent Platform.
No Google Cloud console, na seção "Agent Platform", acesse a página Pipelines de treinamento.
Clique em Criar para abrir o painel Treinar novo modelo.
Na etapa Escolher método de treinamento, faça o seguinte:
Na lista suspensa Conjunto de dados, selecione Nenhum conjunto de dados gerenciado. Esse aplicativo de treinamento específico carrega dados da biblioteca TensorFlow Datasets, em vez de um conjunto de dados gerenciado da Agent Platform.
Verifique se a opção Treinamento personalizado (avançado) está selecionada.
Clique em Continuar.
Na etapa Detalhes do modelo, no campo Nome, insira
hello_custom. Clique em Continuar.Na etapa Configurações do contêiner, forneça à Agent Platform as informações necessárias para usar o pacote de treinamento que você fez upload no Cloud Storage:
Selecione Contêiner pré-criado.
Na lista suspensa Framework do modelo, selecione TensorFlow.
Na lista suspensa Versão do framework do modelo, selecione 2.3.
No campo Localização do pacote, insira
cloud-samples-data/ai-platform/hello-custom/hello-custom-sample-v1.tar.gz.No campo módulo Python, insira
trainer.task.traineré o nome do pacote Python no tarball, etask.pycontém o código de treinamento. Portanto,trainer.taské o nome do módulo que você quer que a Agent Platform execute.No campo Diretório de saída do modelo, clique em Procurar. Faça o seguinte no painel Selecionar pasta:
Navegue até o bucket do Cloud Storage.
Clique em Criar nova pasta.
Nomeie a nova pasta como
output. Clique em Criar.Clique em Selecionar.
Confirme se o campo tem o valor
gs://BUCKET_NAME/output, em que BUCKET_NAME é o nome do bucket do Cloud Storage.Esse valor é transmitido à Agent Platform no
baseOutputDirectorycampo da API, que define diversas variáveis de ambiente que o aplicativo de treinamento pode acessar quando ele é executado.Por exemplo, ao definir esse campo como
gs://BUCKET_NAME/output, a Agent Platform define a variável de ambienteAIP_MODEL_DIRcomogs://BUCKET_NAME/output/model. No final do treinamento, a Agent Platform usa os artefatos no diretórioAIP_MODEL_DIRpara criar um recurso de modelo.Saiba mais sobre as variáveis de ambiente definidas por este campo.
Clique em Continuar.
Na etapa opcional Hiperparâmetros, verifique se a caixa de seleção Ativar ajuste de hiperparâmetros está desmarcada. Este tutorial não usa o ajuste de hiperparâmetro. Clique em Continuar.
Na etapa Computação e preços, aloque recursos para o job de treinamento personalizado:
Na lista suspensa Região, selecione us-central1 (Iowa).
Na lista suspensa Tipo de máquina, selecione n1-standard-4 na seção Padrão.
Não adicione aceleradores ou pools de workers para este tutorial. Clique em Continuar.
Na etapa Contêiner de previsão, forneça à Agent Platform as informações necessárias para disponibilizar previsões:
Selecione Contêiner pré-criado.
Na seção Configurações de contêiner pré-criado, faça o seguinte:
Na lista suspensa Framework do modelo, selecione TensorFlow.
Na lista suspensa Versão do framework do modelo, selecione 2.3.
Na lista suspensa Tipo de acelerador, selecione Nenhum.
Confirme se o campo Diretório do modelo tem o valor
gs://BUCKET_NAME/output, em que BUCKET_NAME é o nome do bucket do Cloud Storage. Isso corresponde ao valor do diretório de saída do modelo fornecido em uma etapa anterior.
Deixe os campos na seção Schemata de previsão em branco.
Clique em Iniciar treinamento.
Agora é possível visualizar o novo pipeline de treinamento, chamado hello_custom,
na página Treinamento. Talvez seja necessário atualizar a página. Esse pipeline
de treinamento executa, principalmente, as seguintes tarefas:
Ele cria um recurso de job personalizado chamado
hello_custom-custom-job. Depois de alguns instantes, será possível visualizar esse recurso na página Jobs personalizados da seção Treinamento:O job personalizado executa o aplicativo de treinamento usando os recursos de computação especificados nesta seção.
Após a conclusão do job personalizado, o pipeline de treinamento encontrará os artefatos criados pelo aplicativo de treinamento no diretório
output/model/do bucket do Cloud Storage. Ele usa esses artefatos para criar um recurso de modelo.
Monitorar o treinamento
Para visualizar os logs de treinamento faça o seguinte:
No Google Cloud console, na seção "Agent Platform", acesse a página Jobs personalizados.
Para visualizar os detalhes do
CustomJobque você acabou de criar, clique emhello_custom-custom-jobna lista.Na página de detalhes do job, clique em Visualizar registros.
Ver o modelo treinado
Quando o pipeline de treinamento personalizado for concluído, será possível encontrar o modelo treinado no console Google Cloud , na seção "Agent Platform", na página Modelos.
O modelo tem o nome hello_custom.
A seguir
Siga a próxima página deste tutorial para exibir previsões no seu modelo treinado de ML.