Introdução aos notebooks geridos
As instâncias de blocos de notas geridos do Vertex AI Workbench são ambientes geridos pela Google com integrações e capacidades que ajudam a configurar e trabalhar num ambiente de produção baseado em blocos de notas Jupyter completo.
As instâncias de blocos de notas geridos são pré-embaladas com o JupyterLab e têm um conjunto pré-instalado de pacotes de aprendizagem profunda, incluindo suporte para as frameworks TensorFlow e PyTorch. As instâncias de blocos de notas geridas suportam aceleradores de GPU e a capacidade de sincronização com um repositório do GitHub. As suas instâncias de blocos de notas geridas estão protegidas por Google Cloud autenticação e autorização.
Infraestrutura de computação gerida pela Google
Uma instância de blocos de notas geridos do Vertex AI Workbench é uma infraestrutura de computação baseada no Jupyter Notebook gerida pela Google.
Quando cria uma instância de blocos de notas geridos, esta é implementada como uma instância de máquina virtual (VM) gerida pela Google num projeto de inquilino.
A sua instância de blocos de notas geridos inclui muitos ambientes de frameworks de ciência de dados comuns, como o TensorFlow e o PyTorch. Também pode adicionar as suas próprias imagens de contentores personalizadas à instância de blocos de notas geridos. Estes ambientes estão disponíveis como kernels nos quais pode executar o seu ficheiro de bloco de notas.
Quando executa um bloco de notas num dos kernels, o Vertex AI Workbench inicia o contentor correspondente, cria uma sessão do Jupyter no mesmo e usa essa sessão do Jupyter para executar o bloco de notas no contentor.
Esta infraestrutura de computação gerida pela Google inclui integrações e capacidades que ajudam a implementar fluxos de trabalho de ciência de dados e aprendizagem automática do início ao fim. Consulte as secções seguintes para ver detalhes.
Use contentores personalizados
Pode adicionar imagens de contentores Docker personalizadas à instância de blocos de notas geridos para executar o código do bloco de notas num ambiente personalizado de acordo com as suas necessidades.
Estes contentores personalizados estão disponíveis para utilização diretamente a partir da interface do utilizador do JupyterLab, juntamente com as frameworks pré-instaladas. Para mais informações, consulte o artigo Adicione um contentor personalizado a uma instância de blocos de notas geridos.
Fluxo de trabalho baseado em blocos de notas
As instâncias de blocos de notas geridas permitem-lhe realizar tarefas orientadas para fluxos de trabalho sem sair da interface do utilizador do JupyterLab.
Controle o hardware e a framework a partir do JupyterLab
Numa instância de blocos de notas geridos, a interface do utilizador do JupyterLab é onde especifica os recursos de computação nos quais o seu código vai ser executado. Por exemplo, pode configurar quantas vCPUs ou GPUs quer, quanta RAM quer e em que framework quer executar o código. Pode escrever o código primeiro e, em seguida, escolher como o executar sem sair do JupyterLab nem reiniciar a instância. Para testes rápidos do seu código, pode reduzir a escala do hardware e, em seguida, aumentá-la novamente para executar o código em mais dados.
Acesso aos dados
Pode aceder aos seus dados sem sair da interface do utilizador do JupyterLab.
No menu de navegação do JupyterLab numa instância de blocos de notas geridos, pode usar a integração do Cloud Storage para procurar dados e outros ficheiros aos quais tem acesso. Consulte o artigo Aceda a contentores e ficheiros do Cloud Storage a partir do JupyterLab.
Também pode usar a integração do BigQuery para procurar tabelas às quais tem acesso, escrever consultas, pré-visualizar resultados e carregar dados para o seu bloco de notas. Consulte o artigo Consultar dados em tabelas do BigQuery a partir do JupyterLab.
Executar execuções de blocos de notas
Use o executor para executar um ficheiro de bloco de notas como uma execução única ou num agendamento. Escolha o ambiente e o hardware específicos nos quais quer que a execução seja realizada. O código do seu bloco de notas é executado no preparação personalizada do Vertex AI, o que pode facilitar a preparação distribuída, a otimização de hiperparâmetros ou o agendamento de tarefas de preparação contínua. Consulte o artigo Execute ficheiros de blocos de notas com o executor.
Pode usar parâmetros na sua execução para fazer alterações específicas a cada execução. Por exemplo, pode especificar um conjunto de dados diferente para usar, alterar a taxa de aprendizagem no seu modelo ou alterar a versão do modelo.
Também pode definir um bloco de notas para ser executado num agendamento recorrente. Mesmo quando a instância está encerrada, o Vertex AI Workbench executa o ficheiro de bloco de notas e guarda os resultados para que os possa consultar e partilhar com outras pessoas.
Partilhe estatísticas
As execuções de blocos de notas são armazenadas num contentor do Cloud Storage, para que possa partilhar as suas estatísticas com outras pessoas concedendo acesso aos resultados. Consulte a secção anterior sobre a execução de execuções de blocos de notas.
Proteja a sua instância
Pode implementar a instância de blocos de notas geridos com a rede gerida pela Google predefinida, que usa uma rede VPC e uma sub-rede predefinidas. Em vez da rede predefinida, pode especificar uma rede VPC para usar com a sua instância. Para mais informações, consulte o artigo Configure uma rede. Pode usar os VPC Service Controls para fornecer segurança adicional às suas instâncias de blocos de notas geridos.
Para usar blocos de notas geridos num perímetro de serviço, consulte o artigo Use uma instância de blocos de notas geridos num perímetro de serviço.
Por predefinição,o Google Ads Google Cloud encripta automaticamenteos dados quando estão em repouso através de chaves de encriptação geridas pela Google. Se tiver requisitos de conformidade ou regulamentares específicos relacionados com as chaves que protegem os seus dados, pode usar chaves de encriptação geridas pelo cliente (CMEK) com as suas instâncias de blocos de notas geridos. Para mais informações, consulte o artigo Use chaves de encriptação geridas pelo cliente.
Encerramento automático para instâncias inativas
Para ajudar a gerir os custos, as instâncias de blocos de notas geridas são encerradas após ficarem inativas durante um período específico por predefinição. Pode alterar o período ou desativar esta funcionalidade. Para mais informações, consulte Desligamento por inatividade.
Integração do Dataproc
Pode processar dados rapidamente executando um bloco de notas num cluster do Dataproc. Depois de configurar o cluster, pode executar um ficheiro de bloco de notas no mesmo sem sair da interface do utilizador do JupyterLab. Para mais informações, consulte o artigo Execute uma instância de blocos de notas geridos num cluster do Dataproc.
Limitações
Considere as seguintes limitações dos blocos de notas geridos ao planear o seu projeto:
As instâncias de blocos de notas geridos são geridas pela Google e, por isso, são menos personalizáveis do que as instâncias de blocos de notas geridos pelo utilizador do Vertex AI Workbench. As instâncias de blocos de notas geridas pelo utilizador podem ser mais adequadas para utilizadores que precisam de muito controlo sobre o respetivo ambiente. Para mais informações, consulte o artigo Introdução aos blocos de notas geridos pelo utilizador.
As extensões do JupyterLab de terceiros não são suportadas.
O plug-in do Dataproc JupyterLab não é suportado para blocos de notas geridos, mas pode usar o plug-in em instâncias do Vertex AI Workbench. Consulte o artigo Crie uma instância com o Dataproc ativado.
As instâncias de blocos de notas geridas não permitem que os utilizadores tenham acesso ao
sudo
.Quando usa o Access Context Manager e o Chrome Enterprise Premium para proteger instâncias de blocos de notas geridas com controlos de acesso sensíveis ao contexto, o acesso é avaliado sempre que o utilizador se autentica na instância. Por exemplo, o acesso é avaliado na primeira vez que o utilizador acede ao JupyterLab e sempre que acede posteriormente, se o cookie do navegador de Internet tiver expirado.
Para usar aceleradores com instâncias de blocos de notas geridas, o tipo de acelerador que quer tem de estar disponível na zona da sua instância. Para saber mais sobre a disponibilidade de aceleradores por zona, consulte o artigo Disponibilidade de regiões e zonas de GPU.
O que se segue?
- Saiba mais sobre as opções de rede disponíveis para a sua instância de blocos de notas geridos.