Vista geral dos recursos persistentes

Um recurso persistente da Vertex AI é um cluster de execução prolongada que pode criar para executar tarefas de preparação personalizadas. Após a conclusão de uma tarefa de preparação, o recurso persistente permanece disponível para executar outras tarefas de preparação até o eliminar. Pode usar um recurso persistente para garantir a disponibilidade de recursos de computação e reduzir o tempo de início da tarefa que, de outra forma, é necessário para a criação de recursos de computação. Os recursos persistentes suportam todas as VMs e GPUs que são suportadas por tarefas de preparação personalizadas. Esta página explica quando usar um recurso persistente e dá-lhe informações sobre a faturação e a quota.

Quando usar um recurso persistente

Recomendamos a utilização de recursos persistentes nos seguintes cenários:

  • Quer garantir a disponibilidade de capacidade para cargas de trabalho de ML críticas ou durante as temporadas de pico. Ao contrário das tarefas personalizadas, em que o serviço de preparação liberta o recurso após a conclusão da tarefa, o recurso persistente permanece disponível até ser eliminado.
  • Está a enviar a mesma tarefa várias vezes e pode beneficiar da colocação em cache de dados e imagens executando as tarefas no mesmo recurso persistente.
  • Executa muitos trabalhos de preparação de curta duração em que o tempo de preparação real é inferior ao tempo de início do trabalho.

Para mais contexto sobre quando e por que motivo usar um recurso persistente, consulte a publicação no blogue Apresentamos a garantia de capacidade e tempos de arranque mais rápidos no Vertex AI Training.

Detalhes de faturação

A faturação é feita durante todo o período em que um recurso persistente está em estado de execução, independentemente de existir um trabalho em execução no recurso persistente. Para cada instância no conjunto de recursos persistente, a faturação é feita por hora de núcleo. Todos os trabalhos executados num recurso persistente não são cobrados separadamente. Só lhe é cobrado o recurso persistente.

Se configurar a escala automática para o seu recurso persistente, só paga pelas instâncias aprovisionadas. Por exemplo, se min-replica-count estiver definido como 4, são sempre aprovisionadas 4 instâncias, e este é o valor mínimo que lhe é faturado. Quando a carga de trabalho aumenta, o conjunto de recursos pode ser dimensionado até 6 para acomodar o aumento da procura. Em seguida, são-lhe cobradas as 6 instâncias aprovisionadas até que o conjunto de recursos seja novamente reduzido. Para evitar pagar por nós inativos, use o dimensionamento automático para o seu recurso persistente ou elimine-o quando já não precisar dele. Para saber mais sobre os preços, consulte a secção Modelos personalizados na página de preços do Vertex AI.

Quotas

Os recursos persistentes usam a sua quota de preparação, por isso, verifique se tem quota suficiente para a criação de recursos persistentes. Para saber mais sobre as quotas, consulte o artigo Quotas e limites de preparação.

O que se segue?