Um recurso persistente da Vertex AI é um cluster de execução prolongada que pode criar para executar tarefas de preparação personalizadas. Após a conclusão de uma tarefa de preparação, o recurso persistente permanece disponível para executar outras tarefas de preparação até o eliminar. Pode usar um recurso persistente para garantir a disponibilidade de recursos de computação e reduzir o tempo de início da tarefa que, de outra forma, é necessário para a criação de recursos de computação. Os recursos persistentes suportam todas as VMs e GPUs que são suportadas por tarefas de preparação personalizadas. Esta página explica quando usar um recurso persistente e dá-lhe informações sobre a faturação e a quota.
Quando usar um recurso persistente
Recomendamos a utilização de recursos persistentes nos seguintes cenários:
- Quer garantir a disponibilidade de capacidade para cargas de trabalho de ML críticas ou durante as temporadas de pico. Ao contrário das tarefas personalizadas, em que o serviço de preparação liberta o recurso após a conclusão da tarefa, o recurso persistente permanece disponível até ser eliminado.
- Está a enviar a mesma tarefa várias vezes e pode beneficiar da colocação em cache de dados e imagens executando as tarefas no mesmo recurso persistente.
- Executa muitos trabalhos de preparação de curta duração em que o tempo de preparação real é inferior ao tempo de início do trabalho.
Para mais contexto sobre quando e por que motivo usar um recurso persistente, consulte a publicação no blogue Apresentamos a garantia de capacidade e tempos de arranque mais rápidos no Vertex AI Training.
Detalhes de faturação
A faturação é feita durante todo o período em que um recurso persistente está em estado de execução, independentemente de existir um trabalho em execução no recurso persistente. Para cada instância no conjunto de recursos persistente, a faturação é feita por hora de núcleo. Todos os trabalhos executados num recurso persistente não são cobrados separadamente. Só lhe é cobrado o recurso persistente.
Se configurar a escala automática para o seu recurso persistente, só paga pelas instâncias aprovisionadas. Por exemplo, se min-replica-count
estiver definido como 4
, são sempre aprovisionadas 4
instâncias, e este é o valor mínimo que lhe é faturado. Quando a carga de trabalho aumenta, o conjunto de recursos pode ser dimensionado até 6
para
acomodar o aumento da procura. Em seguida, são-lhe cobradas as 6
instâncias aprovisionadas
até que o conjunto de recursos seja novamente reduzido. Para evitar pagar por nós inativos,
use o dimensionamento automático para o seu recurso persistente ou elimine-o quando já não
precisar dele. Para saber mais sobre os preços, consulte a secção Modelos personalizados na página de preços do Vertex AI.
Quotas
Os recursos persistentes usam a sua quota de preparação, por isso, verifique se tem quota suficiente para a criação de recursos persistentes. Para saber mais sobre as quotas, consulte o artigo Quotas e limites de preparação.
O que se segue?
- Crie e use um recurso persistente.
- Executar tarefas de preparação num recurso persistente.
- Receba informações sobre um recurso persistente.
- Reinicie um recurso persistente.
- Elimine um recurso persistente.