Una risorsa permanente Vertex AI è un cluster a lunga esecuzione che puoi creare per eseguire job di addestramento serverless Vertex AI. Al termine di un job di addestramento, la risorsa permanente rimane disponibile per l'esecuzione di altri job di addestramento finché non la elimini. Puoi utilizzare una risorsa permanente per garantire la disponibilità delle risorse di calcolo e ridurre i tempi di avvio del job altrimenti necessari per la creazione delle risorse di calcolo. Le risorse permanenti supportano tutte le VM e le GPU supportate dai job di addestramento serverless. Questa pagina spiega quando utilizzare una risorsa persistente e fornisce informazioni su fatturazione e quota.
Quando utilizzare una risorsa permanente
Ti consigliamo di utilizzare risorse persistenti nei seguenti scenari:
- Vuoi garantire la disponibilità della capacità per i carichi di lavoro ML critici o durante le stagioni di picco. A differenza dei job personalizzati, in cui il servizio di addestramento rilascia la risorsa al termine del job, la risorsa permanente rimane disponibile finché non viene eliminata.
- Invii lo stesso job più volte e puoi trarre vantaggio dalla memorizzazione nella cache di dati e immagini eseguendo i job sulla stessa risorsa permanente.
- Esegui molti job di addestramento di breve durata in cui il tempo di addestramento effettivo è inferiore al tempo di avvio del job.
Per ulteriori informazioni su quando e perché utilizzare una risorsa permanente, consulta il post del blog Bringing capacity assurance and faster startup times to Vertex AI Training.
Dettagli di fatturazione
Ti viene addebitato l'intero periodo di tempo in cui una risorsa permanente è in stato di esecuzione, indipendentemente dal fatto che sia in esecuzione un job sulla risorsa permanente. Per ogni istanza nel pool di risorse persistenti, la fatturazione avviene in base alle ore di utilizzo dei core. Tutti i job in esecuzione su una risorsa permanente non vengono addebitati separatamente. Ti viene addebitato solo il costo della risorsa permanente.
Se configuri la scalabilità automatica per la risorsa permanente, paghi solo
le istanze di cui è stato eseguito il provisioning. Ad esempio, se min-replica-count è impostato su 4,
viene sempre eseguito il provisioning di 4 istanze e questo è l'importo minimo che ti viene fatturato. Quando il workload aumenta, il pool di risorse potrebbe scalare fino a 6 per
soddisfare la maggiore domanda. Dopodiché, ti vengono addebitate le 6 istanze di cui è stato eseguito il provisioning
finché il pool di risorse non viene ridimensionato di nuovo. Per evitare di pagare per i nodi inattivi,
utilizza la scalabilità automatica per la risorsa permanente o eliminala quando non ti serve più. Per scoprire di più sui prezzi, consulta la sezione Modelli con addestramento personalizzato
nella pagina Prezzi di Vertex AI.
Quote
Le risorse permanenti utilizzano la quota di addestramento, quindi verifica di avere una quota sufficiente per la creazione di risorse permanenti. Per saperne di più sulle quote, consulta Quote e limiti di addestramento.
Passaggi successivi
- Crea e utilizza una risorsa permanente.
- Esegui job di addestramento su una risorsa permanente.
- Recuperare informazioni su una risorsa permanente.
- Riavvia una risorsa permanente.
- Eliminare una risorsa permanente.