Una risorsa persistente di Gemini Enterprise Agent Platform è un cluster a lunga esecuzione che puoi creare per eseguire job di addestramento serverless di Gemini Enterprise Agent Platform. Una volta completato un job di addestramento, la risorsa permanente rimane disponibile per l'esecuzione di altri job di addestramento finché non la elimini. Puoi utilizzare una risorsa permanente per garantire la disponibilità delle risorse di calcolo e ridurre i tempi di avvio del job altrimenti necessari per la creazione delle risorse di calcolo. Le risorse permanenti supportano tutte le VM e le GPU supportate dai job di addestramento serverless. Questa pagina spiega quando utilizzare una risorsa permanente e fornisce informazioni su fatturazione e quota.
Quando utilizzare una risorsa permanente
Ti consigliamo di utilizzare risorse permanenti nei seguenti scenari:
- Vuoi garantire la disponibilità di capacità per i workload ML critici o durante le stagioni di picco. A differenza dei job personalizzati, in cui il servizio di addestramento rilascia la risorsa al termine del job, la risorsa permanente rimane disponibile finché non viene eliminata.
- Invii lo stesso job più volte e puoi usufruire della memorizzazione nella cache di dati e immagini eseguendo i job sulla stessa risorsa permanente.
- Esegui molti job di addestramento di breve durata in cui il tempo di addestramento effettivo è inferiore al tempo di avvio del job.
Per ulteriori informazioni su quando e perché utilizzare una risorsa persistente, consulta il post del blog Bringing capacity assurance and faster startup times to Gemini Enterprise Agent Platform Training.
Dettagli di fatturazione
Ti viene addebitato l'intero periodo di tempo in cui una risorsa permanente è in stato di esecuzione, indipendentemente dal fatto che sia in esecuzione un job sulla risorsa permanente. Per ogni istanza nel pool di risorse persistenti, la fatturazione avviene in base all'ora di core. Tutti i job in esecuzione su una risorsa permanente non vengono addebitati separatamente. Ti viene addebitato solo il costo della risorsa permanente.
Se configuri la scalabilità automatica per la risorsa persistente, paghi solo per le istanze di cui è stato eseguito il provisioning. Ad esempio, se min-replica-count è impostato su 4, vengono sempre sottoposte a provisioning 4 istanze e questo è l'importo minimo che ti viene addebitato. Quando il workload aumenta, il pool di risorse potrebbe fare lo scale up fino a 6 per soddisfare l'aumento della domanda. A questo punto, ti vengono addebitate le 6 istanze di cui è stato eseguito il provisioning finché il pool di risorse non viene fatto lo scale down di nuovo. Per evitare di pagare per i nodi inattivi, utilizza la scalabilità automatica per la risorsa persistente o eliminala quando non ti serve più. Per saperne di più sui prezzi, consulta la sezione Modelli personalizzati addestrati nella pagina dei prezzi della Gemini Enterprise Agent Platform.
Quote
Le risorse permanenti utilizzano la quota di addestramento, quindi verifica di avere una quota sufficiente per la creazione di risorse permanenti. Per saperne di più sulle quote, consulta Quote e limiti di addestramento.
Passaggi successivi
- Crea e utilizza una risorsa permanente.
- Esegui job di addestramento su una risorsa permanente.
- Recuperare informazioni su una risorsa permanente.
- Riavvia una risorsa permanente.
- Eliminare una risorsa permanente.