Panoramica delle risorse permanenti

Una risorsa permanente di Gemini Enterprise Agent Platform è un cluster a lunga esecuzione che puoi creare per eseguire job di addestramento serverless di Gemini Enterprise Agent Platform. Una volta completato un job di addestramento, la risorsa permanente rimane disponibile per l'esecuzione di altri job di addestramento finché non la elimini. Puoi utilizzare una risorsa permanente per garantire la disponibilità delle risorse di calcolo e ridurre i tempi di avvio del job altrimenti necessari per la creazione delle risorse di calcolo. Le risorse permanenti supportano tutte le VM e le GPU supportate dai job di addestramento serverless. Questa pagina spiega quando utilizzare una risorsa permanente e fornisce informazioni sulla fatturazione e sulla quota.

Quando utilizzare una risorsa permanente

Ti consigliamo di utilizzare le risorse permanenti nei seguenti scenari:

  • Vuoi garantire la disponibilità di capacità per i workload di ML critici o durante le stagioni di picco. A differenza dei job personalizzati, in cui il servizio di addestramento rilascia la risorsa al termine del job, la risorsa permanente rimane disponibile finché non viene eliminata.
  • Stai inviando lo stesso job più volte e puoi usufruire della memorizzazione nella cache di dati e immagini eseguendo i job sulla stessa risorsa permanente.
  • Esegui molti job di addestramento di breve durata in cui il tempo di addestramento effettivo è inferiore al tempo di avvio del job.

Per ulteriori informazioni su quando e perché utilizzare una risorsa permanente, consulta il post del blog Bringing capacity assurance and faster startup times to Gemini Enterprise Agent Platform Training.

Dettagli di fatturazione

Ti viene addebitato l'intero periodo di tempo in cui una risorsa permanente è in stato di esecuzione, indipendentemente dal fatto che sia in esecuzione un job sulla risorsa permanente. Per ogni istanza nel pool di risorse permanenti, ti viene addebitata l'ora di core. Tutti i job in esecuzione su una risorsa permanente non vengono addebitati separatamente. Ti viene addebitato solo il costo della risorsa permanente.

Se configuri la scalabilità automatica per la risorsa permanente, paghi solo le istanze di cui è stato eseguito il provisioning. Ad esempio, se min-replica-count è impostato su 4, vengono sempre sottoposte a provisioning 4 istanze e questo è l'importo minimo che ti viene addebitato per. Quando il workload aumenta, il pool di risorse potrebbe fare lo scale up fino a 6 per soddisfare la maggiore domanda. Ti vengono addebitati i costi per le 6 istanze di cui è stato eseguito il provisioning finché il pool di risorse non viene ridimensionato di nuovo. Per evitare di pagare per i nodi inattivi, utilizza la scalabilità automatica per la risorsa permanente o eliminala quando non ti serve più. Per saperne di più sui prezzi, consulta la sezione Modelli con addestramento personalizzato nella pagina dei prezzi di Gemini Enterprise Agent Platform.

Quote

Le risorse permanenti utilizzano la quota di addestramento, quindi verifica di avere una quota sufficiente per la creazione di risorse permanenti. Per saperne di più sulle quote, consulta Quote e limiti di addestramento.

Passaggi successivi