Opzioni di archiviazione per i dati di Cloud TPU
Questo documento descrive le opzioni di archiviazione dei dati che puoi utilizzare durante l'addestramento dei modelli su Cloud TPU.
Introduzione
Cloud TPU richiede l'archiviazione dei dati per:
- Download e pre-elaborazione dei set di dati
- Elaborazione della pipeline di input dell'host
- Input di addestramento del modello
- Output di addestramento del modello
Le opzioni di archiviazione per i dati delle applicazioni TPU e i set di dati di addestramento sono:
- Archiviazione a blocchi durevole, inclusi il disco di avvio e i dischi di archiviazione collegati
- Bucket Cloud Storage
- Cloud Storage FUSE
- Condivisione file di Filestore su una VM TPU
- Condivisione file di Managed Lustre
Per ulteriori informazioni sulla gestione dello spazio di archiviazione, consulta le seguenti pagine:
- Scegliere un tipo di disco
- Configurare i dischi per soddisfare i requisiti di prestazioni
- Prezzi dei dischi e delle immagini
Archiviazione a blocchi durevole
L'archiviazione a blocchi durevole, nota anche come dischi o volumi, è destinata ai dati che vuoi conservare dopo aver arrestato, sospeso o eliminato la VM TPU. L'archiviazione a blocchi durevole è ancora disponibile anche se la VM TPU si arresta in modo anomalo o smette di funzionare. Puoi utilizzare il disco di avvio della VM TPU o collegare ulteriore spazio di archiviazione a blocchi alla TPU.
Potresti voler collegare un disco aggiuntivo nei seguenti scenari:
- Le dimensioni del set di dati di addestramento superano le dimensioni del disco di avvio della TPU.
- Hai dati di sola lettura e vuoi un accesso in lettura più rapido utilizzando un volume Hyperdisk ML.
Generazione TPU e tipi di dischi supportati
La tabella seguente mostra i tipi di dischi supportati da ogni generazione di TPU:
| Generazione TPU | Tipi di dischi supportati |
|---|---|
| TPU7x | Hyperdisk bilanciato, Hyperdisk ML |
| TPU v6e | Hyperdisk bilanciato, Hyperdisk ML |
| TPU v5p | Balanced Persistent Disk, Hyperdisk ML |
| TPU v5e | Balanced Persistent Disk, Hyperdisk ML |
Disco di avvio della VM TPU
Per impostazione predefinita, ogni VM TPU ha un singolo disco di avvio da 10 GB. Quando crei le VM, puoi configurare un disco di avvio più grande. Per ulteriori informazioni, consulta Creare un disco di avvio personalizzato. Il disco di avvio contiene il sistema operativo, i driver TPU e le librerie. Il disco di avvio può anche archiviare temporaneamente i set di dati scaricati per la pre-elaborazione e i dati di input e output del modello, a condizione che le dimensioni totali dei dati non superino lo spazio disponibile sul disco di avvio.
Se la tua applicazione richiede ulteriore spazio di archiviazione oltre a quello predefinito del disco di avvio, puoi aggiungere uno o più dischi durevoli all'istanza VM TPU. Per ulteriori informazioni, consulta:
- Aggiungere un disco permanente alla VM
- Aggiungere un disco Google Cloud Hyperdisk
- Modificare gli Hyperdisk
- Ridimensionare un disco permanente
Spazio di archiviazione collegato
Sia Hyperdisk sia Persistent Disk sono dispositivi di archiviazione di rete durevoli a cui le istanze VM possono accedere come se si trattasse di dischi fisici su un computer desktop o un server. Entrambi i tipi di dischi vengono creati indipendentemente dalle istanze VM, quindi puoi conservare i dati anche dopo aver eliminato la VM.
I vantaggi dell'utilizzo di Hyperdisk rispetto a Persistent Disk includono prestazioni personalizzabili, limiti di IOPS e throughput più elevati. Per ulteriori informazioni su Hyperdisk e Persistent Disk, consulta Scegliere un tipo di disco.
Quando colleghi un disco a un MIG con uno slice di VM TPU multi-host, il sistema collega il disco a ogni VM in quello slice TPU. Per impedire a due o più VM TPU di scrivere su un disco contemporaneamente, devi configurare tutti i dischi collegati a uno slice TPU multi-host come di sola lettura. I dischi di sola lettura sono utili per archiviare un set di dati per l'elaborazione su uno slice TPU. Poiché Hyperdisk bilanciato non supporta la modalità di sola lettura, puoi collegare un volume Hyperdisk bilanciato solo a una singola istanza VM TPU.
Per ulteriori informazioni sull'utilizzo dell'archiviazione a blocchi durevole, consulta Aggiungere un disco permanente alla VM e Aggiungere un disco Hyperdisk.
Backup dei dischi
Potrebbe essere difficile recuperare i dati dal disco di avvio se la VM TPU si blocca in uno stato "sconosciuto" o recuperare i dati eliminati. Esegui il backup dei dati utilizzando un'altra opzione di archiviazione, ad esempio i bucket Cloud Storage.
Se archivi i dati su un disco collegato, puoi utilizzare gli snapshot dei dischi, che eseguono il backup incrementale dei dati su un disco. Il disco di avvio della VM TPU non supporta gli snapshot dei dischi. Per ulteriori informazioni, consulta Informazioni sugli snapshot dei dischi.
Bucket Cloud Storage
I bucket Cloud Storage sono opzioni di archiviazione flessibili, scalabili e durevoli per le istanze VM. Se il job di addestramento non richiede la latenza inferiore dell'archiviazione a blocchi durevole, puoi archiviare il set di dati in un bucket Cloud Storage.
Il rendimento dei bucket Cloud Storage dipende dalla classe di archiviazione selezionata e dalla posizione del bucket rispetto all'istanza.
La creazione del bucket Cloud Storage nella stessa zona della VM TPU offre prestazioni paragonabili all'archiviazione a blocchi durevole, ma con una latenza maggiore e caratteristiche di throughput meno coerenti.
Tutti i bucket Cloud Storage hanno una ridondanza integrata per proteggere i dati da guasti dell'apparecchiatura e per garantire la disponibilità dei dati tramite eventi di manutenzione del data center. Cloud Storage calcola i checksum per tutte le operazioni per garantire che ciò che leggi sia ciò che hai scritto.
A differenza dell'archiviazione a blocchi durevole, i bucket Cloud Storage non ti limitano alla zona in cui si trova l'istanza. Inoltre, puoi leggere e scrivere dati in un bucket da più istanze contemporaneamente. Ad esempio, puoi configurare le istanze in più zone per leggere e scrivere dati nello stesso bucket anziché replicare i dati nell'archiviazione a blocchi durevole in più zone.
Per ulteriori informazioni, consulta Connettersi ai bucket Cloud Storage.
Cloud Storage FUSE
Cloud Storage FUSE consente di montare e accedere ai bucket Cloud Storage come file system locali. In questo modo, le applicazioni possono leggere e scrivere oggetti nel bucket utilizzando la semantica standard del file system.
Consulta la documentazione di Cloud Storage FUSE per i dettagli sul funzionamento di Cloud Storage FUSE e una descrizione di come le operazioni di Cloud Storage FUSE vengono mappate alle operazioni di Cloud Storage. Puoi trovare ulteriori informazioni su come utilizzare Cloud Storage FUSE, ad esempio come installare la CLI di Cloud Storage FUSE e montare i bucket su GitHub.
Condivisione file di Filestore
La condivisione file di Filestore è uno spazio di archiviazione di rete (NAS) completamente gestito per Compute Engine. Filestore offre compatibilità con le applicazioni aziendali esistenti e supporta qualsiasi client compatibile con NFSv3.
Filestore offre una bassa latenza per le operazioni con i file. Per i carichi di lavoro sensibili alla latenza, Filestore supporta una capacità fino a 100 TiB e una velocità effettiva di 25 GiB al secondo e 720.000 IOPS, con una variabilità minima delle prestazioni.
Con Filestore, puoi montare le condivisioni file sulle VM TPU.
Condivisione file di Managed Lustre
Managed Lustre è un file system parallelo completamente gestito per carichi di lavoro di AI e HPC che fanno un uso intensivo di dati. Offre prestazioni elevate, capacità di scalabilità multi-petabyte e conformità POSIX.
Con Managed Lustre, puoi montare le condivisioni file sulle VM TPU. È particolarmente utile per la gestione di set di dati di grandi dimensioni e requisiti di throughput elevati dei carichi di lavoro di machine learning, consentendo un addestramento e un'inferenza efficienti.
Per ulteriori informazioni, consulta la documentazione di Managed Lustre.
Passaggi successivi
- Scopri come aggiungere un disco permanente alla tua VM.
- Scopri come aggiungere un disco Google Cloud Hyperdisk alla tua VM.
- Scopri come connettere l'istanza a un bucket Cloud Storage.
- Scopri come montare una condivisione file di Filestore.