Questa pagina spiega come ripristinare un servizio Dataproc Metastore da un backup.
Un backup è uno snapshot delle impostazioni di configurazione e dei metadati archiviati in un servizio Dataproc Metastore. Puoi utilizzare la funzionalità di ripristino per configurare rapidamente un nuovo servizio Dataproc Metastore con i dati salvati in precedenza in un backup.
Prima di iniziare
- Abilita Dataproc Metastore nel tuo progetto.
- Crea un servizio Dataproc Metastore.
- Esegui il backup di un servizio Dataproc Metastore.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per ripristinare un servizio Dataproc Metastore da un backup, chiedi all'amministratore di concederti i seguenti ruoli IAM:
-
Per concedere il controllo completo delle risorse Dataproc Metastore per completare un backup, puoi utilizzare:
-
Editor Dataproc Metastore (
roles/metastore.editor) sul servizio di metadati. -
Amministratore Dataproc Metastore (
roles/metastore.admin) sul progetto.
-
Editor Dataproc Metastore (
-
Per utilizzare l'oggetto Cloud Storage che archivia i backup pianificati:
Utente oggetti Cloud Storage (
roles/storage.objectUser) sull'agente del servizio Dataproc Metastore
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Questi ruoli predefiniti contengono le autorizzazioni necessarie per ripristinare un servizio Dataproc Metastore da un backup. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:
Autorizzazioni obbligatorie
Per ripristinare un servizio Dataproc Metastore da un backup sono necessarie le seguenti autorizzazioni:
-
Per ripristinare un servizio di metadati:
metastore.services.restore, metastore.backups.use -
Per utilizzare l'oggetto Cloud Storage:
-
orgpolicy.policy.get -
resourcemanager.projects.get -
resourcemanager.projects.list -
storage.managedFolders.create -
storage.managedFolders.delete -
storage.managedFolders.get -
storage.managedFolders.list -
storage.multipartUploads.* -
storage.objects.create -
storage.objects.delete -
storage.objects.get -
storage.objects.list -
storage.objects.restore -
storage.objects.update
-
Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.
Per saperne di più sui ruoli e sulle autorizzazioni specifici di Dataproc Metastore, consulta Panoramica di IAM di Dataproc Metastore.Informazioni sul ripristino da un backup
Quando ripristini un servizio da un backup, puoi scegliere una delle seguenti opzioni:
- Ripristina tutti i metadati e le impostazioni di configurazione salvate nel backup.
Ripristina tutti i metadati, ma non le impostazioni di configurazione salvate nel backup. Il servizio mantiene invece le impostazioni di configurazione correnti.
Le impostazioni di configurazione includono i parametri di Dataproc Metastore, come il nome del servizio, il numero di porta e le impostazioni della rete. I metadati includono tutte le informazioni su database e tabelle archiviate in un servizio Dataproc Metastore.
Considerazioni
Durante l'esecuzione di un'operazione di ripristino, non puoi aggiornare il servizio, ad esempio non puoi modificare le impostazioni di configurazione. Tuttavia, puoi comunque utilizzare il servizio per le operazioni normali, ad esempio per accedere ai metadati dai cluster Managed Service for Apache Spark o autogestiti collegati.
Le etichette di Dataproc Metastore non vengono ripristinate.
I dati archiviati nella directory del warehouse non vengono ripristinati.
Il ripristino da un backup non ripristina né sostituisce le policy IAM granulari.
Per eseguire il ripristino da un backup pianificato, il backup deve trovarsi in un bucket Cloud Storage.
Ripristina da un backup
Per ripristinare un servizio Dataproc Metastore da un backup, completa i seguenti passaggi.
Se utilizzi la Google Cloud console, puoi ripristinare i metadati solo da un backup creato nello stesso progetto e nella stessa regione del nuovo servizio.
Se utilizzi Google Cloud CLI o le API Dataproc Metastore, puoi ripristinare i metadati da un backup creato in un progetto e in una regione diversi (backup tra servizi).
Console
Nella Google Cloud console, apri la pagina Dataproc Metastore:
Nella pagina Dataproc Metastore, fai clic sul nome del servizio di cui vuoi eseguire il ripristino da un backup.
Viene visualizzata la pagina Dettagli servizio.
Figura 1. Pagina dei dettagli del servizio Dataproc Metastore Per visualizzare i backup, fai clic sulla scheda Backup/Ripristino.
Seleziona il backup che vuoi utilizzare. Per farlo, fai clic sull'icona del menu e seleziona Ripristina.
Viene visualizzata la pagina Ripristina.
Puoi anche ripristinare il servizio nella pagina Dettagli backup. Per farlo, fai clic sul nome del backup e poi su Ripristina.
Seleziona l'operazione di ripristino appropriata:
- Ripristina dati metastore. Ripristina tutti i metadati, ma non le impostazioni di configurazione salvate nel backup.
- Ripristina dati metastore e configurazione del servizio. Ripristina tutti i metadati e tutte le impostazioni di configurazione salvate nel backup.
Per aggiornare il servizio, fai clic su Ripristina.
Torna alla pagina Dataproc Metastore e verifica che il backup del servizio sia stato eseguito correttamente.
Al termine del ripristino, Dataproc Metastore torna automaticamente allo stato attivo, indipendentemente dall'esito del ripristino.
gcloud CLI
Per ripristinare un servizio Dataproc Metastore, esegui il seguente
gcloud metastore services restorecomando:gcloud metastore services restore SERVICE \ --project=PROJECT_ID \ --location=LOCATION \ --backup=BACKUP \ --restore-type=RESTORE_TYPE \ --backup-location=BACKUP_LOCATIONSostituisci quanto segue:
SERVICE: il nome del servizio Dataproc Metastore.PROJECT_ID: l'ID progetto in cui si trova il servizio Dataproc Metastore. Google CloudLOCATION: la Google Cloud regione in cui si trova il servizio Dataproc Metastore.BACKUP: (facoltativo) l'identificatore del file di backup da cui stai eseguendo il ripristino. Questo valore può essere l'ID backup, un URL completo o il nome relativo nel seguente formato:projects/{project_id}/locations/{location_id}/services/{service_id}/backups/{backup_id}.RESTORE_TYPE: il tipo di operazione di ripristino da eseguire. I valori accettati sonometadata-onlyofull. Il valore predefinito èmetadata-only.BACKUP_LOCATION: (facoltativo) la località Cloud Storage del backup pianificato. Ad esempio:gs://my-bucket/path/to/location.
Verifica che l'operazione di ripristino sia stata eseguita correttamente.
Al termine del ripristino, Dataproc Metastore torna automaticamente allo stato attivo, indipendentemente dall'esito del ripristino.
REST
Segui le istruzioni dell'API per ripristinare i metadati in un servizio utilizzando l'Explorer API.
Al termine del ripristino, Dataproc Metastore automaticamente torna allo stato attivo, indipendentemente dall'esito del ripristino.
Visualizza la cronologia dei ripristini
Per visualizzare la cronologia dei ripristini di un servizio Dataproc Metastore in the Google Cloud console, completa i seguenti passaggi:
- Nella Google Cloud console, apri la pagina Dataproc Metastore.
Nella barra di navigazione, fai clic su Backup/Ripristino.
La cronologia dei ripristini viene visualizzata in una tabella in Ripristina.
La cronologia mostra gli ultimi 25 ripristini completati.
L'eliminazione di un servizio Dataproc Metastore comporta anche l'eliminazione di tutta la cronologia dei ripristini associata.
Risolvere i problemi comuni
- L'agente di servizio o l'account utente non dispone delle autorizzazioni necessarie.
- Per ulteriore assistenza nella risoluzione dei problemi comuni, consulta Scenari di errore di backup e ripristino.