Eseguire la migrazione di un metastore MySQL autogestito a Dataproc Metastore
Questa pagina mostra come eseguire la migrazione del metastore MySQL autogestito esterno a Dataproc Metastore creando un file di dump MySQL e importando i metadati in un servizio Dataproc Metastore esistente.
Prima di iniziare
- Accedi al tuo Google Cloud account. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti senza costi per l'esecuzione, il test e il deployment dei workload.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Abilita l'API Dataproc Metastore.
Ruoli richiesti per abilitare le API
Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo servizi (
roles/serviceusage.serviceUsageAdmin), che contiene l'autorizzazioneserviceusage.services.enable. Scopri come concedere i ruoli.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per creare un Dataproc Metastore e importare un metastore MySQL, chiedi all'amministratore di concederti i seguenti ruoli IAM:
-
Per creare un servizio e importare i metadati:
- Editor Dataproc Metastore (
roles/metastore.editor) sul progetto - Amministratore Dataproc Metastore (
roles/metastore.admin) sul progetto.
- Editor Dataproc Metastore (
-
Per utilizzare l'oggetto Cloud Storage (file di dump SQL) per l'importazione:
- Visualizzatore oggetti Storage (
roles/storage.objectViewer) sull'agente di servizio Dataproc Metastore. Ad esempio,service-CUSTOMER_PROJECT_NUMBER@gcp-sa-metastore.iam.gserviceaccount.com. - Visualizzatore oggetti Storage (
roles/storage.objectViewer) sull'account utente.
- Visualizzatore oggetti Storage (
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Questi ruoli predefiniti contengono le autorizzazioni necessarie per creare un Dataproc Metastore e importare un metastore MySQL. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:
Autorizzazioni obbligatorie
Per creare un Dataproc Metastore e importare un metastore MySQL sono necessarie le seguenti autorizzazioni:
-
Per creare un servizio:
metastore.services.createsul progetto. -
Per importare i metadati:
metastore.imports.createsul progetto. -
Per utilizzare l'oggetto Cloud Storage (file di dump SQL) per l'importazione:
-
storage.objects.getsull'agente di servizio Dataproc Metastore. Ad esempio,service-CUSTOMER_PROJECT_NUMBER@gcp-sa-metastore.iam.gserviceaccount.com -
storage.objects.getsull'account utente.
-
Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.
Per saperne di più sui ruoli e sulle autorizzazioni specifici di Dataproc Metastore, consulta Gestire l'accesso a Managed Service for Apache Spark con IAM.Crea un servizio Dataproc Metastore
Le seguenti istruzioni mostrano come creare un servizio Dataproc Metastore in cui puoi eseguire la migrazione del file di dump SQL.
Console
Nella Google Cloud console, apri la pagina Crea servizio:
La pagina Crea servizio di Dataproc Metastore Nel campo Nome servizio, inserisci
example-service.Seleziona la località dei dati. Per informazioni sulla selezione di una regione, vedi Località cloud.
Per le altre opzioni di configurazione del servizio, utilizza le impostazioni predefinite fornite.
Per creare e avviare il servizio, fai clic sul pulsante Invia.
Il nuovo servizio viene visualizzato nell'elenco Servizi.
gcloud
Esegui il seguente gcloud metastore services create
comando per creare un servizio:
gcloud metastore services create example-service \
--location=LOCATION
Sostituisci LOCATION con la regione di Compute Engine
in cui prevedi di creare il servizio. Assicurati che Dataproc Metastore sia disponibile
nella regione.
REST
Segui le istruzioni dell'API per creare un servizio utilizzando Explorer API.
Preparati per la migrazione
Ora devi preparare i metadati archiviati nel database del metastore Hive per l'importazione creando un file di dump MySQL e inserendolo in un bucket Cloud Storage.
Per i passaggi di preparazione alla migrazione, consulta Preparare i file di importazione prima dell'importazione.
Importa i metadati
Ora che hai preparato il file di dump, importalo nel servizio Dataproc Metastore.
Per i passaggi per importare i metadati nel servizio example-service, consulta Importare i file in Dataproc Metastore.
Crea e collega un cluster Managed Service for Apache Spark
Dopo aver importato i metadati nel servizio Dataproc Metastore
example-service, crea e collega un cluster Managed Service for Apache Spark
che utilizza il servizio come metastore Hive.
Libera spazio
Per evitare che al tuo Google Cloud account vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi.
- Nella Google Cloud console, vai alla pagina Gestisci risorse.
- Se il progetto che prevedi di eliminare è collegato a un'organizzazione, espandi l'elenco Organizzazione nella colonna Nome.
- Nell'elenco dei progetti, seleziona il progetto che vuoi eliminare, quindi fai clic su Elimina.
- Nella finestra di dialogo, digita l'ID progetto, quindi fai clic su Chiudi per eliminare il progetto.
In alternativa, puoi eliminare le risorse utilizzate in questo tutorial:
Elimina il servizio Dataproc Metastore.
Console
Nella Google Cloud console, apri la pagina Dataproc Metastore:
A sinistra del nome del servizio, seleziona
example-serviceselezionando la casella.Nella parte superiore della pagina Dataproc Metastore, fai clic su Elimina per eliminare il servizio.
Nella finestra di dialogo, fai clic su Elimina per confermare l'eliminazione.
Il servizio non viene più visualizzato nell'elenco Servizi.
gcloud
Esegui il seguente comando
gcloud metastore services deleteper eliminare un servizio:gcloud metastore services delete example-service \ --location=LOCATIONSostituisci
LOCATIONcon la regione di Compute Engine in cui hai creato il servizio.REST
Segui le istruzioni dell'API per eliminare un servizio utilizzando Explorer API.
Tutte le eliminazioni vengono eseguite immediatamente.
Elimina il bucket Cloud Storage per il servizio Dataproc Metastore.