Panoramica
Quando crei un cluster Managed Service for Apache Spark, l'applicazione Apache Hive e i relativi
componenti, incluso Hive Metastore, vengono installati sul cluster e
una password predefinita viene impostata nel file hive-site.xml che si trova sul
nodo master del cluster.
È consigliabile specificare la propria password del metastore Hive per raggiungere i seguenti obiettivi:
Come misura di sicurezza consigliata per assicurarti di controllare l'accesso al metastore Hive locale fornendo la tua password
Per specificare una password nota che controlla l'accesso ai metastore Hive esterni utilizzati con database esterni condivisi tra cluster diversi
Imposta la password del metastore Hive
Esegui il seguente comando Google Cloud CLI Managed Service for Apache Spark clusters create per creare un cluster Managed Service for Apache Spark e specificare una password per il metastore Hive.
gcloud dataproc clusters create cluster-name --properties="hive:javax.jdo.option.ConnectionPassword=HIVE_METASTORE_PASSWORD"
Note:
- Consulta la sezione Creare una chiave per creare una chiave in Cloud Key Management Service.
- La password del metastore Hive viene memorizzata solo sui nodi master del cluster, non sui nodi worker.
Per ulteriori informazioni sulla protezione dei cluster Managed Service for Apache Spark, consulta Best practice per la sicurezza di Managed Service for Apache Spark.
Scenari non supportati
Managed Service for Apache Spark non supporta i seguenti scenari di metastore Hive, indipendentemente dal fatto che utilizzi la password del metastore Hive predefinita o fornita dall'utente:
Utilizzi un client metastore incorporato nel driver Spark in esecuzione in modalità cluster, in modo che i nodi worker richiedano le password Hive. Questo scenario può causare problemi di connettività con il database metastore, poiché la connessione non viene stabilita tramite il processo
HiveMetaStorein esecuzione sul nodo master di Managed Service for Apache Spark.Disattiva Hive Metastore e
hive-server2per utilizzare il tuo database MySQL. In questo scenario, la proprietàspark.hadoop.javax.jdo.option.ConnectionURL=jdbc:mysql://CLUSTER_NAME-m/metastorenon ha alcun effetto.