Vous pouvez configurer un déploiement inter-projets pour Dataproc Metastore afin de séparer les ressources suivantes :
- Le service Dataproc Metastore.
- Le cluster Managed Service pour Apache Spark associé au service Dataproc Metastore.
- Le réseau utilisé par le cluster Managed Service pour Apache Spark.
Avant de commencer
- Activez Dataproc Metastore dans votre projet.
- Créez un service Dataproc Metastore.
- Comprenez les exigences réseau spécifiques à votre projet.
Rôles requis
Pour obtenir les autorisations nécessaires pour créer un cluster Dataproc Metastore et Managed Service pour Apache Spark, demandez à votre administrateur de vous accorder les rôles IAM suivants :
-
Pour accorder un contrôle total des ressources Dataproc Metastore :
Éditeur Dataproc Metastore (
roles/metastore.editor) sur le projet de métastore.
Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.
Vous pouvez également obtenir les autorisations requises avec des rôles personnalisés ou d'autres rôles prédéfinis.
Pour en savoir plus sur les rôles et autorisations Dataproc Metastore spécifiques, consultez Gérer l'accès avec IAM.À propos des déploiements inter-projets
Un déploiement inter-projets pour Dataproc Metastore peut comporter les configurations suivantes :
Deux projets :
- Le projet 1 contient le cluster Managed Service pour Apache Spark (projet de cluster).
- Le projet 2 contient le service Dataproc Metastore et le réseau (projet de métastore et projet réseau).
Deux projets :
- Le projet 1 contient le cluster Managed Service pour Apache Spark.
- Le projet 2 contient le service Dataproc Metastore et le réseau (projet de métastore et projet réseau).
Deux projets :
- Le projet 1 contient le cluster Managed Service pour Apache Spark et le service Dataproc Metastore (projet de cluster et projet de métastore).
- Le projet 2 contient le réseau (projet réseau).
Trois projets :
- Le projet 1 contient le cluster Managed Service pour Apache Spark (projet de cluster).
- Le projet 2 contient le service Dataproc Metastore (projet de métastore).
- Le projet 3 contient le réseau (projet réseau).
Le schéma suivant présente les configurations de projet possibles que vous pouvez utiliser.
Autorisations inter-projets
Avant de configurer les autorisations inter-projets, déterminez si elles sont nécessaires pour votre configuration :
Vous devez configurer des autorisations inter-projets supplémentaires
Si votre cluster Managed Service pour Apache Spark et votre service Dataproc Metastore se trouvent dans des projets distincts.
Si votre service Dataproc Metastore et votre réseau se trouvent dans des projets distincts.
Configurer les autorisations inter-projets
Si le projet de cluster et le projet de métastore se trouvent dans des projets distincts, accordez les rôles suivants :
roles/metastore.userau compte de l'agent de service Managed Service pour Apache Spark du projet de cluster (contenu dans la stratégie IAM du projet de métastore). Cette configuration s'applique aux protocoles de point de terminaison Thrift et gRPC.
Si le projet réseau et le projet de métastore se trouvent dans des projets distincts, accordez les rôles suivants :
roles/metastore.serviceAgentà l'agent de service du projet de métastore (contenu dans la stratégie IAM du projet réseau). Cette configuration ne s'applique qu'au protocole de point de terminaison Thrift.
Console
Pour trouver le numéro de votre projet :
Accédez à l'onglet Settings (Paramètres) de IAM et admin.
Dans la liste des projets en haut de la page, sélectionnez le projet que vous souhaitez utiliser pour créer le cluster Managed Service pour Apache Spark.
Notez le numéro du projet.
Configurez les autorisations:
Accédez à l'onglet IAM.
Dans la liste des projets en haut de la page, sélectionnez le projet de métastore.
Cliquez sur Ajouter.
Saisissez le compte de service dans le champ Nouveaux comptes principaux.
Dans le menu "Rôles", sélectionnez Dataproc Metastore > Lecteur Dataproc Metastore.
Cliquez sur Ajouter.
Une fois les étapes précédentes effectuées, vous pouvez créer un cluster Managed Service pour Apache Spark associé à un service Dataproc Metastore. Notez que pour ce faire, la configuration du réseau ou du sous-réseau du cluster Managed Service pour Apache Spark doit correspondre au réseau ou au sous-réseau Dataproc Metastore.
Exemple :
gcloud metastore services create SERVICE \
--network=projects/HOST_PROJECT/global/networks/NETWORK_IDÉtape suivante
- Guide de démarrage rapide pour le déploiement de Dataproc Metastore
- Présentation de Dataproc Metastore
- Présentation de Managed Service pour Apache Spark