Configura una implementación entre proyectos

Puedes configurar una implementación entre proyectos para Dataproc Metastore y separar los siguientes recursos:

  • El servicio de Dataproc Metastore
  • El clúster de Managed Service para Apache Spark adjunto al servicio de Dataproc Metastore
  • La red que usa el clúster de Managed Service para Apache Spark

Antes de comenzar

Funciones requeridas

Para obtener los permisos que necesitas para crear un Dataproc Metastore y un clúster de Managed Service para Apache Spark, pídele a tu administrador que te otorgue los siguientes roles de IAM:

  • Para otorgar control total de los recursos de Dataproc Metastore: Editor de Dataproc Metastore (roles/metastore.editor) en el proyecto de metastore.

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

También puedes obtener los permisos necesarios a través de roles personalizados o cualquier otro rol predefinido.

Para obtener más información sobre los roles y permisos específicos de Dataproc Metastore, consulta Administra el acceso con IAM.

Acerca de las implementaciones entre proyectos

Una implementación entre proyectos para Dataproc Metastore puede constar de las siguientes configuraciones:

  • Dos proyectos:

    • El proyecto uno contiene el clúster de Managed Service para Apache Spark (proyecto de clúster).
    • El proyecto dos contiene el servicio de Dataproc Metastore y la red (proyecto de metastore y proyecto de red).
  • Dos proyectos:

    • El proyecto uno contiene el clúster de Managed Service para Apache Spark.
    • El proyecto dos contiene el servicio de Dataproc Metastore y la red (proyecto de metastore y proyecto de red).
  • Dos proyectos:

    • El proyecto uno contiene el clúster de Managed Service para Apache Spark y el servicio de Dataproc Metastore (proyecto de clúster y proyecto de metastore).
    • El proyecto dos contiene la red (proyecto de red).
  • Tres proyectos:

    • El proyecto uno contiene el clúster de Managed Service para Apache Spark (proyecto de clúster).
    • El proyecto dos contiene el servicio de Dataproc Metastore (proyecto de metastore).
    • El proyecto tres contiene la red (proyecto de red).

En el siguiente diagrama, se proporciona una descripción general de las posibles configuraciones de proyectos que puedes usar.

Descripción general de las posibles configuraciones del proyecto cuando se implementa un clúster de Dataproc Metastore y Managed Service para Apache Spark

Permisos entre proyectos

Antes de configurar los permisos entre proyectos, determina si es necesario para tu configuración:

Debes configurar permisos adicionales entre proyectos

  • Si tu clúster de Managed Service para Apache Spark y el servicio de Dataproc Metastore están en proyectos separados.

  • Si tu servicio de Dataproc Metastore y la red están en proyectos separados.

Configura permisos entre proyectos

Si el proyecto de clúster y el proyecto de metastore están en proyectos separados, otorga los siguientes roles:

  • roles/metastore.user a la cuenta del agente de servicio de Managed Service para Apache Spark del proyecto de clúster (que se encuentra en la política de IAM del proyecto de metastore). Esta configuración se aplica a los protocolos de extremos Thrift y gRPC.

Si el proyecto de red y el proyecto de metastore están en proyectos separados, otorga los siguientes roles:

Console

Para encontrar el número de tu proyecto, haz lo siguiente:

  1. Navega a la pestaña IAM y administración Configuración.

  2. En la lista de proyectos en la parte superior de la página, selecciona el proyecto que deseas usar para crear el clúster de Managed Service para Apache Spark.

  3. Anota el número del proyecto.

Configura los permisos:

  1. Navega a la pestaña IAM.

  2. En la lista de proyectos en la parte superior de la página, selecciona el proyecto de metastore.

  3. Haz clic en Agregar.

  4. Ingresa la cuenta de servicio en el campo Principales nuevas.

  5. En el menú Roles, selecciona Dataproc Metastore > Visualizador de Dataproc Metastore.

  6. Haz clic en Agregar.

Después de completar los pasos anteriores, puedes crear un clúster de Managed Service para Apache Spark que esté adjunto a un servicio de Dataproc Metastore. Ten en cuenta que, para ello, la configuración de red o subred del clúster de Managed Service para Apache Spark debe coincidir con la red o subred de Dataproc Metastore.

Por ejemplo:

gcloud metastore services create SERVICE \
     --network=projects/HOST_PROJECT/global/networks/NETWORK_ID

¿Qué sigue?