"Managed Service for Apache Spark" is the new name for the product formerly known as "Dataproc on Compute Engine" (cluster deployment) and "Google Cloud Serverless for Apache Spark" (serverless deployment).
Google uses AI technology to translate content into your preferred language. AI translations can contain errors.
本文档介绍了如何使用 Spark 界面监控和排查 Managed Service for Apache Spark 互动式会话的问题。
Spark 界面
Spark 界面会从 Managed Service for Apache Spark 互动式会话中收集 Apache Spark 执行详情。Spark 界面功能默认处于启用状态,且免费提供。Spark 界面功能收集的数据会保留 90 天。
所需的 Identity and Access Management 权限和角色
如需在交互式会话中使用 Spark 界面功能,需要以下权限:
数据收集权限:dataproc.sessions.sparkApplicationWrite。必须向运行交互式会话的服务账号授予此权限。此权限包含在 Managed Service for Apache Spark Worker 角色中,该角色会自动授予 Managed Service for Apache Spark 默认使用的 Compute Engine 默认服务账号。不过,如果您为会话或会话运行时模板指定自定义服务账号,则必须向该服务账号添加此 dataproc.sessions.sparkApplicationWrite 权限(通常是通过向该服务账号授予 Managed Service for Apache Spark Worker 角色)。