Componentes da versão 3.0 do ambiente de execução do Spark
Observações:
Desative para linhas subsequentes com:
* O ambiente de execução 3.0 usa UTF-8 como uma codificação de caracteres padrão.
Novos recursos e melhorias do ambiente de execução
3.0:- As cargas de trabalho regionais e multizonais são usadas por padrão para aumentar a capacidade de obtenção de recursos de computação.
- Inicialização mais rápida do que os tempos de execução anteriores
- Limpeza rápida de recursos que permite a liberação mais rápida de IPs da VPC após a conclusão da carga de trabalho
- As credenciais do usuário final são usadas para todas as cargas de trabalho por padrão
- Novo catálogo do Spark
bigquery, pré-configurado para interações de tabela nativa do BigQuery prontas para uso - Novos papéis do IAM específicos do Spark sem servidor
- É necessário ativar a nova API
dataproc-rm.googleapis.com
Tempo de execução do
3.0não compatível e funcionalidade descontinuada:- O servidor de histórico persistente (PHS) não é compatível. Em vez disso, use a interface do usuário do Spark.
- Os lotes do SparkR não são compatíveis. Em vez disso, use
sparklyr. - As sessões do Jupyter não são compatíveis. Em vez disso, use sessões do Spark Connect, o padrão do setor para desenvolvimento interativo do Spark.