Environnement d'exécution Serverless pour Apache Spark 3.0

Composants Spark 3.0

Composant 3.0.0
2025/12/04
3.0.0-RC6
2025/10/16

3.0.0-RC5
2025/10/06
3.0.0-RC4
2025/09/11
3.0.0-RC3
2025/09/08
Apache Spark 4.0.0 4.0.0 4.0.0 4.0.0 4.0.0
Connecteur Cloud Storage 3.1.9 3.1.5 3.1.5 3.1.5 3.1.5
Connecteur BigQuery 0.43.1-preview 0.42.3 0.42.3 0.42.3 0.42.3
Java 21 21 21 21 21
Python 3.12 3.12 3.12 3.12 3.12
Scala 2.13 2.13 2.13 2.13 2.13

Remarques :

  • L'environnement d'exécution 3.0 utilise UTF-8 comme encodage de caractères par défaut.

  • Nouvelles fonctionnalités et améliorations de l'environnement d'exécution 3.0 :

    • Les charges de travail régionales et multizones sont utilisées par défaut pour augmenter la disponibilité des ressources de calcul.
    • Démarrage plus rapide que les runtimes précédents
    • Nettoyage rapide des ressources permettant une libération plus rapide des adresses IP du VPC après la fin de la charge de travail
    • Les identifiants de l'utilisateur final sont utilisés pour toutes les charges de travail par défaut
    • Nouveau catalogue Spark bigquery, préconfiguré pour les interactions avec les tables natives BigQuery prêtes à l'emploi
    • Nouveaux rôles IAM spécifiques à Spark sans serveur
    • L'activation de la nouvelle API dataproc-rm.googleapis.com est requise
  • Fonctionnalités non compatibles et obsolètes de l'environnement d'exécution 3.0 :

    • Le serveur d'historique persistant (PHS) n'est pas compatible. Utilisez plutôt l'interface utilisateur Spark.
    • Les lots SparkR ne sont pas acceptés. Utilisez plutôt sparklyr.
    • Les sessions Jupyter ne sont pas prises en charge. Utilisez plutôt les sessions Spark Connect, la norme du secteur pour le développement Spark interactif.

Bibliothèques Python

Bibliothèques Python serverless-spark-3.0-debian-12
Nom du package Version
accélérer 1.11
bigframes 2,24
cookiecutter 2,6
cuda 12.9
cudnn 9.10
cython 3.1
dask 2025.10
dataproc-spark-connect 1.0.0rc6
ensembles de données 4.0
deepspeed 0.17
delta-spark 4.0.0
evaluate 0,4
fastavro 1.12
fastparquet 11/2024
gcsfs 2025.3
git 2,51
google-auth-oauthlib 1.2
google-cloud-aiplatform 1.121
google-cloud-bigquery 3,38
google-cloud-bigquery-storage 2,32
google-cloud-bigtable 2,34
google-cloud-container 2,59
google-cloud-datacatalog 3.27
google-cloud-dataproc 5.22
google-cloud-datastore 2.21
google-cloud-dlp 3.32
google-cloud-language 2,17
google-cloud-logging 3.12
google-cloud-monitoring 2,28
google-cloud-pubsub 2,31
google-cloud-redis 2,18
google-cloud-secret-manager 2,25
google-cloud-spanner 3,59
google-cloud-speech 2.33
google-cloud-storage 2,19
google-cloud-texttospeech 2,31
google-cloud-translate 3.21
google-cloud-vision 3,10
httplib2 0,31
huggingface_hub 0,36
ipyparallel 9
keyrings.google-artifactregistry-auth 1.1
langchain 1.0
lightgbm 4.6
mamba 2.3
markdown 3.9
nccl 2.27
nltk 3.9
nodejs 24.9
numba 0.61
numpy 2.1
oauth2client 4.1
onnx 1.17
openblas 0,3
opencv 4.11
orc 2.1
pandas 2.3
pyarrow 19
pydot 4.0
pyhive 0,7
pyiceberg 0,10
pymongo 4.15
pynvml 13
pytables 3,10
python 3.12
pytorch-gpu 2,6
regex 2025.10
requêtes 2,32
rtree 1.4
scikit-image 0,25
scikit-learn 1,7
scipy 1.15
seaborn 0,13
sentence-transformers 5.1
shap 0,48
spark-tensorflow-distributor 1.0
spacy 3.8
sqlalchemy 2.0
statsforecast 2.0
sympy 1,14
tensorflow-gpu 2,18
torcheval 0.0.7
torche 2,6
torchvision 0,21
tornade 6,5
transformers 4.57
uritemplate 4.2
virtualenv 20.35
wordcloud 1.9
xgboost 3.0.4
ydata-profiling 4.17