"Service géré pour Apache Spark" est le nouveau nom du produit anciennement appelé "Dataproc sur Compute Engine" (déploiement de cluster) et "Google Cloud Serverless pour Apache Spark" (déploiement sans serveur).
Google uses AI technology to translate content into your preferred language. AI translations can contain errors.
Stockage de données Hadoop
Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Managed Service pour Apache Spark s'intègre à Apache Hadoop et au système de fichiers Hadoop Distributed File System (HDFS). Les fonctionnalités et considérations suivantes peuvent être importantes lors de la sélection des options de calcul et de stockage des données pour les clusters et les tâches Managed Service pour Apache Spark :
HDFS avec Cloud Storage : Managed Service for Apache Spark utilise le système de fichiers HDFS (Hadoop Distributed File System) pour le stockage. En outre, le service géré pour Apache Spark installe automatiquement le connecteur Cloud Storage compatible avec le système de fichiers HDFS, ce qui permet d'utiliser Cloud Storage en parallèle. Il est possible de transférer des données vers et depuis un cluster via des opérations d'importation/de téléchargement vers HDFS ou Cloud Storage.
Disques de VM :
Par défaut, lorsqu'aucun disque SSD local n'est fourni, les données HDFS et les données de brassage intermédiaires sont stockées sur des disques de démarrage de VM, qui sont des disques persistants.
Si vous utilisez des disques SSD locaux, les données HDFS et les données de brassage intermédiaire sont stockées sur les disques SSD.
La taille et le type des disques persistants (DP) ont une incidence sur les performances et la taille de la VM, que vous utilisiez HDFS ou Cloud Storage pour le stockage de données.
Les disques de démarrage de VM sont supprimés lors de la suppression du cluster.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2026/05/12 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2026/05/12 (UTC)."],[],[]]