Dischi di avvio Dataproc

Seleziona Persistent Disk standard, SSD o bilanciato oppure Google Cloud Hyperdisk bilanciato come dischi di avvio per i nodi del cluster Dataproc.

Opzioni per il tipo di disco di avvio:

  • Puoi selezionare un disco di avvio standard, SSD o bilanciato Persistent Disk per i nodi del cluster manager (master), worker primario e worker secondario.

  • Puoi selezionare Hyperdisk Balanced come disco di avvio per i nodi amministratore (master) e worker primario. Tieni presente che Dataproc imposta automaticamente il tipo di disco di avvio del worker secondario su Hyperdisk bilanciato quando il tipo di disco di avvio del worker primario è impostato su Hyperdisk bilanciato.

Il tipo di disco di avvio permanente predefinito per i nodi worker primari e il cluster manager (master) Dataproc è standard (pd-standard). Se il tipo di macchina della VM supporta solo Hyperdisk bilanciato come disco di avvio, il disco di avvio predefinito è Hyperdisk bilanciato (hyperdisk-balanced). Il tipo di disco di avvio permanente predefinito per i nodi worker secondari del cluster è lo stesso del nodo worker primario.

Seleziona i tipi di disco di avvio permanente per i nodi del cluster

Puoi selezionare il tipo di disco di avvio permanente quando crei un cluster utilizzando la consoleGoogle Cloud , Google Cloud CLI o l'API Dataproc.

Console

Puoi creare un cluster e selezionare i tipi di dischi di avvio dei nodi del cluster dal riquadro Configura nodi nella pagina Crea un cluster di Dataproc della console Google Cloud .

Interfaccia a riga di comando gcloud

Puoi creare un cluster e selezionare i tipi di disco di avvio dei nodi del cluster utilizzando il comando gcloud dataproc clusters create con i flag --master-boot-disk-type, --worker-boot-disk-type e --secondary-worker-boot-disk-type.

Esempio:
gcloud dataproc clusters create CLUSTER_NAME \
    --region=REGION \
    --master-boot-disk-type=pd-ssd \
    --worker-boot-disk-type=hyperdisk-balanced \
    other args ...
p

API REST

Puoi impostare un valore di pd-standard, pd-ssd, pd-balanced o hyperdisk-balanced nel campo InstanceGroupConfig.DiskConfig.bootDiskType in masterConfig, workerConfig e secondaryWorkerConfig nell'ambito di una richiesta API cluster.create.

Impostazioni di Hyperdisk

Quando crei un cluster con un volume Hyperdisk bilanciato come disco di avvio per un nodo del cluster Dataproc, puoi impostare IOPS e throughput sottoposti a provisioning.

Console

Puoi impostare IOPS e throughput o accettare i valori predefiniti del riquadro Configura nodi nella pagina Crea un cluster di Dataproc.

Interfaccia a riga di comando gcloud

Puoi impostare IOPS e throughput di provisioning per i nodi del cluster con i dischi di avvio hyperdisk-balanced utilizzando il comando gcloud dataproc clusters create con i flag --master-boot-disk-provisioned-iops, --worker-boot-disk-provisioned-iops, --master-boot-disk-provisioned-throughput e --worker-boot-disk-provisioned-throughput.

Esempio:
  gcloud dataproc clusters create CLUSTER_NAME \
      --region=REGION \
      --master-boot-disk-type=hyperdisk-balanced \
      --master-boot-disk-provisioned-iops=MASTER_BOOT_DISK_IOPS  \
      --master-boot-disk-provisioned-throughput=MASTER_BOOT_DISK_THROUGHPUT \
      --worker-boot-disk-type=hyperdisk-balanced \
      --worker-boot-disk-provisioned-iops=WORKER_BOOT_DISK_IOPS \
      --worker-boot-disk-provisioned-throughput=WORKER_BOOT_DISK_THROUGHPUT \
      other args ...
  

API REST

Puoi impostare IOPS sottoposte a provisioning e throughput sottoposto a provisioning per i nodi del cluster con dischi di avvio Hyperdisk utilizzando i campi InstanceGroupConfig.DiskConfig.bootDiskProvisionedIops e InstanceGroupConfig.DiskConfig.bootDiskProvisionedThroughput per le configurazioni di gestore (master) e worker.