Template Dataproc

Untuk menyiapkan dan menjalankan workload dan tugas Dataproc, gunakan template Dataproc di GitHub

Template disediakan dalam bahasa dan lingkungan eksekusi berikut:

  • Template orkestrasi Airflow: Menjalankan tugas Spark dari DAG di Airflow.
  • Template Java: Menjalankan tugas atau workload batch Spark di Google Cloud Serverless for Apache Spark atau cluster Dataproc yang ada.
  • Template Python: Menjalankan workload batch PySpark di Google Cloud Serverless for Apache Spark.
  • Template notebook: Menjalankan tugas Spark menggunakan notebook Vertex AI.