Dataproc 說明文件

Dataproc 是一項代管式 Apache Spark 和 Apache Hadoop 服務,可供您妥善運用開放原始碼資料工具,進行批次處理、查詢、串流及機器學習作業。Dataproc 自動化功能有助於快速建立叢集、輕鬆管理叢集,並在不使用叢集時關閉叢集以節省支出。省下管理作業所需的時間與費用之後,您就能專心處理工作與資料。

請前往 Dataproc 產品頁面瞭解詳情。

  • 運用我們最新生成式 AI 模型和工具進行開發。
  • 免費使用 Compute Engine 和 AI API 等 20 多項熱銷產品。
  • 不會自動收費,也無需綁約

繼續探索 20 多項永久免費的產品

存取 20 多項常見用途的免費產品,包括 AI API、VM 和資料倉儲等。

瀏覽自修訓練課程、用途、參考架構和程式碼範例,瞭解如何使用及連結 Google Cloud 服務。
訓練
訓練與教學課程

透過 Dataproc Jobs API,將 Spark 工作提交至執行中的 Google Kubernetes Engine 叢集。

訓練
訓練與教學課程

本課程結合了講座、示範和實作研究室,說明如何建立 Dataproc 叢集、提交 Spark 工作,然後關閉叢集。

訓練
訓練與教學課程

本課程結合了講座、示範和實作實驗室,說明如何在 Dataproc 叢集執行 Apache Spark 機器學習程式庫,用於實作邏輯迴歸,以開發多變數資料集的分析模型。

用途
用途

在 Google Cloud 上調度工作流程。

用途
用途

如何將資料從地端部署的 Hadoop 分散式檔案系統 (HDFS) 移至 Google Cloud。

用途
用途

向 Dataproc 叢集提交 Spark 工作時納入依附元件的建議方法。

程式碼範例
程式碼範例

使用 Python 呼叫 Dataproc API。

程式碼範例
程式碼範例

使用 Java 呼叫 Dataproc API。

程式碼範例
程式碼範例

使用 Node.js 呼叫 Dataproc API。

程式碼範例
程式碼範例

使用 Go 呼叫 Dataproc API。

相關影片