在 Cloud Storage 排序

以下 PySpark 工作範例說明如何排序 Cloud Storage 中的文字檔案內容。

程式碼範例

Python

在試用這個範例之前,請先按照「使用用戶端程式庫的 Dataproc 快速入門導覽課程」中的 Python 設定操作說明進行操作。詳情請參閱 Dataproc Python API 參考文件

如要向 Dataproc 進行驗證,請設定應用程式預設憑證。詳情請參閱「為本機開發環境設定驗證機制」。

import pyspark

sc = pyspark.SparkContext()
rdd = sc.textFile("gs://path-to-your-GCS-file")
print(sorted(rdd.collect()))

後續步驟

如要搜尋及篩選其他 Google Cloud 產品的程式碼範例,請參閱Google Cloud 瀏覽器範例