Cloud Storage 정렬

Cloud Storage에서 텍스트 파일의 콘텐츠를 정렬하는 PySpark 작업 예시입니다.

코드 샘플

Python

이 샘플을 사용해 보기 전에 Python 설정 안내를 따르세요. Managed Service for Apache Spark 빠른 시작: 클라이언트 라이브러리 사용 자세한 내용은 Managed Service for Apache Spark Python API 참조 문서를 확인하세요.

Managed Service for Apache Spark에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.

import pyspark

sc = pyspark.SparkContext()
rdd = sc.textFile("gs://path-to-your-GCS-file")
print(sorted(rdd.collect()))

다음 단계

다른 Google Cloud 제품의 코드 샘플을 검색하고 필터링하려면 Google Cloud 샘플 브라우저 참조하기