Pub/Sub Lite con Dataproc

Pub/Sub Lite es un servicio de mensajería en tiempo real diseñado para ofrecer un coste bajo y una fiabilidad inferior a la de Pub/Sub. Pub/Sub Lite ofrece temas zonales y regionales para el almacenamiento.

El conector de Spark de Pub/Sub Lite admite Pub/Sub Lite como fuente de entrada para el procesamiento estructurado en streaming de Apache Spark en los modos de procesamiento por micro-lotes predeterminado y de procesamiento continuo experimental.

Usar Pub/Sub Lite con Dataproc

Java

El directorio samples del repositorio java-pubsublite-spark en GitHub contiene un ejemplo de Spark en Java que usa Pub/Sub Lite con Dataproc. Para ejecutar el ejemplo, sigue las instrucciones del ejemplo de Spark.

  1. Para empezar, clona el java-pubsublite-spark repositorio de GitHub:
    git clone https://github.com/googleapis/java-pubsublite-spark
    cd java-pubsublite-spark/samples
    

Python o Scala

El conector está disponible en el repositorio central de Maven. Puede descargarla y proporcionarla mediante la opción --packages al usar el comando spark-submit o definirla mediante la spark.jars.packages propiedad de configuración.

Siguientes pasos