Métodos de Monte Carlo con Dataproc y Apache Spark

Dataproc y Apache Spark proporcionan infraestructura y capacidad que puedes usar para ejecutar las simulaciones de Monte Carlo escritas en Java, Python o Scala.

Los métodos de Monte Carlo pueden ayudar a resolver un amplio rango de cuestiones sobre comercio, ingeniería, ciencia y matemáticas, entre otros campos. A través de muestras aleatorias repetidas que crean una probabilidad de distribución para una variable, una simulación de Monte Carlo puede brindar respuestas a preguntas que, de otro modo, serían imposibles de resolver. Por ejemplo, en finanzas, poner un precio a las opciones sobre acciones implica analizar las miles de formas en las que el precio de las acciones puede cambiar en el futuro. Los métodos de Monte Carlo permiten simular los cambios de precio de las acciones con un amplio rango de resultados posibles sin perder el control del dominio de las posibles causas del problema.

Antes, la ejecución de miles de simulaciones podía tardar mucho tiempo y generar grandes costos. Dataproc permite aprovisionar capacidad a pedido y pagar por minuto. Con Apache Spark, puedes usar clústeres de decenas, cientos o miles de servidores para ejecutar simulaciones de manera intuitiva y escalable con el fin de cumplir con tus necesidades. Esto significa que puedes ejecutar más simulaciones con mayor rapidez, lo que ayuda a que tu negocio innove y administre mejor los riesgos.

La seguridad siempre es importante cuando trabajas con datos financieros. Dataproc se ejecuta en Google Cloud, lo que ayuda a mantener tus datos seguros y privados de varias maneras. Por ejemplo, todos los datos se encriptan durante la transmisión y cuando están en reposo, y Google Cloud cumple con las normas ISO 27001, SOC3 y PCI.

Objetivos

Crear un clúster de Cloud Dataproc administrado con Apache Spark preinstalado
Ejecutar una simulación de Monte Carlo con Python que haga un cálculo aproximado del crecimiento de una cartera de valores en el tiempo
Ejecutar una simulación de Monte Carlo con Scala que simule la forma en que un casino gana dinero

Costos

En este documento, usarás los siguientes componentes facturables de Google Cloud:

Para obtener una estimación de costos en función del uso previsto, usa la calculadora de precios.

Es posible que los usuarios de Google Cloud nuevos cumplan con los requisitos para acceder a una prueba gratuita.

Cuando completes las tareas que se describen en este documento, podrás borrar los recursos que creaste para evitar que se te siga facturando. Para obtener más información, consulta Realiza una limpieza.

Antes de comenzar

Configura un proyecto de Google Cloud

Métodos de Monte Carlo con Dataproc y Apache Spark

Objetivos

Costos

Antes de comenzar

Crea un clúster de Dataproc

Inhabilita el registro para advertencias

Usa `ssh` para conectarte al nodo principal del clúster de Dataproc

Cambia la configuración de registro

Lenguajes de programación de Spark

Estima el crecimiento de la cartera

Programa una simulación de Monte Carlo en Scala

Realiza una limpieza

Borra el proyecto

¿Qué sigue?

Métodos de Monte Carlo con Dataproc y Apache Spark Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Objetivos

Costos

Antes de comenzar

Crea un clúster de Dataproc

Inhabilita el registro para advertencias

Usa ssh para conectarte al nodo principal del clúster de Dataproc

Cambia la configuración de registro

Lenguajes de programación de Spark

Estima el crecimiento de la cartera

Programa una simulación de Monte Carlo en Scala

Realiza una limpieza

Borra el proyecto

¿Qué sigue?

Métodos de Monte Carlo con Dataproc y Apache Spark

Usa `ssh` para conectarte al nodo principal del clúster de Dataproc