Apache Spark con Python (Big Data)

Instalación

Creación de RDD

Almacenamiento de RDD

Operaciones con RDD

Procesamiento por lotes (batch)

Procesamiento en tiempo real (streaming)

Tuberías (Pipelines)

Modelos

Supervisados

No supervisados

 

Otros

Autor: Diego Calvo