Apache Spark con Python (Big Data)

Instalación

Carga y lectura de ficheros

Creación de RDD

Almacenamiento de RDD

Operaciones con RDD

Procesamiento por lotes (batch)

Procesamiento en tiempo real (streaming)

Tuberías (Pipelines)

Modelos

Supervisados

No supervisados

 

Otros

Autor: Diego Calvo