Spark SQL en Scala

Registrar tabla temporal a partir de dataframe Spark permite la posibilidad de definir «Spark SQL» para poder hacer consultas en formato SQL sobre datos en scala. val df = Seq(   («id1», 1,1),   («id1», 2,1),   («id1», 3,1),   («id1», 4,1),   («id2», 1,1),   («id2»,...

Evolución temporal Big Data

2003 – Google File System 2004 – MapReduce: Procesamiento simplificado de grandes clusters. 2005 – Doug Cutting comienza a desarrollar Hadoop 2006 – Yahoo comienza a trabajar en Hadoop 2008 – Hadoop sale a producción 2009 – Yahoo...