spark Archivos - Página 2 de 6

Funciones estadísticas de dataframes en Scala

por Diego Calvo | Sep 3, 2018 | Big data, Scala, Spark

Ejemplo de funciones estadiscias: media Muestra un ejemplo de como realizar la media sobre un conjunto de datos val df = Seq( («Paco»,»Garcia»,24,24000), («Juan»,»Garcia»,26,27000), («Lola»,»Martin»,29,31000), («Sara»,»Martin»,32,32000), ...

Mostar datos de dataframes en Scala

por Diego Calvo | Sep 3, 2018 | Big data, Scala, Spark

Mostar datos de tabla Muestra los datos del dataframe val df = Seq( («Paco»,»Garcia»,24,24000), («Juan»,»Garcia»,26,27000), («Lola»,»Martin»,29,31000), («Sara»,»Garcia»,35,34000) ).toDF(«nombre», «apellido»,»edad»,»salario») df.show()...

Unir tablas con SQL Spark en Scala

por Diego Calvo | Sep 3, 2018 | Big data, Scala, Spark

Ejemplo: Unir tablas Unir tablas que tenga el identificador comun val df = Seq( (1,»Paco»,»Garcia»,24,24000), (2,»Juan»,»Garcia»,26,27000), (3,»Lola»,»Martin»,29,31000), (4,»Sara»,»Garcia»,35,34000) ).toDF(«id»,»nombre», «apellido»,»edad»,»salario»)...

Selecionar y filtrar con SQL Spark en Scala

por Diego Calvo | Ago 31, 2018 | Big data, Scala, Spark

Ejemplo: Contar datos Contar las personas que sean mayores de 30 años val df = Seq( («Paco»,»Garcia»,24,24000), («Juan»,»Garcia»,26,27000), («Lola»,»Martin»,29,31000), («Sara»,»Garcia»,35,34000) ).toDF(«nombre», «apellido»,»edad»,»salario»)...

Spark SQL en Scala

por Diego Calvo | Ago 31, 2018 | Big data, Scala, Spark

Registrar tabla temporal a partir de dataframe Spark permite la posibilidad de definir «Spark SQL» para poder hacer consultas en formato SQL sobre datos en scala. val df = Seq( («id1», 1,1), («id1», 2,1), («id1», 3,1), («id1», 4,1), («id2», 1,1), («id2»,...