Agrupar elementos de un dataframe en Scala

por | Sep 5, 2018 | Big data, Scala, Spark | 0 Comentarios

Ejemplo: Agrupar datos de forma simplelogo scala

Ejemplo donde se agrupa la tabla personas por apellido

df.groupBy("apellido").count().show()
+--------+-----+
|apellido|count|
+--------+-----+
|  Martin|    1|
|  Garcia|    3|
+--------+-----+

Ejemplo: Agrupar datos combinado con filtro

Ejemplo donde se agrupa la tabla personas por apellido y se selecciona los que tenga más de 2 apariciones.

df.groupBy("apellido").count().filter("count > 2").show()
+--------+-----+
|apellido|count|
+--------+-----+
|  Garcia|    3|
+--------+-----+

0 comentarios

Enviar un comentario

Tu dirección de correo electrónico no será publicada.