Agrupar elementos de un dataframe en Scala

Ejemplo: Agrupar datos de forma simplelogo scala

Ejemplo donde se agrupa la tabla personas por apellido

df.groupBy("apellido").count().show()
+--------+-----+
|apellido|count|
+--------+-----+
|  Martin|    1|
|  Garcia|    3|
+--------+-----+

Ejemplo: Agrupar datos combinado con filtro

Ejemplo donde se agrupa la tabla personas por apellido y se selecciona los que tenga más de 2 apariciones.

df.groupBy("apellido").count().filter("count > 2").show()
+--------+-----+
|apellido|count|
+--------+-----+
|  Garcia|    3|
+--------+-----+

Otros artículos que pueden ser de interés:

Autor: Diego Calvo