Ejemplo: Agrupar elementos
Contar el número de personas que comparten el mismo apellido.
val df = Seq(
("Paco","Garcia",24,24000),
("Juan","Garcia",26,27000),
("Lola","Martin",29,31000),
("Sara","Garcia",35,34000)
).toDF("nombre", "apellido","edad","salario")
df.createOrReplaceTempView("personas")
spark
.sql(
"""select
| apellido, count(*) as num_iguales
| from personas
| group by apellido
""".stripMargin)
.show
+--------+-----------+ |apellido|num_iguales| +--------+-----------+ | Martin| 1| | Garcia| 3| +--------+-----------+
Ejemplo: Agrupar elementos con resticción
Contar el número de personas que comparten el mismo apellido siempre que sean más de 2
spark .sql( """select | apellido, count(*) as num_iguales | from personas | group by apellido | having num_iguales > 2 """.stripMargin) .show
+--------+-----------+ |apellido|num_iguales| +--------+-----------+ | Garcia| 3| +--------+-----------+





0 comentarios