Ejemplos – Contar elementos de un RDD en Scala

Ejemplo: contar elementos – count()

Cuenta el número de elementos de un RDD.

val rdd = sc.parallelize(1 to 4)
rdd.count
res: Long = 4

 

Ejemplo: contar elementos por clave – ContarcountByKey()

Cuanta en número de elementos de un RDD agrupados por clave.

val rdd = sc.parallelize(List((1, "tren"), (1, "avion"), (2, "coche"), (2, "moto")), 2)
rdd.countByKey
res: scala.collection.Map[Int,Long] = Map(2 -> 2, 1 -> 2)

 

Ejemplo: contar elementos por valor – countByValue()

Cuanta en número de elementos de un RDD agrupados por valor.

val rdd = sc.parallelize(List(1,1,2,2,2,3,3,3,3), 2)
rdd.countByValue
res: scala.collection.Map[Int,Long] = Map(2 -> 3, 1 -> 2, 3 -> 4)

Otros artículos que pueden ser de interés:

Autor: Diego Calvo