Filtrar RDD – filter()![scala_logo](data:image/svg+xml,%3Csvg%20xmlns=%22http://www.w3.org/2000/svg%22%20viewBox=%220%200%20143%2061%22%3E%3C/svg%3E)
Nos devuelve un RDD después de aplicar una función de filtro sobre el RDD original
val rdd1 = sc.parallelize(List("pescado azul", "cielo azul", "pescado blanco", "carne roja")) val rdd2 = rdd1.filter(_.contains("azul")) rdd2.collect
res: Array[String] = Array(pescado azul, cielo azul)
Elementos distintos de RDD – distinct()
Nos devuelve un RDD con los elementos distintos
val rdd = sc.parallelize(List("avion", "avion", "tren", "tren", "tren", "barco"), 2) rdd.distinct.collect()
res: Array[String] = Array(avion, tren, barco)
0 comentarios