Producto cartesiano de dos RDDs en Scala

por | Jun 25, 2018 | Big data, Scala, Spark | 2 Comentarios

Producto cartesiano – cartesian()scala_logo

Nos devuelve un RDD fruto del producto cartesiano de dos RDDs, donde cada elemento del primer RDD se une a cada elemento del segundo RDD.

val x = sc.parallelize(List(1,2,3))
val y = sc.parallelize(List("a","b","c","d"))
x.cartesian(y).collect
res: Array[(Int, String)] = Array((1,a), (1,b), (1,c), (1,d), (2,a), (2,b), (2,c), (2,d), (3,a), (3,b), (3,c), (3,d))

2 Comentarios

  1. David

    Esta mal, no la explicación, sino que el resultado no concuerda con los valores de las variables x e y.
    Para ese resultado tendría que ser:

    val x = sc.parallelize(List(1,2,3))
    val y = sc.parallelize(List(«a»,»b»,»c»,»d»))

    Espero haber ayudado, un saludo

    Responder
    • Diego Calvo

      Muchas gracias David por tu corrección

      Responder

Enviar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *