Diego Calvo, Autor en Diego Calvo

Unión e interseción de RDD en Scala

por Diego Calvo | Jun 24, 2018 | Big data, Scala, Spark

Union – union() Nos devuelve la unión de los dos RDDs val rdd1 = sc.parallelize(1 to 4, 1) val rdd2 = sc.parallelize(8 to 10, 1) rdd1.union(rdd2).collect() res: Array[Int] = Array(1, 2, 3, 4, 8, 9, 10) Unión por clave – join() Nos devuelve la unión...

Función en Scala

por Diego Calvo | Jun 22, 2018 | Scala

Función sin parámetros Ejemplo de función simple en Scala def hola_mundo() = { println(«¡Hola, mundo!») } HolaMundo hola_mundo: ()Unit res: HolaMundo.type = HolaMundo$@123f7624 Función con parámetros Ejemplo de función en Scala que admite parámetros def suma(x: Int...

Condicional y bucle en Scala

por Diego Calvo | Jun 22, 2018 | Big data, Scala, Spark

Condicional – IF Ejemplo de uso de condicional donde determina si una nota es aprobada o suspensa var x = 6 if( x >= 5 ){ println(«Aprobado») }else{ println(«Sustenso») } x: Int = 6 Aprobado Bucle – FOR Ejemplo de uso de bucle FOR en donde se...

Elasticsearch

por Diego Calvo | Jun 22, 2018 | Big data

Definición de Elasticsearch Elasticsearch es un servidor de búsqueda open-source en tiempo real que proporciona almacenamiento indexado y distribuido basado en Lucene. Proporciona toda la potencia de búsqueda de Lucene para búsquedas de texto completo, pero simplifica...

Optimizar Spark

por Diego Calvo | Jun 20, 2018 | Big data, Spark

Broadcast Hash Join Si se quiere unir una tabla grande con una pequeña, lo más eficiente es enviar la tabla pequeña por broadcast a la memoria de los Worker, así evitaremos que la grande ser esté enviando constantemente por red cada vez que se la necesita. Si se...

« Entradas más antiguas

Entradas siguientes »

Unión e interseción de RDD en Scala

Función en Scala

Condicional y bucle en Scala

Elasticsearch

Optimizar Spark

Mi filosofía

Contacto

Aviso legal