por Diego Calvo | Sep 5, 2018 | Big data, Scala, Spark
Ejemplo: Agrupar datos de forma simple Ejemplo donde se agrupa la tabla personas por apellido df.groupBy(«apellido»).count().show() +——–+—–+ |apellido|count| +——–+—–+ | Martin| 1| | Garcia| 3|... por Diego Calvo | Sep 5, 2018 | Big data, Scala, Spark
Ejemplo: Ordenar datos simple Ejemplo donde se ordena la tabla personas por nombre df.sort(desc(«nombre»)).show() df.sort($»nombre».desc).show() df.orderBy($»nombre».desc).show() +——+——–+—-+——-+... por Diego Calvo | Sep 4, 2018 | Big data, Hadoop
Definición de Kerberos Kerberos es un protocolo de autenticación que permite a dos ordenadores demostrar su identidad mutuamente de forma segura. Implementado sobre una arquitectura cliente servidor y trabaja sobre la base de tiques que sirven para demostrar la... por Diego Calvo | Sep 4, 2018 | Big data, Hadoop
Acceder al cluster por SSH ssh nombre_usuario@nombre_cluster_servidor Autenticación en el Shell kinit nombre_usuario@REINO.COM Si la autenticación es exitosa, recibiremos un Ticket-Granting Ticket (TGT) del KDC. Esto significa que nos hemos autenticado con el... por Diego Calvo | Sep 3, 2018 | Big data, Scala, Spark
Ejemplo de funciones estadiscias: media Muestra un ejemplo de como realizar la media sobre un conjunto de datos val df = Seq( («Paco»,»Garcia»,24,24000), («Juan»,»Garcia»,26,27000), («Lola»,»Martin»,29,31000), («Sara»,»Martin»,32,32000), ...