Diego Calvo, Autor en Diego Calvo

Agrupar elementos de un dataframe en Scala

por Diego Calvo | Sep 5, 2018 | Big data, Scala, Spark

Ejemplo: Agrupar datos de forma simple Ejemplo donde se agrupa la tabla personas por apellido df.groupBy(«apellido»).count().show() +——–+—–+ |apellido|count| +——–+—–+ | Martin| 1| | Garcia| 3|...

Ordenar dataframe en Scala

por Diego Calvo | Sep 5, 2018 | Big data, Scala, Spark

Ejemplo: Ordenar datos simple Ejemplo donde se ordena la tabla personas por nombre df.sort(desc(«nombre»)).show() df.sort($»nombre».desc).show() df.orderBy($»nombre».desc).show() +——+——–+—-+——-+...

Kerberos

por Diego Calvo | Sep 4, 2018 | Big data, Hadoop

Definición de Kerberos Kerberos es un protocolo de autenticación que permite a dos ordenadores demostrar su identidad mutuamente de forma segura. Implementado sobre una arquitectura cliente servidor y trabaja sobre la base de tiques que sirven para demostrar la...

Generar un keytab de autenticación Kerberos en un cluster hadoop

por Diego Calvo | Sep 4, 2018 | Big data, Hadoop

Acceder al cluster por SSH ssh nombre_usuario@nombre_cluster_servidor Autenticación en el Shell kinit nombre_usuario@REINO.COM Si la autenticación es exitosa, recibiremos un Ticket-Granting Ticket (TGT) del KDC. Esto significa que nos hemos autenticado con el...

Funciones estadísticas de dataframes en Scala

por Diego Calvo | Sep 3, 2018 | Big data, Scala, Spark

Ejemplo de funciones estadiscias: media Muestra un ejemplo de como realizar la media sobre un conjunto de datos val df = Seq( («Paco»,»Garcia»,24,24000), («Juan»,»Garcia»,26,27000), («Lola»,»Martin»,29,31000), («Sara»,»Martin»,32,32000), ...