por Diego Calvo | May 11, 2020 | R
La unión de dataframes se hace aplicando la teoría de conjuntos. En la imagen se muestra de forma visual que subconjunto de datos tenemos en cada caso. Teoría de conjuntos Cargar datos del dataframe # Conjunto de datos 1 id1 <- c (1:6) valor1 <-... por Diego Calvo | Sep 3, 2018 | Big data, Scala, Spark
Mostar datos de tabla Muestra los datos del dataframe val df = Seq( («Paco»,»Garcia»,24,24000), («Juan»,»Garcia»,26,27000), («Lola»,»Martin»,29,31000), («Sara»,»Garcia»,35,34000) ).toDF(«nombre», «apellido»,»edad»,»salario») df.show()... por Diego Calvo | Jun 20, 2018 | R
Determinar la frecuencia de aparición de un elemento library(dplyr) frecuencias <- data.frame(id = datos$texto, value = datos$valor) frecuencias <- mutate(group_by(frecuencias,id), cumsum=cumsum(value)) datos.frec <-... por Diego Calvo | May 27, 2018 | R
Comprimir dataframe y escribir en un fichero Formato gz write.csv2(df, gzfile(«nombre_fichero.csv.gz»), row.names = FALSE) Formato zip write.csv2(df, gzfile(«nombre_fichero.csv.zip»), row.names = FALSE) Descomprimir dataframe leido de un fichero Formato gz df_new =...