Compresión de datos

Los almacenes de datos por columnas se caracterizan por el aumento de la localidad de los datos, esto es así porque los valores de una misma columna están próximos en el dispositivo de almacenamiento externo, gracias a ello se puede resolver de forma eficiente,...

Fragmentación de base de datos relacionales

Fragmentación horizontal La fragmentación horizontal es especialmente útil en el caso de tablas con un volumen importante de filas, y consiste en subdividir una tabla en grupos de filas disjuntos a través de aplicar algún tipo de condición Ejemplo: fragmentar...

Proyecciones en almacén de datos en columnas

Las proyecciones consisten en guardar duplicados ordenados por uno o varios criterios, con el objetivo principal de mejorar el rendimiento de los accesos por valor a los datos en el caso de operaciones de consulta (ejecución de sentencias SELECT). La base de datos...

Manipulación de datos en R (forma simple)

Librería utilizada y carga de datos #install.packages(«dplyr») # Instalar de manipulación de dataframes «dplyr» library(dplyr) # Cargar la librería de manipulación de dataframes «dplyr» nombre <- c(«A»,»B»,»C»,»D»,»E»,»F»,»G»,»H»,»I»,»J») sexo <-...

Preprocesado de datos en R

Limpiar datos Contar duplicados Contar nulos Eliminar duplicados Eliminar NA (valores nulos) Eliminar columnas Seleccionar / renombrar columnas Eliminar filas que no cumplan condiciones Filtrar filas que cumplan condiciones   Transformación de datos Unificar...