Leer ficheros de gran tamaño puede acarrear dolores de cabeza si nos centramos en la velocidad de lectura.
Para resolver este problema se muestra a continuación una comparativa de los tiempo empleado en leer el fichero «database.csv» de tamaño: 14,5Mb con 53.641 filas y 21 variables.
Paquete utils: recomendado
library(data.table)
system.time(b <- fread('data/database.csv', header = T, sep = ';'))
# user system elapsed
# 0.198 0.030 0.484Paquete sqldf
library(sqldf)
system.time(c <- read.csv.sql('data/database.csv', sep = ';'))
# user system elapsed
# 1.929 0.315 2.438Paquete utils: más comúnmente utilizado viene preinstalado
system.time(a <- read.csv('data/database.csv', header = T, sep = ';'))
# user system elapsed
# 2.492 0.086 2.691



0 comentarios