Estructuras de datos en Scala

 RDD (Resilient Distributed Dataset) Datos no estructurados, ejemplo: binarios, text streaming. Utiliza acciones y transformaciones de bajo nivel No soporta serialización Encoders. No de un esquema ni formato de columna. Proporciona serguridad de tipo en tiempo de compilación.   DataFrames – DataFrames Datos estructurados (entradas RDBMS) o semi-estructurados (json, csv) Necesita ejecutar consultas hive Mayor rendimiento…

Autor: Diego Calvo

Read More »

Uso de Listas, Matrices y Arrays en R

Listas Conectan objetos donde cada uno puede tener una estructura distinta. Una lista tiene una serie de componentes, a los que deberemos asignar un nombre. Soporta menos operaciones que otras estructuras de datos debido a la falta de homogeneidad de los datos que la componen familia <- list(padre=”peter”,madre=”maria”,numero.hijos=3, nombre.hijos=c(“juan”,”carlos”,”eva”),edades.hijos=c(7,5,3),ciudad=”madrid”) $padre [1] “peter” $madre [1] “maria”…

Autor: Diego Calvo

Read More »