por Diego Calvo | Jun 20, 2018 | Big data, Hadoop
Definición de HDFS HDFS (Hadoop Distributed File System) es el sistema de almacenamiento de archivos principal de Hadoop. Trabaja bien con grandes volúmenes de datos, reduce la E/S, gran escalabilidad y disponibilidad y tolerancia a fallos debido a la replicación de... por Diego Calvo | Jun 20, 2018 | Big data, Spark
Componentes Spark Core Spark core es en núcleo donde se apoya toda la arquitectura, proporciona: Distribución de tareas Programación Operaciones de entrada/salida Mediante interfaces de programación Java, Python, Scala y R centradas en la abstración de RDDs.... por Diego Calvo | Feb 5, 2017 | R
PCA Análisis de componentes principales para compresión de imágenes monocromo # Modificar el directorio raiz utilizado setwd(«/Ruta de trabajo») # Separar la imagen en su tres componentes RGB aplicando sobre cada uno el PCA y quedandonos con un solo color imagen <-... por Diego Calvo | Oct 3, 2016 | R
Uso: Determina la relación entre variables explicarlas a través de componentes. Variables: Métricas. Descripción: Técnica estadística de síntesis de la información, o reducción de las dimensiones. Es decir, para un conjunto de datos con multitud de variables, su...