HDFS – Sistema de archivos distribuidos Hadoop

Definición de HDFS HDFS (Hadoop Distributed File System) es el sistema de almacenamiento de archivos principal de Hadoop. Trabaja bien con grandes volúmenes de datos, reduce la E/S, gran escalabilidad y disponibilidad y tolerancia a fallos debido a la replicación de...

Componentes de Apache Spark

Componentes   Spark Core Spark core es en núcleo donde se apoya toda la arquitectura, proporciona: Distribución de tareas Programación Operaciones de entrada/salida Mediante interfaces de programación Java, Python, Scala y R centradas en la abstración de RDDs....

ACP – Análisis de Componentes Principales en R

Uso: Determina la relación entre variables explicarlas a través de componentes. Variables: Métricas. Descripción: Técnica estadística de síntesis de la información, o reducción de las dimensiones. Es decir, para un conjunto de datos con multitud de variables, su...