Big data – Herramientas de gestión del cluster

Gestores de aplicaciones y recursos big data Hadoop Map-Reduce es un gestor de recursos distribuidos y procesamiento de datos. Proporciona una infraestructura de programación que proporciona algoritmos para realizar los cálculos distribuidos. YARN es un sistema operativo de datos y gestor de recursos distribuido. Evolución de Map-Reduce. Puede ejecutarse en Linux y Windows. Standalone es…

Read More »

Apache Hadoop

Definición de Hadoop: Apache Hadoop es un sistema distribuido que permite realizar procesamiento de grandes volúmenes de datos a través de clúster, fácil de escalar. A grandes rasgos se puede decir que Hadoop está compuesto por dos partes: Se ocupa del almacenamiento de datos de distintos tipos (HDFS) Realiza las tareas de procesamiento de los datos de…

Read More »