hadoop Archivos - Diego Calvo

Configurar clúster Hadoop (+ herramientas Big Data)

por Diego Calvo | Nov 29, 2018 | Big data, Hadoop

Instalar y configurar un clúster Hadoop Pseudo-Distribuido (un solo nodo) Instalar la máquina Virtual Java. Instalar Hadoop. Configurar las variables de entorno. Configurar SSH Modificar ficheros de configuración Crear directorio de datos, donde almacenar HDFS Iniciar...

Instalar y configurar de HIVE en Hadoop

por Diego Calvo | Nov 27, 2018 | Big data, Hadoop

Prerequisitos Tener instalado y configurado Hadoop. Descargar Hive Buscar la última versión de Hive compatible con el sistema que tengas o bien usar wget cd /home/hadoop/Descargas wget http://apache.rediris.es/hive/hive-2.3.4/apache-hive-2.3.4-bin.tar.gz...

Apache YARN

por Diego Calvo | Sep 12, 2018 | Big data

Definición de Yarn (Yet Another Resource Negociator) Yarn es un sistema operativo de datos y gestor de recursos distribuido, conocido también como Hadoop 2 ya que es la evolución de Hadoop Map-Reduce. Los cambios más significativos de Hadoop 2 sobre Hadoop 1 es que se...

Kerberos

por Diego Calvo | Sep 4, 2018 | Big data, Hadoop

Definición de Kerberos Kerberos es un protocolo de autenticación que permite a dos ordenadores demostrar su identidad mutuamente de forma segura. Implementado sobre una arquitectura cliente servidor y trabaja sobre la base de tiques que sirven para demostrar la...

Generar un keytab de autenticación Kerberos en un cluster hadoop

por Diego Calvo | Sep 4, 2018 | Big data, Hadoop

Acceder al cluster por SSH ssh nombre_usuario@nombre_cluster_servidor Autenticación en el Shell kinit nombre_usuario@REINO.COM Si la autenticación es exitosa, recibiremos un Ticket-Granting Ticket (TGT) del KDC. Esto significa que nos hemos autenticado con el...