arquitectura Archivos

Apache YARN

por Diego Calvo | Sep 12, 2018 | Big data

Definición de Yarn (Yet Another Resource Negociator) Yarn es un sistema operativo de datos y gestor de recursos distribuido, conocido también como Hadoop 2 ya que es la evolución de Hadoop Map-Reduce. Los cambios más significativos de Hadoop 2 sobre Hadoop 1 es que se...

Kerberos

por Diego Calvo | Sep 4, 2018 | Big data, Hadoop

Definición de Kerberos Kerberos es un protocolo de autenticación que permite a dos ordenadores demostrar su identidad mutuamente de forma segura. Implementado sobre una arquitectura cliente servidor y trabaja sobre la base de tiques que sirven para demostrar la...

Cálculos sobre ventana temporal en Dataframe Scala

por Diego Calvo | Ago 30, 2018 | Big data, Scala, Spark

Cálculo de media móvil en Dataframe Scala Calcula la media móvil a partir de una ventana temporal de 3 periodos import org.apache.spark.sql.expressions.Window import org.apache.spark.sql.functions._ val df = sc.parallelize( List((«Sensor1», «2016-05-01», 50.00),...

Storm

por Diego Calvo | Jul 5, 2018 | Big data, Hadoop

Definición de Storm Apache Storm es un sistema de computación distribuida en tiempo real de baja latencia y de alta disponibilidad basado en la arquitectura maestro-esclavo. Storm es ideal para trabajar con datos que necesitan ser analizados en tiempo real donde la...

Apache Flume

por Diego Calvo | Jul 2, 2018 | Big data

Definición de Flume Apache Flume es un servicio distribuido que mueve de forma fiable y eficiente grandes cantidades de datos, especialmente logs. Ideal para aplicaciones de analíticas en línea en entornos Hadoop. Flume tiene una arquitectura sencilla y flexible...

« Entradas más antiguas

Apache YARN

Kerberos

Cálculos sobre ventana temporal en Dataframe Scala

Storm

Apache Flume

Mi filosofía

Contacto

Aviso legal