por Diego Calvo | Jul 5, 2018 | Big data, Hadoop
Definición de Flink Apache Flink es un motor nativo de procesamiento de flujos de datos de baja latencia, que proporciona capacidades de distribución de datos comunicación y tolerancia a fallos. Flink fue desarrollado en Java y Scala por la Universidad Técnica de... por Diego Calvo | Jul 5, 2018 | Big data, Hadoop
Herramientas de seguridad Apache Ranger es un marco para habilitar, monitorear y administrar seguridad de datos integral en toda la plataforma Hadoop. Apache Sentry es un sistema para aplicar la autorización basada en funciones de granularidad fina a datos y metadatos... por Diego Calvo | Jul 5, 2018 | Big data, Hadoop
Los principales sistemas de almacenamiento de datos para ecosistemas Big Data son: HDFS: sistema de almacenamiento por excelencia de Hadoop. Apache HBase: sistema de gestión de bases de datos orientado a columnas que se ejecuta sobre el HDFS y se suele utilizar para... por Diego Calvo | Jul 5, 2018 | Big data
Las herramientas de ingesta de datos para ecosistemas Big Data se clasifican en los siguientes bloques: Apache Nifi: herramienta ETL que se encarga de cargar datos de diferentes fuentes, los pasa por un flujo de procesos para su tratamiento, y los vuelca en otra... por Diego Calvo | Jul 5, 2018 | Big data, Hadoop
Las herramientas de visualización de datos para ecosistemas Big Data se clasifican en los siguientes bloques: Notebooks Jupyter Zeppelin Librerías gráficas Google Chart D3.js Plotty Herramientas de análisis gráfico Kibana Shiny Grabana Loggy Herramientas...