Ejemplo de optimización de precios en R (Pricing)

Generación de datos # Generación de la curva de demanda (linealmente dependiente del precio) demanda = function(p, alpha = -40, beta = 500, sd = 10) { error = rnorm(length(p), sd = sd) q = p*alpha + beta + error }   Generación de los datos a analizar set.seed(100) hist.precio = rnorm(252, mean = 6,…

Autor: Diego Calvo

Read More »

Red neuronal convolucional en R con Keras

Instalación de paquetes # install.packages(“keras”) # devtools::install_github(“rstudio/keras”) library(keras) install_keras() use_session_with_seed(1,disable_parallel_cpu = FALSE) Generación del conjunto de entrenamiento # Cargar de conjunto de entrenamiento de imágenes numéricas mnist <- dataset_mnist() x_train <- mnist$train$x y_train <- mnist$train$y x_test <- mnist$test$x y_test <- mnist$test$y # Cambiar la forma de 28×28 a un vector de 784×1 x_train <- array_reshape(x_train, c(nrow(x_train),…

Autor: Diego Calvo

Read More »

Implementación de redes neuronales – Comparativa Frameworks

Características de frameworks Los frameworks predominantes en el mercado para la implementación de redes neuronales son: Tensorflow Se puede considerar la referencia por excelencia en este ámbito y es el propio Google quien esta detrás de esta tecnología. TensorFlow es una biblioteca open source enfocada específicamente a “Deep Learning”, se la considera de bajo nivel lo…

Autor: Diego Calvo

Read More »

Tipos de datos: estructurados, semiestructurados y no estructurados

Datos estructurados (Structured Data) Los datos estructurados tienen perfectamente definido la longitud, el formato y el tamaño de sus datos. Se almacenan en formato tabla hojas de cálculo o en bases de datos relacionales.   Datos no estructurados (Unstructured Data) Los datos no estructurados se caracterizan por no tener un formato específico. Se almacenan en múltiples…

Autor: Diego Calvo

Read More »

Aprendizaje Supervisado y No supervisado

Definición de Machine Learning El aprendizaje automático o machine learning se encuadra como una disciplina de la inteligencia artificial. El principal objetivo que busca es crear sistemas que sean capaces de aprender automáticamente, es decir que sean capaces de encontrar patrones complejos en grandes conjuntos de datos por si solos. Los algoritmos de machine learning…

Autor: Diego Calvo

Read More »

Inteligencia de negocio

Se considera inteligencia de negocio o (business intelligence) al conjunto de estrategias, aplicaciones, datos, productos, tecnologías y arquitectura técnicas, orientados a la obtención y administración de conocimiento, a través del análisis de datos existentes en la organización. Cabe resaltar que la creación de un data warehouse representa el primer paso desde el punto de vista…

Autor: Diego Calvo

Read More »

Instalación de Pentaho Community Edition

Instalación de Java Instalar la maquina virtual de Java instalar el JDK o JRE de Java. Las versiones de Pentaho 5.X requieren una versión de java 1.7. La versión de Pentaho 6.X y 7.X requieren una versión de java 1.8 de 64 bits (las versiones de 32 bits no funcionan). Añadir en el PATH la…

Autor: Diego Calvo

Read More »

Modelo CRISP DM – Data mining

El modelo presentado se encuentra estructurado en seis fases, entre algunas de estas puede exisistir bidireccionalidad, es decir que algunas fases permitirán revisar total o parcialmente las anteriores.   Comprensión del negocio (Objetivos y requerimientos desde una perspectiva no técnica) Establecimiento de los objetivos del negocio (Contexto inicial, objetivos, criterios de éxito) Evaluación de la…

Autor: Diego Calvo

Read More »

Clasificación de Métodos Estadísticos de Dependencia

En los Métodos de Clasificación estadísticos de Dependencia las variables analizadas están divididas en dos grupos: por un lado están las variables independientes y por otro las variables dependientes. El objetivo de estos métodos consiste en determinar si afecta el conjunto de variables independientes a las variables dependientes y si es así de que forma…

Autor: Diego Calvo

Read More »

Árboles de decisión en minería de datos

Los árboles de decisión utilizados en minería de datos se pueden clasificar en: Árboles de regresión: el resultado que predicen se puede considerar un número real. Ejemplo: precio de una casa, o duración de una pieza. Árboles de clasificación el resultado que predicen es la clase a la que pertenecen los datos. Ejemplo: sexo, tipo…

Autor: Diego Calvo

Read More »