Red neuronal multicapa en R con Keras – Categorizar con variables numéricas

Instalación de paquetes # install.packages(“keras”) library(keras) use_session_with_seed(1,disable_parallel_cpu = FALSE) Generación del conjunto de entrenamiento # Cargar datos iris desordenados (tipos de flores con sus diferentes características) data = iris[sample(nrow(iris)),] head(data) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 40 5.1 3.4 1.5 0.2 setosa 56 5.7 2.8 4.5 1.3 versicolor 85 5.4 3.0 4.5 1.5 versicolor 134 6.3…

Autor: Diego Calvo

Read More »

Función de activación – Redes neuronales

Definición de función de activación La función de activación se encarga de devolver una salida a partir de un valor de entrada, normalmente el conjunto de valores de salida en un rango determinado como (0,1) o (-1,1). Se buscan funciones que las derivadas sean simples, para minimizar con ello el coste computacional.   Tipos de…

Autor: Diego Calvo

Read More »

XgBoost

El XGboost (Extra Gradient boosting) parte del árbol de decisiones que se implementa en minería de datos para clasificar o pronosticar sobre una variable objetivo (y), a través, del aprendizaje automático que se realiza sobre un set de datos, utilizando varios clasificadores débiles que en este caso, como ya mencionamos, son nuestros árboles de decisiones,…

Read More »

Análisis Cluster No Jerárquico k-means en R (Ejemplo simple)

Uso: Determina la relación entre casos. Variables : Métricas. Descripción: Agrupamiento no jerárquico, en los que el número de grupos se determina a priori y las observaciones se van asignando a los grupos en función de su cercanía. Ejemplo en R: Clasificar flores atendiendo a sus características físicas de altura y anchura de sus pétalos…

Autor: Diego Calvo

Read More »

Resumir información de dataframe en R

Determinar la frecuencia de aparición de un elemento library(dplyr) frecuencias <- data.frame(id = datos$texto, value = datos$valor) frecuencias <- mutate(group_by(frecuencias,id), cumsum=cumsum(value)) datos.frec <- data.frame(id=frecuencias$id,frec=frecuencias$cumsum) datos.frec <- datos.frec[with(datos.frec, order(-datos.frec$frec)), ] datos.frec <- datos.frec[!duplicated(datos.frec$id),] barplot(datos.frec$frec, names.arg = datos.frec$id)   Sumar valores agrupados por categorías categorias <- c(“a”,”a”,”a”,”a”,”b”,”b”,”b”,”c”,”c”,”d”) numeros <- c(1,2,3,4,5,6,7,8,9,10) datos <- data.frame(categorias=categorias, numeros=numeros ) datos.frec <-…

Autor: Diego Calvo

Read More »

Unificar categorías de dataframe en R

Unificar categorias sustituyendo por elementos de un conjunto # Ampliar el conjunto de datos datos$sexo <- c(“masculino”,”h”, “hombre”, “h”,”mujer”,”femenino”, “mujer”, “m”) # Ver que valores toma la variable unique(datos$sexo) ## [1] “masculino” “h” “hombre” “mujer” “femenino” “m” # Definir los nombres que pueden aparecer en el cojunto de datos nombres.hombre <- c(“masculino”, “hombre”, “h”) nombres.mujer…

Autor: Diego Calvo

Read More »

Generar matriz de ceros y unos a partir de variables categóricas

Ejemplo de como generar una matriz de ceros y unos Se muestra un ejemplo de como generar una matriz de ceros y unos a partir de variables categóricas y para ello se siguen los siguientes pasos Crear la matriz de ejemplo id <- c(1,4,3,2,7,6,9,5,0,8) texto <- c(“A”, “B”, “A”, “D”,”A”,”B”,”B”,”B”,”C”,”D”) valor <- c(2,8,7,5,1,9,4,3,7,2) df <-…

Autor: Diego Calvo

Read More »

Recategorizar columnas de dataframes en R

Recategorizar columnas fijando intervalos datos$categorias<-cut(datos$valor, c(-Inf,2,4,6,8,Inf)) levels(datos$categorias) <- c(“muy bajo”,”bajo”,”medio”,”alto”,”muy alto”) plot(datos$categorias) Recategorizar elementos automáticamente library(“agricolae”) aux <- table.freq( hist(datos$valor, plot=FALSE) ) datos.frec <- data.frame(rango= paste(aux$Lower, aux$Upper,sep = “-“),frec= aux$Frequency) barplot(datos.frec$frec, names.arg = datos.frec$rango) Recategorizar una columna usando un listado con indexado # Definir el Data frame velocidades <- c(“30″,”50″,”90″,”100″,”120”) velocidad <- sample(velocidades, 50, replace =…

Autor: Diego Calvo

Read More »