XgBoost

El XGboost (Extra Gradient boosting) parte del árbol de decisiones que se implementa en minería de datos para clasificar o pronosticar sobre una variable objetivo (y), a través, del aprendizaje automático que se realiza sobre un set de datos, utilizando varios...

Análisis Cluster No Jerárquico k-means en R (Ejemplo simple)

Uso: Determina la relación entre casos. Variables : Métricas. Descripción: Agrupamiento no jerárquico, en los que el número de grupos se determina a priori y las observaciones se van asignando a los grupos en función de su cercanía. Ejemplo en R: Clasificar flores...

Resumir información de dataframe en R

Determinar la frecuencia de aparición de un elemento library(dplyr) frecuencias <- data.frame(id = datos$texto, value = datos$valor) frecuencias <- mutate(group_by(frecuencias,id), cumsum=cumsum(value)) datos.frec <-...

Eliminar columnas de un dataframe en R

Eliminar columnas de un dataframe # Carga de datos a utilizar id <- c(1,2,3,4,5,6,7,8,9) valor <- c(7,1,12,4,5,16,71,38,19) categoria <- c(rep(«bajo»,3),rep(«medio»,3),rep(«alto»,3)) color <- c(rep(«rojo»,1),rep(«azul»,2), rep(«naranja»,2),rep(«morado»,1),...

Ordenar datos en R

Ordenar dataframe por una columna # Cargar datos del dataframe id <- c(1,2,3,4,5,6,7,8,9) valor <- c(7,1,12,4,5,16,71,38,19) categoria <- c(rep(«bajo»,3),rep(«medio»,3),rep(«alto»,3)) datos <- data.frame(id=id, valor=valor, categoria=categoria) head(datos,...

Unificar categorías de dataframe en R

Unificar categorias sustituyendo por elementos de un conjunto # Ampliar el conjunto de datos datos$sexo <- c(«masculino»,»h», «hombre», «h»,»mujer»,»femenino», «mujer», «m») # Ver que valores toma la variable unique(datos$sexo) ## [1] «masculino» «h» «hombre»...