Bagging en R

Uso: Clasificador de clases preestablecidas.

Descripción: Método de conjunto que construye múltiples árboles de decisión haciendo repetidamente remuestreo de los datos de entrenamiento con sustitución, y votando los árboles para hallar una predicción de consenso.

Variable dependiente: métricas y/o no métricas

Variables independientes: métricas y/o no métricas

Ejemplo en R: Clasificar tipo de flor atendiendo a sus características físicas como pueden ser el ancho y alto de los pétalos y sépalos.

# Carga el paquete especifico del método
library(ipred)

# Carga de datos inicial, tipos de flores con diferentes características 
data(iris)
datos <- iris
View(datos)

# Selección de una submuestra del 70% de los datos
set.seed(101)
tamano.total <- nrow(datos)
tamano.entreno <- round(tamano.total*0.7)
datos.indices <- sample(1:tamano.total , size=tamano.entreno)
datos.entreno <- datos[datos.indices,]
datos.test <- datos[-datos.indices,]

# Ejecución del modelo de Bagging
modelo <- bagging(Species~., data=datos.entreno)

# Resumen del ajuste del modelo
modelo
## 
## Bagging classification trees with 25 bootstrap replications 
## 
## Call: bagging.data.frame(formula = Species ~ ., data = datos.entreno)
# Hacer predicciones
predicciones <- predict(modelo, datos.test)

# Matriz de confusión
(mc <- with(datos.test,table(predicciones, Species)))
##             Species
## predicciones setosa versicolor virginica
##   setosa         15          0         0
##   versicolor      0         11         3
##   virginica       0          1        15
# % correcto
100 * sum(diag(mc)) / sum(mc)
## [1] 91.11111