ANOVA en R

Uso: Determinar si existe similitud entre grupos.

Objetivo: Compara si los valores de un conjunto de datos numéricos son significativamente distintos a los valores de otro conjunto de variables.

Variable dependiente: Métrica.

Variables independientes: Métricas

Ejemplo en R: Determinar si tamaño de los tornillos depende de la jornada de trabajo en la que se fabriquen al cabo del año.

# Comparación de medias, ANOVA de un nivel ( Prueba paramétrica )
set.seed(10)
# Construimos 3 variables aleatorias del tamaño de tornillos fabricados en diferentes jornadas de una fábrica
jornada1 <- rnorm(365,10)
jornada2 <- rnorm(365,10.03)
jornada3 <- rnorm(365,10.09)

x <- c(jornada1,jornada2,jornada3) # Unión de las 3 variables en una

# La variable factores identifica los casos pertenecientes a las distintas jornadas
factores <- factor(c(rep("jornada1",365),rep("jornada2",365),rep("jornada3",365))) # Factores

# Calculo de ANOVA
modelo <- aov(x~factores)
summary(modelo)
##               Df Sum Sq Mean Sq F value Pr(>F)  
## factores       2    5.3  2.6260   2.654 0.0708 .
## Residuals   1092 1080.5  0.9895                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Como el p-valor es mayor que 0,05 se puede indicar que no existen diferencias significativas entre los tornillos fabricados en las diferentes jornadas

# Las estimaciones de los parámetros se obtienen con:
model.tables(modelo)
## Tables of effects
## 
##  factores 
## factores
## jornada1 jornada2 jornada3 
## -0.04631 -0.05159  0.09789

 

Otros artículos que pueden ser de interés:

Autor: Diego Calvo