Test de $\chi^2$ para tablas de contingencia

Este tipo de pruebas suele utilizarse para analizar la homogeneidad de una variable respecto a otra. Consideremos el siguiente caso: en el centro escolar se han recogido los datos de la Tabla [*] que representa el número de alumnos/as que supera/repite el primer curso de bachillerato en relación al número de áreas que suspendió el curso precedente (0,1,2 o más). Si analizamos la tabla, parece claro que no tienen las mismas probabilidades de susperar el curso los alumnos que aprobaron todas las áreas que los que promocionaron con alguna área suspensa, pero deseamos poner a prueba estadísticamente esta suposición. Podríamos hacerlo mediante la $\chi^2$ de la siguiente manera
promocionan<-c(101,14,7)
repiten<-c(14,25,13)
tabla3<-data.frame(promocionan,repiten,row.names=c(``0'',''1'',''2+''))
Con las dos primeras instrucciones creamos los vectores que formarán las columnas con valores de la tabla de contingencia. Con la tercera creamos un data.frame, llamado tabla3, en el que introducimos como nombres de filas (row.names) los correspondientes a 0,1,2+ suspensos.

Tabla: Promoción con suspensos
Suspensos curso anterior Promocionan Repiten
0 101 14
1 14 25
2+ 7 13
     


Una vez creada la tabla de contingencia, podemos aplicar el test mediante
chisq.test(tabla3)
cuya salida es
Pearson's Chi-squared test
data: tabla3
X-squared = 50.777, df = 2, p-value = 9.417e-12
el valor de $p = 9.417e-1$ permite rechazar claramente la hipótesis de homogeneidad de la variable repetir/no repetir en relación con la variable número de suspensos en el curso anterior lo que demuestra claramente que, a la hora de aprobar o repetir el primer curso de bachillerato, no es lo mismo haber aprobado la ESO con 0, 1 o 2 o más áreas suspensas.

2007-02-12