Test de Wilcoxon, de Mann-Whitney y de Kolmogorov-Smirnov

La función wilcox.test(), permite aplicar varias pruebas de significación: el test de rangos signados de Wilcoxon; el contraste de suma de rangos de Wilcoxon; y el test de la U de Mann-Whitney. Las diferencias entre ellos radican en los argumentos que se pasen a la función: si tenemos dos muestras y se incorpora la opción paired=T, tendremos muestras emparejadas y el test aplicado será el de suma de rangos de Wilcoxon. Si dejamos la opción por defecto, que es paired=F, el test aplicado será el de Mann-Whitney. Si sólo hay una muestra, podemos utilizar la función como contraste de localización incorporando como argumento el valor(mu) de la mediana que queremos contrastar.

Nosotros nos centraremos en la aplicación de la función para contrastar la hipótesis de que dos muestras provengan, o no, de la misma distribución.
Supongamos que en nuestra centro educativo se ha definido un índice algebráico para medir el rendimiento académico del alumnado y se quiere contrastar su adecuación comparando los resultados obtenidos con el índice con las valoraciones realizadas por el profesorado. En el Cuadro [*] se pueden ver los resultados obtenidos por los dos medios.

Tabla: Valoraciones alumnado
Alumno/a Valoración profesorado Valoración índice
1 1 1
2 4 4
3 1 1
4 1 1
5 2 2
6 2 1
7 3 3
8 4 4
9 5 5
10 3 3
11 2 2
12 5 5
13 4 5
14 3 3
15 2 2
16 3 3
17 2 2
18 4 5
19 4 4
20 4 3
     


Para llevar a cabo la prueba tecleamos:
profes<-c(1,4,1,1,2,2,3,4,5,3,2,5,4,3,2,3,2,4,4,4)
indice<-c(1,4,1,1,2,1,3,4,5,3,2,5,5,3,2,3,2,5,4,3)
wilcox.test(profes,indice,paired=T)
En las dos primeras instrucciones se asignan los valores de las muestras a contrastar, y en la tercera se aplica la función a las mismas, indicando que se trata de muestras emparejadas. El resultado es
Wilcoxon signed rank test with continuity correction
data: profes and indice
V = 5, p-value = 1
alternative hypothesis: true mu is not equal to 0
Warning messages:
1: Cannot compute exact p-value with ties in: wilcox.test.default(profes, indice, paired = T)
2: Cannot compute exact p-value with zeroes in: wilcox.test.default(profes, indice, paired = T)
a pesar de los dos mensajes que da, informando de los problemas encontrados, queda de manifiesto que la hipótesis nula, que establece el mismo origen de las dos muestras, queda totalmente confirmada ya que la probabilidad de que así sea es máxima ($p=1$).

A la misma conclusión llegamos aplicando el test de Kolmogorov-Smirnov para dos muestras. La función de R encargada de esta prueba es ks.test(). En el ejemplo que nos ocupa, deberíamos teclear
ks.test(profes,indice)
cuyo resultado es
Two-sample Kolmogorov-Smirnov test
data: profes and indice
D = 0.1, p-value = 1
alternative hypothesis: two.sided

2007-02-12