Test basados en la t de Student

Debemos abandonar el data.frame resultados para hacer una pequeña incursión en las pruebas paramétricas. Este tipo de pruebas sólo pueden ser aplicadas bajo la condición de normalidad y con variables medidas en escala de intervalo o de razón, y ninguna de las contenidas en él cumple esas condiciones. Para ilustrar el uso de la función t.test(), utilizaremos los datos contenidos en el data.frame survey del paquete MASS. Para cargarlo tecleamos
library(MASS)
data(survey)
attach(survey)
para obtener una descripción de los datos teclearemos
?survey

En el data.frame tenemos varias variables. Supongamos que nos interesa estudiar la estatura, que es una variable que se distribuye normalmente y se mide en una escala de razón, y su relación con el sexo y el carácter zurdo o diestro de los estudiantes. Para ver si hay diferencias por sexos, teclearíamos
t.test(Height~Sex)
que le dice a R que aplique el test a la variable altura diferenciando dos muestras en función del sexo (es lo que indicamos con la tilde que enlaza ambas variables) De nuevo, como hemos puesto los datos en la ruta de búsqueda con attach(survey), podemos hacer referencia directa al nombre de las variables. El resultado que sale por pantalla es
Welch Two Sample t-test
data: Height by Sex
t = -12.9243, df = 192.703, p-value = < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-15.14454 -11.13420
sample estimates:
mean in group Female mean in group Male
165.6867 178.8260
el valor de $p= < 2.2e-16$ nos indica que la hipótesis alternativa, es decir, que las medias de estatura de las dos muestras difieren significativamente, es perfectamente aceptable. Por el contrario, las diferencias entre los zurdos y los diestros no son significativas, ya que
t.test(Height~ W.Hnd)
da un $p-value = 0.2807$.

2007-02-12