Método gráfico

Existen varias posibilidades para llevar a cabo este análisis. La primera y más clásica es la representación del histograma de frecuencias de la variable (por ejemplo, Figura [*])5.2.
Figura: Histograma con la función hist()
Image histograma1

Sin embargo, el histograma presenta por lo general el problema de la elección del número y amplitud de las clases. Estos problemas se resuelven si, en lugar de representar el histogrma, representamos la función de densidad de la variable. Para ello, R dispone de la función density(). Así, tecleando
plot(density(cars$speed))

Figura: Función de densidad con plot(density())
Image densidad
se obtiene la (Figura [*]). En este caso, permite apreciar un buen ajuste de los datos a la ley normal.

Otro método gráfico es la observación del gráfico Q-Q (cuantil-cuantil) de la variable. En este gráfico se representan los valores observados en el eje de ordenadas y los valores teóricos en el de las abcisas. Cuando la variable sigue una ley normal, los puntos deben alinearse en línea recta.
Para ilustrar el caso, vamos a considerar si determinado índice de resultados académicos (definido como una combinación lineal del número de IN,SF, B,NT y SB acumulados por el alumnado del data.frame resultados) se ajusta a la distribución normal. La secuencia de instrucciones a introducir sería la siguiente
resultados$indice<-(-2*IN)+SF+(2*B)+(3*NT)+(4*SB)
qqnorm(resultados$indice)
Con la primera instrucción creamos el índice y lo añadimos como una variable nueva al data.frame resultados. Con la segunda pedimos que dibuje el gráfico Q-Q de la nueva variable. El resultado es el de la Figura [*].

Figura: Gráfico Q-Q con la función qqnorm()
Image QQ1
En este caso se aprecia claramente que la variable no sigue la ley normal porque la nube de puntos no se ajusta en absoluto a una recta. Sin embargo, en muchas ocasiones la valoración visual puede llegar a ser problemática. Por ejemplo, si analizamos la misma variable seleccionando sólo los casos correspondientes al año 1996 (Figura [*]), vemos que no es tan fácil decidir si se ajusta o no a la ley normal ya que parece haber un segmento lineal más definido.
Figura: Otro gráfico Q-Q con la función qqnorm
Image QQ1996

Para estos casos es conveniente aplicar alguna prueba de inferencia no paramétrica como el test de Shapiro-Wilk que estudiamos a continuación.

2007-02-12