Métodos gráficos para presentar la información contenida en tablas

Además de las tablas, podemos utilizar diferentes gráficos para visualizar la información contenida en una base de datos. El tipo de representación dependerá del número de variables que queramos analizar y la naturaleza de las mismas.

En apartados anteriores ya hemos presentado algunas de las funciones gráficas que podremos aplicar con este fin (hist(), plot(), boxplot(). Por ese motivo nos centraremos en la aplicación de la función plot() al caso concreto de tablas.

Anteriormente hemos creado una tabla unidimensional con el número de casos que presentaban cada uno de los valores que adopta la variable IN. Podemos representar gráficamente la información contenida en esa tabla con la instrucción
barplot(table(resultados$IN))
cuyo resultado es el gráfico de la Figura [*], un gráfico de barras, que resulta una opción muy adecuada a una variable de este tipo.

Figura: Gráfico de barras con barplot()
Image barplot1

Para el caso de tablas bidimensionales podemos utilizar la función plot(). Por ejemplo, si queremos representar el número de insuficientes a lo largo de los diferentes años, podemos teclear
plot(table(IN,Año))
que proporciona el gráfico de la Figura [*]. Este gráfico permite descubrir algunas particularidades a primera vista, como el hecho de que durante los cuatro primeros años haya bastantes menos registros que durante los cuatro segundos; la disminución progresiva del alumnado con cero insuficientes; o la gran cantidad de alumnos que tuvieron 10 insuficientes en el año 1997.

Figura: Un gráfico interesante para tablas bidimensionales
Image grafico2D

Cuando la representación que queremos hace es de carácter multidimensional, la función plot() da lugar a un gráfico más complejo. Para ilustrarlo utilizaremos los datos contenidos en la tabla Titanic que viene con R. Ejecutando las siguientes instrucciones se obtiene la Figura [*].
El gráfico requiere mayor esfuerzo de interpretación pues se representa por un lado el sexo de la persona y si sobrevivió o no y, por otro, la clase de pasaje y la edad. Puede apreciarse como la mayor mortandad afectó a los varones adultos de clase inferior y que la mayor tasa de supervivencia se dio entre las mujeres de primera clase. Lo hemos obtenido del siguiente modo
data(Titanic)
plot(Titanic)

Figura: Representación gráfica de una tabla multidimensional
Image titanic
Logicamente, es posible representar parte de una tabla utilizando las técnicas de selección que ya conocemos. Por ejemplo, para analizar la evolución de la media de insuficientes en tercero a lo largo de los años podemos seleccionar la columna correspondiente de la última tabla elaborada. Para ello no habría mas que teclear
plot(tapply(IN,list(Año,Curso),mean)[,3],type=``l'')
En esta instrucción, con [,3] se le indica a R que seleccione todos los elementos de la tercera columna. Con type=``l'' se le dice que el gráfico sea de líneas. El resultado es el de la Figura [*]. Como puede observarse, en el eje de las abcisas aparece un índice en lugar del año. Como dijimos anteriormente, los retoques necesarios para hacer los gráficos más elegantes se verán en el capítulo final.
Figura: Representación de parte de una tabla multidimensional
Image seleccion
2007-02-12