Gráfico en mosaico

¿Qué es un gráfico en mosaico?

Un gráfico en mosaico es un tipo especial de diagrama de barras apiladas que muestra los porcentajes de datos en distintos grupos. Es una representación gráfica de una tabla de contingencia.

¿Cómo se usan los gráficos en mosaico?

Los gráficos en mosaico se usan para mostrar relaciones y ofrecer una comparativa visual entre distintos grupos. 

Los gráficos en mosaico ilustran relaciones

Un gráfico en mosaico es un ejemplo especial de diagrama de barras apiladas. Con dos variables, el ancho de las columnas es proporcional al número de observaciones de cada nivel de la misma representadas en el eje horizontal. La vertical de las barras es proporcional al número de la segunda variable en cada nivel de la primera.

Los gráficos en mosaico ayudan a identificar relaciones y ofrece una manera visual de comparar grupos. En la figura 1 se muestra un gráfico en mosaico con los datos de un ensayo clínico. El objetivo es comparar la distribución de pacientes de más de 65 años tanto en el grupo de placebo como en el grupo experimental. Idealmente, este ensayo tendrá aproximadamente el mismo porcentaje de pacientes mayores en ambos grupos.

Figura 1: Gráfico en mosaico que compara la distribución de sujetos de edad avanzada en dos grupos de tratamiento

El gráfico en mosaico de la figura 1 indica que el grupo placebo tiene un mayor porcentaje de pacientes ancianos que el grupo de estudio del fármaco. El equipo que realiza el ensayo tendrá que decidir si los porcentajes están lo bastante próximos para alcanzar o no el objetivo. El gráfico en mosaico también revela que hay un porcentaje total más bajo de personas mayores.

Ejemplos de gráfico en mosaico

Ejemplo 1: Añadir etiquetas

La figura 2 amplía el ejemplo básico agregando etiquetas al gráfico en mosaico.

Figura 2: Gráfico en mosaico que compara la distribución de sujetos de edad avanzada en dos grupos de tratamiento, etiquetado por porcentajes

Ahora podemos ver que hay una diferencia de un 10 % en el porcentaje de pacientes mayores en el grupo de control y el experimental. Podemos usar una prueba de independencia de ji cuadrado para determinar si esta diferencia es significativa o no.

Agregar etiquetas a un gráfico en mosaico tiene sentido cuando solo hay unas cuantas celdas. Cuando hay muchas celdas, las más pequeñas pueden quedarse sin etiquetar. Cuando el conjunto de datos es pequeño, se pueden usar etiquetas de conteo en lugar de porcentajes para destacar que la visualización parte de información limitada. 

Ejemplo 2: dos variables para las categorías

Los gráficos en mosaico se pueden extender a más de dos variables. El gráfico de la figura 3 muestra los porcentajes de supervivencia de los pasajeros del Titanic. Las categorías se forman por la combinación de niveles según tipo de billete y según género del pasajero. 

Figura 3: Gráfico en mosaico que compara los índices de supervivencia por clase de los pasajeros y sexo

Ejemplo 3: porcentajes en el eje X

Los gráficos en mosaico pueden mostrar porcentajes en el eje X. La figura 4 muestra los datos de estudiantes en escuelas rurales y urbanas. Se preguntó a estos estudiantes si su meta principal era sacar buenas notas, tener éxito en los deportes o ser popular.

Figura 4: Gráfico en mosaico que compara objetivos de estudiantes en diferentes ubicaciones de escuelas

El gráfico en mosaico muestra que los objetivos de los estudiantes de zonas urbanas y de zonas suburbanas son muy parecidos entre sí, con porcentajes muy próximos. Los estudiantes de zonas rurales tienen objetivos diferentes, y están repartidos casi por igual entre los tres objetivos. Otra posibilidad es etiquetar un gráfico en mosaico con conteos. 

Ejemplo 4: usar listas ordenadas

A veces el gráfico en mosaico revela un orden natural por las categorías. Consulte el ejemplo 2 de datos de supervivencia del Titanic. 

Cuando el gráfico en mosaico no tiene un orden natural, puede resultar difícil de usar en comparaciones visuales. El gráfico de la figura 5 muestra la distribución de lugares de fabricación entre categorías de vehículo.

Figura 5: Gráfico en mosaico de la distribución de ubicaciones de fabricación en cada categoría de vehículo

Podemos ver que todos los coches grandes se fabrican en EE. UU., pero es difícil comparar los porcentajes de coches medianos y compactos fabricados allí. 

Podemos mejorar el gráfico en mosaico ordenando las categorías de vehículo en orden ascendente de porcentajes de fabricación en EE. UU. La figura 6 muestra el gráfico en mosaico revisado. Podemos comparar los grupos de este gráfico más fácilmente.

Figura 6: Gráfico en mosaico de la distribución de ubicaciones de fabricación en cada categoría de vehículo, ordenada por porcentaje de fabricantes de EE.UU.

Ahora podemos ver que en EE.UU. se fabrican más coches compactos que de tamaño medio. El gráfico ordenado también destaca que todos los coches grandes se fabrican en EE.UU.