Graphique en mosaïque

Qu'est-ce qu'un graphique en mosaïque ?

Un graphique en mosaïque est un type particulier de diagramme en barres empilées qui montre les pourcentages de données dans les groupes. Il s'agit d'une représentation graphique d'un tableau de contingence.

Comment les graphiques en mosaïque sont-ils utilisés ?

Les graphiques en mosaïque sont utilisés pour montrer les relations et pour fournir une comparaison visuelle des groupes. 

Les graphiques en mosaïque montrent des relations

Un graphique en mosaïque est un type spécial de diagramme en barres empilées. Pour deux variables, la largeur des colonnes est proportionnelle au nombre d'observations à chaque niveau de la variable reportée sur l'axe horizontal. La longueur verticale des barres est proportionnelle au nombre d'observations dans la seconde variable, dans chaque niveau de la première variable.

Les graphiques en mosaïque aident à montrer les relations et constituent un moyen visuel de comparer les groupes. La Figure 1 montre le graphique en mosaïque pour les données issues d'un essai clinique. L'objectif est de comparer la distribution des patients qui ont plus de 65 ans à la fois dans le groupe placebo et celui traité avec le médicament qui fait l'objet de l'étude. Idéalement, l'essai clinique devrait présenter environ le même pourcentage de patients âgés pour chaque groupe de traitement.

Figure 1 : Graphique en mosaïque comparant la distribution des sujets âgés dans deux groupes de traitement

Le graphique en mosaïque de la Figure 1 montre que le groupe placebo comporte un pourcentage plus élevé de patients âgés que le groupe auquel le médicament à l'étude a été administré. L'équipe chargée de l'essai devra décider si les pourcentages sont « suffisamment proches » pour atteindre la cible ou non. Ce graphique en mosaïque montre également que le pourcentage de personnes âgées est globalement plus faible.

Exemples de graphiques en mosaïque

Exemple 1 : Ajouter des étiquettes

La Figure 2 étend l'exemple de base en ajoutant des étiquettes au graphique en mosaïque.

Figure 2 : Graphique en mosaïque comparant la distribution des sujets âgés dans deux groupes de traitement, avec étiquettes des pourcentages

Nous pouvons désormais voir qu'il y a environ 10 % de différence dans le pourcentage de patients âgés dans le groupe placebo et celui traité avec le médicament qui fait l'objet de l'étude. Nous pouvons utiliser le test du khi-deux d'indépendance pour évaluer si cette différence est importante ou pas.

Ajouter des étiquettes aux graphiques en mosaïque convient lorsqu'il n'y a que quelques cellules. Avec de nombreuses cellules, les plus petites cellules ne peuvent pas être étiquetées. Lorsque votre jeu de données est petit, des étiquettes de dénombrement peuvent être utilisées au lieu des pourcentages pour signaler que votre visualisation est fondée sur des informations limitées. 

Exemple 2 : Deux variables pour les catégories

Les graphiques en mosaïque peuvent être étendus à plus de deux variables. Le graphique de la figure 3 montre les pourcentages de survie des passagers du Titanic. Les catégories combinent la classe de billets et le sexe des passagers. 

Figure 3 : Graphique en mosaïque comparant les taux de survie par classe de passagers et par sexe

Exemple 3 : Pourcentages sur l'axe X

Les graphiques en mosaïque peuvent afficher les pourcentages sur l'axe X. La Figure 4 présente des données sur des élèves d'écoles urbaines et rurales. On a demandé aux élèves si leur objectif principal était d'avoir de bonnes notes, d'être bon en sport ou d'être populaire à l'école.

Figure 4 : Graphique en mosaïque comparant les objectifs des élèves de différentes écoles

Le graphique en mosaïque montre que les objectifs des élèves d'écoles urbaines et suburbaines sont très similaires, avec des pourcentages très proches. Les élèves d'écoles rurales ont, quant à eux, des objectifs différents et sont répartis presque de manière égale entre les trois objectifs. Sinon, il est également possible d'étiqueter un graphique en mosaïque avec des dénombrements.

Exemple 4 : Utiliser l'ordre de tri

Parfois, le graphique en mosaïque montre un ordre de tri naturel en raison des catégories. Voir l'exemple 2 pour les données de survie du Titanic. 

Lorsque le graphique en mosaïque n'a pas d'ordre naturel, il peut s'avérer difficile à utiliser pour des comparaisons visuelles. Le graphique de la Figure 5 montre la distribution des emplacements de fabrication selon les catégories de véhicules.

Figure 5 : Graphique en mosaïque de la distribution des sites de fabrication dans la catégorie de véhicules

Nous voyons que toutes les grandes voitures sont fabriquées aux États-Unis mais il est difficile de comparer les pourcentages de voitures compactes et de taille moyenne fabriquées aux États-Unis. 

Nous pouvons améliorer le graphique en mosaïque en classant les catégories de véhicules par ordre croissant de pourcentages fabriqués aux États-Unis. La Figure 6 montre le nouveau graphique en mosaïque révisé. Nous pouvons comparer les groupes plus facilement dans ce graphique.

Figure 6 : Graphique en mosaïque de la distribution des sites de fabrication dans la catégorie de véhicules, classée par pourcentage de constructeurs américains

Nous pouvons maintenant constater que les États-Unis fabriquent plus de voitures compactes que de voitures de taille moyenne. Le graphique souligne également que toutes les voitures de grande taille sont fabriquées aux États-Unis.