Diagrama en árbol

¿Qué es un diagrama en árbol?

Un diagrama en árbol muestra la estructura jerárquica de los datos utilizando rectángulos de colores y tamaños diferentes.

¿Cómo se usan los diagramas en árbol?

Los diagramas en árbol permiten ver la jerarquía de datos y las relaciones entre variables.

Los diagramas en árbol muestran datos jerárquicos

Un diagrama en árbol es una disposición de rectángulos que muestra la  estructura jerárquica de sus datos. Los diagramas en árbol se originaron como forma de mostrar la estructura y tamaño de los archivos del disco duro de un ordenador. Actualmente, los diagramas en árbol se utilizan en muchas situaciones, incluidas situaciones que no tienen jerarquía. Los diagramas en árbol pueden mostrar gran cantidad de datos en un espacio pequeño.   

Los diagramas en árbol son casi siempre generados por ordenador. Las herramientas de software utilizan un algoritmo para construir rectángulos de tamaño proporcional al número de observaciones que corresponden a cada rectángulo. La mayor parte de herramientas ofrecen la opción de colorear los rectángulos y de agregarles etiquetas. Algunas herramientas permiten explorar para mostrar más detalles, lo cual es útil cuando un  diagrama en árbol está compuesto de rectángulos de pequeño tamaño y las etiquetas no se ven con claridad.

El sencillo diagrama en árbol de la figura 1 muestra la estructura de ventas para empresas pequeñas, medianas y grandes. El tamaño de los rectángulos está relacionado con el promedio de ventas (en USD) para las categorías de las empresas, y el color, con los beneficios por empleado. 

Figura 1: Diagrama en árbol de tamaño de empresa y beneficios por empleado

En el gráfico de la figura 1 se muestra la idea básica de un diagrama en árbol. A partir de este ejemplo se llega a la conclusión de que las empresas de tamaño medio tienen los beneficios por empleado más altos, a partir del color de los rectángulos. Llega a la conclusión de que las empresas grandes tienen las mayores ventas promedio a partir del tamaño de los rectángulos. Sin embargo, los diagramas en árbol se pueden utilizar para visualizar datos más complejos. Las variables con jerarquías complejas son buenas candidatas para la visualización con un diagrama en árbol. 

Ejemplos de diagrama en árbol

Ejemplo 1: Diagrama en árbol de categoría y jerarquía

Ampliando este ejemplo básico, el diagrama en árbol de la figura 2 muestra dos categorías de empresas y la estructura de ventas para empresas pequeñas, medianas y grandes en cada categoría. En el diagrama en árbol, el tamaño de los rectángulos está asociado a las ventas medias en USD para la combinación de categoría-tamaño. Los colores de los rectángulos en el diagrama en árbol responden al beneficio por empleado. 

Figura 2: Diagrama en árbol con dos categorías de empresas

En el diagrama en árbol de la figura 2 podemos ver que la relación más alta beneficio/empleado es para las empresas farmacéuticas pequeñas. Por los tamaños de los rectángulos, vemos que las grandes empresas en ambas categorías tienen las ventas más altas. También vemos que las empresas de informática medianas tienen una relación beneficio/empleado negativa. El diagrama en árbol no puede etiquetar el menor de los rectángulos para las empresas farmacéuticas pequeñas. Esta situación es habitual con conjuntos de datos de gran tamaño que tienen como resultado muchos rectángulos pequeños. Aquí resultan útiles las herramientas que ofrecen "ayuda al pasar el ratón por encima" o permiten la exploración interactiva. 

La conclusión original de que las grandes empresas tienen las ventas promedio más altas sigue siendo cierta. No obstante, con el uso de la variable categoría vemos que la conclusión original de que las empresas medianas tienen la relación beneficio/empleado más alta no es cierta.

Ejemplo 2: Categorías y jerarquía para conjuntos de variables más grandes con muchos niveles

Los diagramas en árbol son más útiles para conjuntos de variables mayores con un gran número de niveles. En la figura 3 se muestran datos financieros similares a los de la figura 2. Ahora tenemos una variable para diferentes tipos de empresa, con seis niveles. También tenemos una variable para los tamaños de las empresas. En este ejemplo se muestran más categorías de empresas que en los ejemplos anteriores. El tamaño de los rectángulos responde al promedio de ventas en USD. El color de los rectángulos responde al tipo de empresa, y los rectángulos están agrupados por tamaño de empresa.

Figura 3: Diagrama en árbol con muchas variables y categorías

Este diagrama en árbol revela que las empresas petroleras tienen las ventas medias más altas de entre todos los niveles de jerarquía por tamaño de empresa. Las empresas de bebidas tienen las ventas medias más bajas de empresas grandes, pero no de empresas pequeñas o medianas. Entre las empresas pequeñas, las de jabones tienen las ventas medias más bajas. Entre las empresas medianas, las aeroespaciales tienen las ventas medias más bajas.

Ejemplo 3: Diagrama en árbol sin jerarquía

Los diagramas en árbol también pueden ser útiles para datos sin jerarquía. El diagrama en árbol de la figura 4 muestra las horas de sueño totales de varias especies de animal. Los rectángulos están escalados según la esperanza de vida, y coloreados según las horas de sueño.

Figura 4: Diagrama en árbol de datos sin jerarquía

A juzgar por los colores del diagrama en árbol de la figura 4, los murciélagos son los que duermen durante más tiempo en total. Por el tamaño del rectángulo, el murciélago marrón pequeño tiene una vida más larga que el murciélago marrón grande. El tamaño del rectángulo revela que el ser humano es el que vive más tiempo en el diagrama en árbol. 

Ejemplo 4: Categoría en eje Y

En ejemplos anteriores las categorías, o jerarquías, se muestran en el eje X. En el ejemplo de la figura 5 se muestra jerarquía de categorías en el eje Y. Los datos corresponden a coches de mediados de la década de 1990, y el tamaño de los cuadros del diagrama en árbol corresponden a las millas de autopista por galón (MPG) para los modelos de coches. La variable categoría del eje Y muestra si el coche se ha fabricado en EE.UU. o no.

Figure 5: Diagrama en árbol de datos con categorías en el eje Y

El diagrama en árbol es útil para ver patrones generales. Por ejemplo, los rectángulos naranjas, ¿son generalmente mayores que los azules? El Geo Metro tiene el MPG más alto de todos los coches. Utilizar la ayuda al pasar el ratón por encima facilitaría poder ver esto, ya que mostraría el MPG para cada rectángulo. El software ha ordenado los coches alfabéticamente de manera automática.

Ejemplo 5: Dos categorías 

Los diagramas en árbol son útiles para múltiples categorías, en el caso de categorías que definen la estructura. El diagrama en árbol de la figura 6 muestra los retrasos para seis líneas aéreas y los días de la semana como variables de categoría. El tamaño y el color de los rectángulos está relacionado con el retraso promedio de la llegada.

Figura 6: Diagrama en árbol con múltiples categorías

Para todas las líneas aéreas, el retraso promedio en la llegada varía a lo largo de los días de la semana. Si quiere elegir una línea aérea con los mínimos retrasos globales, el diagrama en árbol muestra que debe elegir Southwest o Delta. Para Southwest y Delta, el retraso promedio es de menos de ocho minutos a principios de semana y mayor los jueves y viernes. Para estas dos líneas aéreas, el retraso promedio máximo es de menos de 11 minutos. En cambio, en el caso de American, el mínimo retraso promedio es de 11 minutos. El retraso promedio mínimo en todo el diagrama en árbol es para Southwest, el martes. El retraso promedio máximo es para American, el viernes.