¿Qué cereales forman parte de una dieta saludable? La muestra de datos Cereal.jmp (datos reales recopilados de las cajas de cereales más populares) presenta estadísticos sobre el contenido en fibra, calorías y otra información nutricional. Para identificar los cereales más saludables, interpretará, paso a paso, histogramas y estadísticos descriptivos, correlaciones y detección de valores atípicos, gráficos de dispersión y análisis de conglomerado.
La plataforma Distribución ilustra la distribución de una única variable (análisis univariante) mediante histogramas, gráficos adicionales e informes. El término univariante significa, simplemente, que se implica una variable en lugar de dos (bivariante) o varias (multivariante). No obstante, puede examinar la distribución de varias variables individuales dentro de un único informe. El contenido del informe para cada variable cambia en función de si la variable es categórica (nominal u ordinal) o continua.
1.
Seleccione Ayuda > Librería de muestra de datos y abra Cereal.jmp.
2.
Seleccione Análisis > Distribución.
3.
Pulse la tecla Ctrl y haga clic en Manufacturer, Calories, Fat y Fiber.
4.
Haga clic en Y, Columnas y, posteriormente, en Aceptar.
Figura 8.2 Distribuciones para Manufacturer, Calories, Fat y Fiber
Se etiqueta la fila que contenga Fiber One en Cereal.jmp. Esta etiqueta muestra el nombre del cereal junto a un punto de datos en los gráficos. Para ver la etiqueta completa, arrastre el borde vertical de la derecha hacia la derecha. Coloque el cursor sobre el punto de datos sin etiquetar para ver “All Bran with Extra Fiber”.
Figura 8.3 Distribuciones para los cereales Nabisco
Figura 8.4 Cereales ricos en fibra
Figura 8.5 Cereales ricos en fibra y bajo en calorías
1.
En la tabla de datos Cereal.jmp, haga clic en el triángulo invertido situado en la parte superior del panel Columnas para deseleccionar las filas.
Figura 8.6 Deseleccionar filas
2.
Seleccione Análisis > Métodos multivariantes > Multivariante.
3.
Seleccione desde Calories hasta Potassium, haga clic en Y, Columnas y, a continuación, haga clic en Aceptar.
Figura 8.7 Informe Correlaciones
Figura 8.8 Una parte de la matriz de gráficos de dispersión
4.
Haga clic en el triángulo rojo junto a Multivariante y seleccione Correlaciones por pares para que se muestre el informe del mismo nombre.
Figura 8.9 Una parte del informe Correlaciones por pares
5.
Para ver rápidamente qué pares guardan una alta correlación, haga clic con el botón derecho en el informe y seleccione Ordenar por columna, Prob. de significación y la casilla de verificación Ascendente; a continuación, haga clic en Aceptar.
Lo pares que tienen una correlación más alta aparecen al principio del informe. Los valores p de los pares que son bajos indican que hay evidencia de correlación. La correlación más significativa se produce entre Tot Carbo (carbohidratos totales) y Calories.
Figura 8.10 Valores p bajos de los pares
El conglomerado es una técnica multivariante que agrupa observaciones que compartan valores similares para una serie de variables. El conglomerado jerárquico combina filas en una secuencia jerárquica que se representan en forma de árbol. Los cereales con determinadas características, como alto contenido en fibra, se agrupan en conglomerados de modo que pueda observar las similitudes que presentan los cereales.
1.
Cuando se muestre Cereal.jmp, seleccione Análisis > Conglomeración > Conglomerado jerárquico.
2.
Seleccione desde Calories hasta Enriched, haga clic en Y, Columnas y, a continuación, haga clic en Aceptar.
Figura 8.11 Una parte del informe Conglomeración jerárquica
Figura 8.12 Conglomerados en color
Figura 8.13 Cereales similares en el primer conglomerado
Figura 8.14 Seleccionar un conglomerado
Figura 8.15 Resumen de conglomerado
Figura 8.16 Características del conglomerado uno