¿Qué cereales forman parte de una dieta saludable? La muestra de datos Cereal.jmp (datos reales recopilados de las cajas de cereales más populares) presenta estadísticos sobre el contenido en fibra, calorías y otra información nutricional. Para identificar los cereales más saludables, interpretará, paso a paso, histogramas y estadísticos descriptivos, correlaciones y detección de valores atípicos, gráficos de dispersión y análisis de conglomerado.
La plataforma Distribución ilustra la distribución de una única variable (análisis univariante) mediante histogramas, gráficos adicionales e informes. El término univariante significa, simplemente, que se implica una variable en lugar de dos (bivariante) o varias (multivariante). No obstante, puede examinar la distribución de varias variables individuales dentro de un único informe. El contenido del informe para cada variable cambia en función de si la variable es categórica (nominal u ordinal) o continua.
Nota: Para obtener más información acerca de la plataforma Distribución, consulte de Basic Analysis.
1.
|
2.
|
Seleccione Análisis > Distribución.
|
3.
|
4.
|
Se etiqueta la fila que contenga Fiber One en Cereal.jmp. Esta etiqueta muestra el nombre del cereal junto a un punto de datos en los gráficos. Para ver la etiqueta completa, arrastre el borde vertical de la derecha hacia la derecha. Coloque el cursor sobre el punto de datos sin etiquetar para ver “All Bran with Extra Fiber”.
Figura 8.3 Distribuciones para los cereales Nabisco
Figura 8.4 Cereales ricos en fibra
Figura 8.5 Cereales ricos en fibra y bajo en calorías
Consejo: Deje abierto el informe Distribuciones. Lo utilizará posteriormente en un análisis de conglomerado. Consulte Analizar valores similares.
Nota: Para obtener más información acerca de la plataforma Multivariante, consulte de Multivariate Methods.
1.
|
En la tabla de datos Cereal.jmp, haga clic en el triángulo invertido situado en la parte superior del panel Columnas para deseleccionar las filas.
|
Figura 8.6 Deseleccionar filas
2.
|
Seleccione Análisis > Métodos multivariantes > Multivariante.
|
3.
|
Seleccione desde Calories hasta Potassium, haga clic en Y, Columnas y, a continuación, haga clic en Aceptar.
|
Figura 8.7 Informe Correlaciones
4.
|
Haga clic en el triángulo rojo junto a Multivariante y seleccione Correlaciones por pares para que se muestre el informe del mismo nombre.
|
5.
|
Para ver rápidamente qué pares guardan una alta correlación, haga clic con el botón derecho en el informe y seleccione Ordenar por columna, Prob. de significación y la casilla de verificación Ascendente; a continuación, haga clic en Aceptar.
|
Lo pares que tienen una correlación más alta aparecen al principio del informe. Los valores p de los pares que son bajos indican que hay evidencia de correlación. La correlación más significativa se produce entre Tot Carbo (carbohidratos totales) y Calories.
El conglomerado es una técnica multivariante que agrupa observaciones que compartan valores similares para una serie de variables. El conglomerado jerárquico combina filas en una secuencia jerárquica que se representan en forma de árbol. Los cereales con determinadas características, como alto contenido en fibra, se agrupan en conglomerados de modo que pueda observar las similitudes que presentan los cereales.
Nota: Para obtener más información acerca de la conglomeración jerárquica, consulte de Multivariate Methods.
1.
|
2.
|
Seleccione desde Calories hasta Enriched, haga clic en Y, Columnas y, a continuación, haga clic en Aceptar.
|
Figura 8.11 Una parte del informe Conglomeración jerárquica
3.
|
Haga clic en el triángulo rojo junto a Conglomeración jerárquica y seleccione Colorear conglomerados.
|
Figura 8.12 Conglomerados en color
Figura 8.13 Cereales similares en el primer conglomerado
Figura 8.14 Seleccionar un conglomerado
5.
|
Figura 8.15 Resumen de conglomerado
6.
|
Haga clic en el triángulo rojo junto a Conglomeración jerárquica y seleccione Matriz de gráficos de dispersión.
|
Figura 8.16 Características del conglomerado uno