Analysieren von Beziehungen

Intuitiv gesehen scheint es sinnvoll zu sein, dass Unternehmen mit mehr Mitarbeitern mehr Umsatz generieren als Unternehmen mit weniger Mitarbeitern. Ein Datenanalyst möchte den Gesamtumsatz für jedes Unternehmen basierend auf der Anzahl der Mitarbeiter prognostizieren.

Dieses Beispiel verwendet die Datentabelle Companies.jmp, die Finanzdaten für 32 Unternehmen aus der Pharma- und Computerindustrie enthält.

Um diese Aufgabe zu erfüllen, gehen Sie wie folgt vor:

•	Die Beziehung erkennen

•	Das Regressionsmodell anpassen

•	Durchschnittsumsatz vorhersagen

Dieses Streudiagramm stellt ein deutlicheres Bild der Beziehungen zwischen dem Umsatz und der Anzahl der Mitarbeiter dar. Wie erwartet, gilt: Je mehr Mitarbeiter ein Unternehmen hat, desto höhere Umsätze kann es generieren. Dies bestätigt visuell die Vermutung des Datenanalysten, prognostiziert aber keine Umsätze für eine gegebene Anzahl von Mitarbeitern.

Zuerst erstellen Sie ein Streudiagramm, um die Beziehung zwischen der Anzahl von Mitarbeitern und dem Umsatz zu ermitteln. Dieses Streudiagramm wurde in Streudiagramm erstellen im Visualisieren Ihrer Daten erstellt. Nachdem ein Ausreißer (ein Unternehmen mit deutlich mehr Mitarbeitern und höheren Umsätzen) ausgeblendet und ausgeschlossen wurde, zeigt das Diagramm in Abbildung 7.12 Streudiagramm von Sales ($M) gegen # Employ das Ergebnis.

Abbildung 7.12 Streudiagramm von Sales ($M) gegen # Employ

Das Regressionsmodell anpassen

Um den Umsatz aus der Anzahl der Mitarbeiter zu prognostizieren, passen Sie ein Regressionsmodell an. Klicken Sie auf das rote Dreieck für „Bivariate Anpassung“ und wählen Sie Gerade anpassen aus. Eine Regressionslinie wird dem Streudiagramm hinzugefügt und Berichte werden in das Berichtsfenster eingefügt.

Abbildung 7.13 Regressionslinie

In den Berichten sehen Sie sich folgende Ergebnisse an:

•	p-Wert von < 0,0001

•	r2-Wert 0,618

Aus diesen Ergebnissen kann der Datenanalyst folgende Schlussfolgerungen ziehen:

•	Der p-Wert für den Modellterm #Employ ist klein. Dies deutet darauf hin, dass der Koeffizient für #Employ beim Signifikanzniveau 0,05 nicht null ist. Daher lassen sich die Durchschnittsumsätze signifikant besser vorhersagen, wenn die Anzahl der Mitarbeiter in das Vorhersagemodell aufgenommen wird.

•

Der r²-Wert von 0,618 deutet darauf hin, dass dieses Modell 62 % der Variabilität beim Umsatz erklärt. Der r²-Wert ist das Bestimmtheitsmaß und zeigt den Anteil der Varianz in der abhängigen Variablen (Zielgröße) an, die von Ihrem Modell erklärt wird. r² kann zwischen 0 und 1 liegen. Ein Modell mit einem r² von 0 hat keine erklärende Wirkung. Ein Modell mit einem r² von 1 sagt die Zielgröße perfekt vorher.

Durchschnittsumsatz vorhersagen

Verwenden Sie das Regressionsmodell, um den Durchschnittsumsatz zu prognostizieren, den ein Unternehmen erwarten kann, wenn es eine bestimmte Anzahl von Mitarbeitern hat. Die Vorhersagegleichung für das Modell ist im Bericht enthalten:

Durchschnittsumsatz = 1059,68 + 0,092*Mitarbeiter

Beispiel: In einem Unternehmen mit 70.000 Mitarbeitern wird für den Umsatz ein Wert von 7.500 Dollar vorhergesagt:

7.499,68 Dollar = 1059,68 + 0,092*70.000

Im unteren rechten Bereich des aktuellen Streudiagramms befindet sich ein Ausreißer, der das allgemeine Muster der anderen Unternehmen nicht einhält. Der Datenanalyst möchte wissen, ob sich das Vorhersagemodell ändert, wenn dieser Ausreißer ausgeschlossen wird.

Ausschließen des Ausreißers

1.	Klicken Sie auf den Ausreißer.

2.	Wählen Sie Zeilen > Ausschließen/Einschließen.

3.	Um dieses Modell anzupassen, klicken Sie auf das rote Dreieck neben „Bivariate Anpassung von Sales (SM) nach # Employ“ und wählen Gerade anpassen aus.

Folgende Elemente werden dem Berichtsfenster hinzugefügt (Abbildung 7.14 Vergleichen der Modelle):

•	Eine neue Regressionslinie

•	Ein neuer Bericht zur geraden Anpassung, der enthält:

–	Eine neue Vorhersagegleichung

–	Ein neuer r2-Wert

Abbildung 7.14 Vergleichen der Modelle

Ergebnisse interpretieren

Unter Heranziehung der Ergebnisse in Abbildung 7.14 Vergleichen der Modelle kann der Datenanalyst folgende Schlussfolgerungen ziehen:

•	Der Ausreißer hat die Regressionslinie für die größeren Unternehmen heruntergezogen und für die kleineren Unternehmen nach oben gezogen.

•	Das neue Modell für die Daten ohne den Ausreißer ist ein stärkeres Modell als das erste Modell. Der neue r2-Wert von 0,88 ist höher und näher an 1 als der der anfänglichen Analyse.

Unter Heranziehung der neuen Vorhersagegleichung kann der prognostizierte Durchschnittsumsatz für ein Unternehmen mit 70.000 Mitarbeitern wie folgt berechnet werden:

8961,37 Dollar = 631,37 + 0,119*70.000

Die Vorhersage des ersten Modells lag bei ca. 7.500 Dollar. Das zweite Modell sagt einen Gesamtumsatz von ca. 8.960 Dollar bzw. einen Anstieg von 1.460 Dollar im Vergleich zum ersten Modell vorher.

Das zweite Modell, nach dem Entfernen des Ausreißers, beschreibt und prognostiziert Umsatzsummen basierend auf der Anzahl der Mitarbeiter besser als das erste Modell. Der Datenanalyst hat jetzt ein gutes Modell, das er verwenden kann.

Durchschnittswerte für eine Variable vergleichen

Wenn Sie eine stetige Y-Variable und eine kategoriale X-Variable haben, können Sie Durchschnittswerte über alle Ebenen der X-Variablen vergleichen.

Ein Geschäftsanalyst muss folgende Fragen untersuchen:

Dieses Beispiel verwendet die Datentabelle Companies.jmp, die Finanzdaten für 32 Unternehmen aus der Pharma- und Computerindustrie enthält.

•	Wie sind die Gewinne von Computerunternehmen mit denen von Pharmaunternehmen zu vergleichen?

Um diese Frage zu beantworten, passen Sie Profits ($M) nach Type an.

Beim Computertyp gibt es einen Ausreißer. Der Ausreißer dehnt die Skala des Diagramms aus und erschwert einen Vergleich der Gewinne. Schließen Sie den Ausreißer aus und blenden Sie ihn aus:

1.	Wählen Sie Hilfe > Beispieldatenbibliothek und öffnen Sie Companies.jmp.

2.	Wenn die Beispieldatentabelle Companies.jmp noch offen ist, sind darin vielleicht ausgeschlossene oder ausgeblendete Zeilen. Um die Zeilen in den Standardzustand zurückzusetzen (alle Zeilen eingeschlossen, keine ausgeblendet), wählen Sie Zeilen > Zeileneigenschaften aufheben.

3.	Wählen Sie Analysieren > Y nach X anpassen.

4.	Wählen Sie Profit ($M) aus und klicken Sie auf Y, Zielgröße.

5.	Wählen Sie Type und klicken Sie auf X, Faktor.

6.	Klicken Sie auf OK.

Abbildung 7.15 Gewinne nach Unternehmenstyp

1.	Klicken Sie auf den Ausreißer.

2.	Wählen Sie Zeilen > Ausschließen/Einschließen. Der Datenpunkt ist in den Berechnungen nicht mehr enthalten.

3.	Wählen Sie Zeilen > Ausblenden/Einblenden. Der Datenpunkt ist auf allen Graphen ausgeblendet.

4.	Um das Diagramm ohne den Ausreißer neu zu erstellen, klicken Sie auf „Einfaktorielle Analyse von Profits ($M) nach Type“ und wählen Wiederholen > Analyse wiederholen. Sie können das Original-Streudiagramm-Fenster schließen.

Abbildung 7.16 Aktualisiertes Diagramm

Durch das Entfernen des Ausreißers erhält der Finanzanalyst ein klareres Bild der Daten.

5.	Um den Zusammenhang weiter zu analysieren, wählen Sie über das rote Dreieck neben „Einfaktorielle Analyse von Profits ($M) nach Typ“ diese Optionen aus:

–	Anzeigeoptionen > Mittelwertlinie. Damit werden dem Streudiagramm Mittelwertlinien hinzugefügt.

–	Mittelwerte und Standardabweichung. Damit wird ein Bericht angezeigt, der Durchschnittswerte und Standardabweichungen enthält.

Abbildung 7.17 Mittelwertlinien und Bericht

Ergebnisse interpretieren

Der Finanzanalyst wollte einen Vergleich der Gewinne der Computerfirmen mit denen von Pharmafirmen anstellen. Das aktualisierte Streudiagramm zeigt, dass Pharmaunternehmen durchschnittlich einen höheren Gewinn ausweisen als Computerfirmen. Wenn Sie in dem Bericht den einen Mittelwert von dem anderen abziehen, beträgt der Gewinnunterschied rund 635 Mio. Dollar. Der Plot zeigt auch, dass einige Computerunternehmen Verluste aufweisen, alle Pharmaunternehmen Gewinne.

T-Test durchführen

Der Finanzanalyst hat nur einen Teil der Unternehmen untersucht (die Unternehmen in der Datentabelle). Ein Finanzanalyst möchte folgende Fragen beantworten:

•	Besteht ein Unterschied in der breiteren Population oder ist die Differenz von $635 Millionen ein Zufall?

•	Wenn ein Unterschied besteht, welcher?

Um diese Fragen zu beantworten, führen Sie einen Zwei-Stichproben-t-Test durch. Bei einem t-Test verwenden Sie Daten aus einer Stichprobe, um Inferenzen über die Grundgesamtheit zu erstellen.

Um den t-Test durchzuführen, klicken Sie auf das rote Dreieck für „Einfaktorielle Analyse“ und wählen Mittelwerte/ANOVA/gepooltes t aus.

Abbildung 7.18 t-Test-Ergebnisse

Der p-Wert 0,0001 ist kleiner als das Signifikanzniveau von 0,05, woraus statistische Signifikanz folgt. Daher kann der Finanzanalyst daraus schließen, dass die Differenz in den Durchschnittsgewinnen für die Stichprobendaten nicht nur zufallsbedingt ist. Dies bedeutet, dass in der Gesamtpopulation die durchschnittlichen Gewinne für Pharmaunternehmen von den durchschnittlichen Gewinnen der Computerunternehmen verschieden sind.

Verwenden Sie die Konfidenzintervallgrenzen, um zu ermitteln, wie groß der Unterschied der Gewinne der beiden Unternehmenstypen ist. Sehen Sie sich die Werte Diff KI oben und DIff KI unten in Abbildung 7.18 t-Test-Ergebnisse an. Der Geschäftsanalyst kommt zu der Schlussfolgerung, dass der durchschnittliche Gewinn von Pharmaunternehmen zwischen 343 Mio. Dollar und 926 Mio. Dollar höher ist als der durchschnittliche Gewinn von Computerunternehmen.

Anteile vergleichen

Wenn Sie kategoriale X- und Y- Variable haben, können Sie die Verhältnisse der Ebenen innerhalb der Y-Variablen mit den Ebenen innerhalb der X-Variablen vergleichen.

Der Geschäftsanalyst möchte wissen, ob die Größe eines Unternehmens die Gewinne eines Unternehmens bei einem Unternehmenstyp stärker beeinflusst als bei einem anderen. Bevor er allerdings diese Frage untersuchen kann, muss der Finanzanalyst wissen, ob die Populationen der Computer- und Pharmaunternehmen dieselben Verhältnisse von kleinen, mittleren und großen Unternehmen aufweisen.

In diesem Beispiel wird weiterhin die Datentabelle Companies.jmp verwendet. In Durchschnittswerte für eine Variable vergleichen hat ein Finanzanalyst ermittelt, dass Pharmaunternehmen durchschnittlich höhere Gewinne haben als Computerfirmen.

Ergebnisse interpretieren

1.	Wählen Sie Hilfe > Beispieldatenbibliothek und öffnen Sie Companies.jmp.

Wenn die Datendatei Companies.jmp aus dem vorherigen Beispiel noch offen ist, werden vielleicht Zeilen angezeigt, die ausgeschlossen oder verborgen sind. Um die Zeilen in den Standardzustand zurückzusetzen (alle Zeilen eingeschlossen, keine ausgeblendet), wählen Sie Zeilen > Zeileneigenschaften aufheben.

3.	Wählen Sie Analysieren > Y nach X anpassen.

4.	Wählen Sie Size Co aus und klicken Sie auf Y, Zielgröße.

5.	Wählen Sie Type und klicken Sie auf X, Faktor.

6.	Klicken Sie auf OK.

Abbildung 7.19 Unternehmensgröße nach Unternehmenstyp

Die Kontingenztabelle enthält Informationen, die auf dieses Beispiel nicht anwendbar sind. Klicken Sie auf das rote Dreieck für „Kontingenztabelle“ und wählen Sie Gesamt % und Spalte % ab, um diese Informationen zu entfernen. Abbildung 7.20 Aktualisierte Kontingenztabelle zeigt die aktualisierte Tabelle.

Abbildung 7.20 Aktualisierte Kontingenztabelle

Die Statistik in der Kontingenztabelle wird graphisch im Mosaikdiagramm dargestellt. Gemeinsam vergleichen das Mosaikdiagramm und die Kontingenztabelle den Prozentsatz von kleinen, mittleren und großen Unternehmen der beiden Branchen. Beispielsweise zeigt das Mosaikdiagramm, dass die Computerbranche im Vergleich zur Pharmabranche eine höhere Anzahl kleiner Unternehmen aufweist. Die Kontingenztabelle zeigt die exakten statistischen Daten: 70 % der Computerfirmen sind klein und rund 17 % der Pharmaunternehmen sind klein.

Test interpretieren

Der Finanzanalyst hat nur einen Teil der Unternehmen untersucht (die Unternehmen in der Datentabelle). Der Finanzanalyst möchte wissen, ob die Prozentsätze in den breiteren Populationen aller Computer- und Pharmaunternehmen anders sind.

Um diese Frage zu beantworten, verwenden Sie den p-Wert aus dem Pearson-Test im Bericht Tests (Unternehmensgröße nach Unternehmenstyp). Da der p-Wert von 0,011 geringer als das Signifikanzniveau von 0,05 ist, schließt der Geschäftsanalyst daraus:

•	Die Unterschiede in den Stichprobendaten sind nicht allein auf Zufall zurückzuführen.

•	Die Prozentsätze unterscheiden sich in der breiteren Population.

Jetzt weiß der Finanzanalyst, dass die Verhältnisse von kleinen, mittleren und großen Unternehmen verschieden sind und kann die Frage beantworten: Beeinflusst die Größe des Unternehmens die Gewinne bei einem Unternehmenstyp mehr als bei einem anderen?

Durchschnittswerte für mehrere Variablen vergleichen

Im Abschnitt Durchschnittswerte für eine Variable vergleichen wurden Durchschnittswerte über mehrere Ebenen einer kategorialen Variablen verglichen. Um Durchschnittswerte über die Ebenen von zwei oder mehr Variablen auf einmal zu vergleichen, verwenden Sie die Varianzanalyse (oder ANOVA).

Der Finanzanalyst kann die Frage beantworten, mit der wir begonnen haben, die Verhältnisse zu vergleichen: Hat die Größe eines Unternehmens eine größere Auswirkung auf die Unternehmensgewinne, wenn man den Typ (Pharma oder Computer) einbezieht?

Um diese Frage zu beantworten, vergleichen Sie die Unternehmensgewinne mit diesen beiden Variablen:

•	Typ (Pharma oder Computer)

•	Größe (klein, mittel, groß)

Um die Unterschiede der Gewinne für alle Kombinationen von „type“ und „size“ zu visualisieren, verwenden Sie ein Diagramm:

1.	Wählen Sie Hilfe > Beispieldatenbibliothek und öffnen Sie Companies.jmp.

2.	Wählen Sie Graph > Graphik erstellen. Das Fenster „Graphik erstellen“ erscheint.

3.	Klicken Sie auf Profits ($M) und ziehen Sie das Element in den Y-Bereich.

4.	Klicken Sie auf Size Co und ziehen Sie das Element in den Bereich X.

5.	Klicken Sie auf Type und ziehen Sie das Element in den Bereich Gruppe X.

Abbildung 7.21 Graph der Unternehmensprofile

Der Graph zeigt, dass eine große Computerfirma sehr große Gewinne macht. Dieser Ausreißer streckt die Skala des Graphen und erschwert damit den Vergleich der anderen Datenpunkte.

6.	Wählen Sie den Ausreißer aus, klicken Sie mit der rechten Maustaste darauf und wählen Sie Zeilen > Zeile ausschließen. Der Punkt wird entfernt und die Skala des Graphen wird automatisch aktualisiert.

7.	Klicken Sie auf das Balkensymbol . Das Vergleichen von Durchschnittsgewinnen ist mit Balkendiagrammen einfacher als mit Punkten.

Abbildung 7.22 Graph mit entferntem Ausreißer

Der aktualisierte Graph zeigt, dass Pharmaunternehmen höhere Durchschnittsgewinne haben. Der Graph zeigt auch, dass die Gewinne je nach den Unternehmensgrößen nur bei den Pharmaunternehmen unterschiedlich sind. Wenn sich die Wirkung einer Variablen (Unternehmensgröße) für verschiedene Stufen einer anderen Variablen (Unternehmenstyp) ändert, nennt man dies Wechselwirkung.

Beziehung quantifizieren

Da diese Daten nur eine Stichprobe sind, muss der Finanzanalyst Folgendes ermitteln:

•	Ob die Unterschiede auf diese Stichprobe begrenzt und auf Zufall zurückzuführen sind

oder

•	Ob dasselbe Muster in der breiteren Population festzustellen ist

1.	Kehren Sie zur Stichproben-Datentabelle Companies.jmp zurück, in der der Datenpunkt ausgeschlossen ist. Siehe Die Beziehung erkennen.

2.	Wählen Sie Analysieren > Modell anpassen.

3.	Wählen Sie Profits ($M) aus und klicken Sie auf Y.

4.	Wählen Sie sowohl Type als auch Size Co.

5.	Klicken Sie auf die Schaltfläche Makros und wählen Sie Vollfaktoriell.

6.	Aus dem Menü „Betonung“ wählen Sie Effektfilterung.

7.	Wählen Sie die Option Dialogfeld geöffnet lassen.

Abbildung 7.23 Fenster „Modell anpassen“

8.	Klicken Sie auf Ausführen. Im Berichtsfenster werden die Modellergebnisse angezeigt.

Um zu entscheiden, ob die Unterschiede in den Gewinnen real oder auf Zufall zurückzuführen sind, prüfen Sie den Bericht Effekttests.

Hinweis: Weitere Informationen zu allen Ergebnissen der Modellanpassung finden Sie im Kapitel zur Modellspezifikation in Fitting Linear Models.

Effekttests anzeigen

Der Bericht „Effekttests“ (Abbildung 7.24 Bericht „Effekttests“) zeigt die Ergebnisse der statistischen Tests. Es gibt einen Test für jeden Effekt, der im Modell des Fensters „Modell anpassen“ enthalten ist: Type, Size Co und Type*Size Co.

Abbildung 7.24 Bericht „Effekttests“

Sehen Sie sich erst den Test für die Wechselwirkung im Modell an: Type*Size Co-Effekt. Abbildung 7.22 Graph mit entferntem Ausreißer zeigte, dass die Pharmaunternehmen offenbar je nach Unternehmensgröße unterschiedliche Gewinngrößen aufweisen. Der Effekttest zeigt aber, dass es keine Wechselwirkung zwischen „type“ und „size“ in Bezug auf den Gewinn gibt. Der p-Wert von 0,218 ist groß (größer als das Signifikanzniveau von 0,05). Daher entfernen Sie diesen Effekt aus dem Modell und führen Sie das Modell erneut aus.

1.	Kehren Sie zum Fenster „Modell anpassen“ zurück.

2.	Im Feld „Modelleffekte konstruieren“ wählen Sie den Effekt Type*Size Co und klicken auf Entfernen.

3.	Klicken Sie auf Ausführen.

Abbildung 7.25 Aktualisierter Bericht „Effekttests“

Der p-Wert für den Size Co-Effekt ist groß und weist darauf hin, dass es in der Grundgesamtheit keine Unterschiede basierend auf der Größe gibt. Der p-Wert für den Type-Effekt ist klein und weist darauf hin, dass die Unterschiede, die Sie in den Daten zwischen den Computer- und Pharmafirmen gesehen haben, nicht auf Zufall beruhen.

Der Finanzanalyst wollte wissen, ob die Größe des Unternehmens je nach Computer- oder Pharmaunternehmen (Unternehmenstyp) eine größere Wirkung auf die Unternehmensgewinne hat. Der Finanzanalyst kann jetzt die Frage wie folgt beantworten:

•	Es besteht ein realer Unterschied in den Gewinnen von Computerfirmen und Pharmaunternehmen in der breiteren Population.

•	Es gibt keine Korrelation zwischen der Größe und dem Typ des Unternehmens und seinen Gewinnen.

Regression mit mehreren Prädiktoren verwenden

Im Abschnitt Regression mit einem Prädiktor verwenden wurde gezeigt, wie einfache Regressionsmodelle mit einer Prädiktorvariablen und einer Zielgrößenvariablen erstellt werden. Multiple Regression prognostiziert die durchschnittliche Zielgrößenvariable mit zwei oder mehr Prädiktorvariablen.

Ein Diätspezialist möchte mithilfe folgender Informationen die Kalorien prognostizieren:

In diesem Beispiel wird die Beispieldatentabelle Candy Bars.jmp verwendet, die Ernährungsdaten für Schokoriegel enthält.

•

Total fat

•	Carbohydrates

•

Protein

Verwenden Sie die multiple Regression, um die durchschnittliche Zielgrößenvariable mit diesen drei Prädiktorvariablen zu prognostizieren.

Um die Beziehung zwischen Kalorien und dem Gesamtfett (total fat), Kohlenhydraten (carbohydrates) und Protein zu ermitteln, erstellen Sie eine Streudiagramm-Matrix:

1.	Wählen Sie Hilfe > Beispieldatenbibliothek und öffnen Sie Candy Bars.jmp.

2.	Wählen Sie Graph > Streudiagramm-Matrix.

3.	Wählen Sie Calories aus und klicken Sie auf Y, Spalten.

4.	Wählen Sie Total fat g, Carbohydrate g und Protein g aus und klicken Sie auf X.

5.	Klicken Sie auf OK.

Abbildung 7.26 Ergebnisse der Streudiagramm-Matrix

Die Streudiagramm-Matrix zeigt, dass eine positive Korrelation zwischen Kalorien und allen drei Variablen besteht. Die Korrelation zwischen Kalorien und Gesamtfett ist am stärksten. Nachdem der Diätspezialist nun weiß, dass es eine Beziehung gibt, kann er ein multiples Regressionsmodell erstellen, um die durchschnittlichen Kalorien zu prognostizieren.

Das multiple Regressionsmodell erstellen

Verwenden Sie weiterhin die Beispieldatentabelle Candy Bars.jmp.

1.	Wählen Sie Analysieren > Modell anpassen.

2.	Wählen Sie Calories aus und klicken Sie auf Y.

3.	Wählen Sie Total fat g, Carbohydrate g und Protein g aus und klicken Sie auf Hinzufügen.

4.	Bei „Betonung“ wählen Sie Effektfilterung.

Abbildung 7.27 Fenster „Modell anpassen“

5.	Klicken Sie auf Ausführen.

Im Berichtsfenster werden die Modellergebnisse angezeigt. Um die Modellergebnisse zu interpretieren, konzentrieren Sie sich auf diese Bereiche:

•	Diagramm „Beobachtete Werte über Vorhersage“ anzeigen

•	Parameterschätzungen interpretieren

•	Vorhersageanalyse verwenden

Hinweis: Weitere Informationen zu allen Modellergebnissen finden Sie im Kapitel zur Modellspezifikation in Fitting Linear Models.

Diagramm „Beobachtete Werte über Vorhersage“ anzeigen

Das „Beobachtete Werte über Vorhersage“-Diagramm zeigt die tatsächlichen Kalorien gegenüber den prognostizierten Kalorien. Wenn sich die prognostizierten Werte den tatsächlichen Werten nähern, rücken die Punkte auf dem Streudiagramm näher zur roten Linie (Abbildung 7.28 Diagramm „Beobachtete Werte über Vorhersage“). Da die Punkte alle sehr nahe an der Linie liegen, können Sie sehen, dass das Modell auf Basis der gewählten Faktoren Kalorien gut prognostiziert.

Abbildung 7.28 Diagramm „Beobachtete Werte über Vorhersage“

Eine andere Messung der Modellgenauigkeit ist der r2-Wert (der unter dem Diagramm in Abbildung 7.28 Diagramm „Beobachtete Werte über Vorhersage“ erscheint). Der r2-Wert misst den Prozentsatz der Variabilität der Kalorien, der durch das Modell erklärt wird. Ein Wert näher an 1 bedeutet, dass das Modell eine gute Prognose liefert. In diesem Beispiel ist der r2-Wert 0,99.

Parameterschätzungen interpretieren

Der Parameterschätzer-Bericht zeigt die folgenden Informationen:

•	Die Modellkoeffizienten

•	p-Werte für jeden Parameter

Abbildung 7.29 Bericht „Parameterschätzer“

In diesem Beispiel sind die p-Werte alle sehr klein (<0,0001). Dies zeigt, dass alle drei Effekte (Fett, Kohlehydrate und Protein) signifikant zur Prognose der Kalorien beitragen.

Sie können die Modellkoeffizienten verwenden, um den Wert der Kalorien für bestimmte Werte von Fett, Kohlehydraten und Protein zu prognostizieren. Angenommen, Sie möchten die durchschnittlichen Kalorien für einen Schokoriegel ermitteln, der folgende Eigenschaften hat:

•	Fett = 11 g

•	Kohlehydrate = 43 g

•	Protein = 2 g

Mit diesen Werten können Sie die prognostizierten durchschnittlichen Kalorien wie folgt berechnen:

277,92 = -5,9643 + 8,99*11 + 4,0975*43 + 4,4013*2

Die Eigenschaften in diesem Beispiel sind dieselben wie für den Milky Way-Schokoriegel (Zeile 59 der Datentabelle). Die tatsächlichen Kalorien für Milky Way sind 280 und zeigen, dass das Modell eine gute Prognose liefert.

Vorhersageanalyse verwenden

Verwenden Sie die Vorhersageanalyse, um zu sehen, wie sich Änderungen der Faktoren auf die prognostizierten Werte auswirken. Die Profillinien zeigen die Größe der Änderungen in Kalorien bei Faktoränderungen. Die Linie für Total fat g ist die steilste. Das bedeutet, dass Änderungen am Gesamtfett die größte Auswirkung auf Kalorien haben.

Abbildung 7.30 Analysediagramm - Vorhersageanalyse

Klicken und ziehen Sie die senkrechte Linie für jeden Faktor, um zu sehen, wie sich der prognostizierte Wert ändert. Sie können auch auf die aktuellen Faktorwerte klicken und sie ändern. Beispiel: Klicken Sie auf die Faktorwerte und geben Sie die Werte für den Milky Way-Schokoriegel ein (Zeile 59).

Abbildung 7.31 Faktorwerte für Milky Way

Hinweis: Weitere Informationen zur Vorhersageanalyse finden Sie im Kapitel zum Analysediagramm in Profilers.