Neu in JMP® Pro 11

Erweiterte Techniken für komplexe Analysen

Auch mit JMP Pro, Version 11, gewinnen Wissenschaftler, Ingenieure und Marktforscher in Ihrem Unternehmen neue statistische Erkenntnisse und können prognostizieren, in welche Richtung sich Ihr Unternehmen entwickelt. Neben innovativen Methoden für die statistische Modellierung – einschließlich generalisierter Regression, Uplift-Modellierung und Analyse gemischter Modelle sowie des leistungsstarken Zuverlässigkeitsblockdiagramms – bietet JMP Pro den Datenanalysten in Ihrem Unternehmen die erforderlichen Tools, um ihre statistischen Erkenntnisse auf eine neue Ebene zu heben.

Lernen Sie diese neuen Funktionen in JMP® Pro Version 11 kennen

Gemischte Modelle

Mit gemischten Modellen können Sie Daten analysieren, die sowohl die Zeit als auch den Raum berücksichtigen. Sie können zum Beispiel gemischte Modelle in einem Studiendesign verwenden, in dem im Rahmen einer Medikamentenstudie bei mehreren Probanden mehrmals täglich bestimmte Werte gemessen werden, oder in Crossover-Studien in der Pharma-, Fertigungs- oder Chemieindustrie.

Mit der neuen Funktion der gemischten Modelle in „Modell anpassen“ können Sie in JMP Pro 11 nun Modelle mit gemischten Effekten an Ihre Daten anpassen. Sie können feste, zufallsbedingte und wiederholte Effekte angeben, Variablengruppen zuordnen und Subjekte und stetige Effekte einrichten – alles mit einer intuitiven Benutzeroberfläche, die per Mausklick zu bedienen ist.

Außerdem können Sie nun die Kovarianzparameter für eine größere Zahl von Korrelationsstrukturen berechnen:

  • wenn die Versuchseinheiten, deren Daten gemessen werden, in Cluster gruppiert werden können, und die Daten aus einem gemeinsamen Cluster korreliert werden.
  • wenn wiederholte Messungen in derselben Versuchseinheit durchgeführt werden und diese wiederholten Messungen korreliert werden oder eine sich ändernde Variabilität aufweisen.
Gemischte Modelle in JMP

Erstellen Sie gemischte Modelle und passen Sie sie an, um Daten zu analysieren, die sowohl die Zeit als auch den Raum erfassen.

Zurück nach oben

Generalisierte Regression

Generalisierte Regression in JMP

Mit der generalisierten Regression in JMP Pro können Sie auch bei schwieriger Datenlage bessere Vorhersagemodelle erstellen.

Die generalisierte Regression ist eine Klasse neuer Modellierungstechniken, die gut für die Erstellung besserer Vorhersagemodelle geeignet sind, selbst wenn die Datenlage nicht einfach ist. Sie passt generalisierte lineare Modelle mit regelbasierten oder penalisierten Regressionstechniken an.

Standardschätzungstechniken sind überfordert, wenn Sie stark korrelierte Prädiktoren oder mehr Prädiktoren als Beobachtungen haben. Und bei der Arbeit mit vielen korrelierten Prädiktoren (häufig bei Beobachtungsdaten) können die schrittweise Regression oder andere Standardtechniken unbefriedigende Ergebnisse erzielen. Solche Modelle sind häufig überangepasst und können nur schwer für neue Daten generalisiert werden. Aber wie entscheiden Sie, welche Variablen vor der Modellierung entfernt werden sollen oder – schlimmer – wie viel Zeit müssen Sie für die manuelle Vorverarbeitung von Tabellen für die Modellierung opfern?

Die generalisierte Regression in JMP Pro ist die Lösung für die Erstellung von Prognosemodellen anhand von großen, unstrukturierten Tabellen. Sie ist eine wichtige Erweiterung Ihrer Analyse-Toolbox für die Variablenauswahl oder die Erstellung von Data-Mining-Modellen bei einer sehr großen Anzahl von Prädiktoren. Die generalisierte Regression hilft Ihnen bei der Handhabung der Multikollinearität bei den erklärenden Variablen auf ausgesprochen natürliche Weise: Eine Überanpassung wird vermieden, indem die geschätzten Parameter mit einer Strafe für große Streuung belegt werden.

Die innerhalb der Funktion der generalisierten Regression verfügbaren Regularisierungstechniken umfassen Ridge, Lasso, adaptives Lasso, elastisches Netz und das adaptive elastische Netz, um X-Variablen mit Erklärungskraft besser identifizieren zu können. Die Nutzung dieser Techniken ist ebenso einfach wie alle anderen Modellierungsfunktionen in der Modellanpassung – Sie identifizieren einfach Ihre Kenngrößen, konstruieren Modelleffekte und wählen die gewünschte Schätzung und Validierungsmethode aus. JMP passt Ihr Modell automatisch an, führt ggf. eine Variablenauswahl durch und erstellt ein Prognosemodell, das für neue Daten generalisiert werden kann.

Die Funktion „Generalisierte Regression“ bietet die Optionen zur Auswahl geeigneter Verteilungsparameter für die Kenngrößen, die Sie modellieren. Zusätzlich zur standardmäßigen Normal- oder Binomialverteilung können Sie aus folgenden Verteilungen wählen:

  • Poisson – Wenn Sie die Verteilung von Häufigkeiten modellieren.
  • Zero-inflated Poisson – Wenn Ihre Häufigkeitsdaten mehr Nullwerte als erwartet enthalten.
  • Negativ Binomial – Für eine stark gestreckte Binomialverteilung.
  • Zero-inflated negativ Binomial – Wenn Sie zwei Quellen für die Streckung haben, eine in der Variabilität der Nicht-Nullwerte und eine für Häufigkeitsdaten mit mehr Nullen als erwartet.
  • Gamma – Wenn die Ergebnisse positive Ganzzahlwerte sind und Sie den Grad der vorhandenen Schiefe schätzen müssen.

Mithilfe von Ridge in der generalisierten Regression können Sie einfach Ensemble-Modelle Ihrer Modellvorhersagen erstellen. Verwenden Sie einfach die Prädiktorspalten als Eingaben und Ihre Ergebnisse als Y-Variablen. Diese leistungsstarke Strategie kann ein Aggregatmodell mit verbesserter Prognosefähigkeit erstellen und gleichzeitig den Effekt der Multikollinearität in den Prädiktoren minimieren.

Zurück nach oben

Uplift-Modellierung

Sie möchten möglicherweise den maximalen Nutzen aus Ihrem begrenzten Marketing-Budget ziehen, indem Sie gezielt nur an Personen Angebote senden, die aller Erwartung nach positiv darauf reagieren werden. Die Lösung dieser Aufgabe kann schwierig sein, insbesondere dann, wenn Sie große Tabellen und viele mögliche demografische und Verhaltensprädiktoren haben. Mit JMP Pro können Sie jedoch Uplift-Modelle für diese Vorhersage nutzen. Diese Methode, die auch als inkrementelle, True-Lift- oder Netzmodellierung bezeichnet wird, wurde entwickelt, um Marketingentscheidungen zu optimieren, personalisierte medizinische Protokolle zu definieren oder ganz allgemein Merkmale von Personen zu identifizieren, die auf eine bestimmte Aktion wahrscheinlich positiv reagieren werden.

Uplift-Modellierung in JMP Pro:
Passt Entscheidungsbäume an, die Teilungen ermitteln, die einen Behandlungsunterschied maximieren.
Hilft Personengruppen zu identifizieren, die wahrscheinlich positiv auf eine Aktion reagieren werden.
Trägt zur effizienten und gezielten Entscheidungsfindung bei, die die Ressourcenverteilung und die Wirkung auf den Einzelnen optimiert.
Verwendet dieselben Trainings-, Validierungs- und Testmethodologien wie andere Data-Mining-Methoden in JMP Pro. Dies verhindert eine Überanpassung, wodurch Ihr Modell besser für neue Daten generalisiert werden kann.
Uplift-Modellierung in JMP

Uplift-Modelle identifizieren die Kundensegmente, die am wahrscheinlichsten positiv auf ein Angebot oder eine Behandlung reagieren.

Zurück nach oben

Zuverlässigkeitsblockdiagramm

Zuverlässigkeitsblockdiagramm in JMP

Verwenden Sie das Zuverlässigkeitsblockdiagramm für das Design komplexer Systeme und zum Auffinden und Beheben von Schwächen innerhalb des Systems.

Häufig muss die Zuverlässigkeit eines komplexen Systems analysiert werden – zum Beispiel ein RAID-Speicher-Array mit mehreren Festplatten oder ein Flugzeug mit vier Motoren. In JMP haben Sie eine Reihe von Tools zur Verfügung, mit denen Sie die Zuverlässigkeit einzelner Komponenten innerhalb dieser Systeme analysieren können. In JMP Pro können Sie nun die Zuverlässigkeit einzelner Komponenten als Ausgangspunkt heranziehen, ein komplexes System mehrerer Komponenten erstellen und die Zuverlässigkeit des gesamten Systems mit der Plattform „Zuverlässigkeitblockdiagramm“ analysieren.

Diese Plattform ermöglicht es, die Zuverlässigkeit des Gesamtsystems besser vorherzusagen und die erwartete Leistung basierend auf der aktuellen Leistung einzelner Komponenten zu bestimmen. Führen Sie einfach Was-wäre-wenn-Analysen durch, indem Sie verschiedene Designs untersuchen und Diagramme mehrerer Systemdesigns vergleichen. Ermitteln Sie die besten Positionen, an denen die Redundanz erhöht werden sollte, um die Wahrscheinlichkeit eines Systemausfalls zu verringern. Mithilfe des Zuverlässigkeitsblockdiagramms können Sie einfach Schwachstellen in Ihrem System lokalisieren und beheben – und Sie sind besser informiert, um zukünftige Systemausfälle zu vermeiden.

Sie können in der Plattform „Zuverlässigkeitsblockdiagramm“ folgende Aktionen ausführen:
Ein Flussdiagramme erstellen und Designs in einer Bibliothek speichern.
Elementare, serielle, parallele, verknüpfte, oder K von N Elemente erstellen.
Verschachtelte Designs durch die Verknüpfung mehrerer Bibliothekselemente erstellen.
Kumulierte Verteilungen und Überlagerungen der verbleibenden Lebensdauer aller Modelle verwenden und bestimmen, welches Systemdesign über einen bestimmten Zeitraum zuverlässiger ist.
Ausfallratendiagramme verschiedener Systemarchitekturen untersuchen.

Zurück nach oben

Partielle kleinste Quadrate (PLS)

Versuchen Sie, Daten zu modellieren, die sehr breit, aber nicht sehr hoch sind? Herkömmliche Techniken funktionieren hier nicht – dies ist ein Einsatzbereich für die partiellen kleinsten Quadrate. Die PLS sind eine leistungsstarke Modellierungstechnik in Ihrer Toolbox, vor allem, wenn Sie mehr X-Variablen als Beobachtungen, hochgradig korrelierte X-Variablen, eine große Zahl von X-Variablen oder mehrere Y-Variablen und viele X-Variablen haben. In allen diesen Situationen würde die normale Analyse der kleinsten Quadrate unbefriedigende Ergebnisse liefern.

Die PLS-Modellierung passt lineare Modelle basierend auf Faktoren an, genauer gesagt, auf linearen Kombinationen von erklärenden Variablen (den X-Variablen). Bei der Ermittlung der Faktoren wird versucht, die Kovarianz zwischen den X-Variablen und der bzw. den Zielgrößen (Y-Variablen) zu maximieren. Weiterentwicklungen der PLS-Analyse machen diese Methode praktisch zu einer universellen Modellierungstechnik – einem Multitool für die statistische Modellierung, Variablenauswahl und prädiktive Analyse.

Verbesserungen der PLS-Modellierung in JMP Pro:
Handhabung fehlender Werte mit dem NIPALS-Algorithmus.
Unterstützung kategorialer Eingangsvariablen.
Variablenauswahl mithilfe des Variablengewichtungsdiagramms (VIP). Sie können die signifikanten Prädiktoren markieren und in eine Partition oder ein neuronales Modell laden. Die PLS-Plattform führt die Variablenauswahl automatisch durch und Sie können dann überschaubarere Modelle in Ihren anderen bevorzugten Modellierungsplattformen erstellen.
Automatisches Zentrieren und Skalieren von Daten.
Eine Option zur Standardisierung von X zentriert und skaliert die einzelne Variablen, die in einem polynomialen Effekt enthalten sind, vor der Anwendung von generellen Zentrierungs- und Skalierungsoptionen.
Unterstützung für die Anpassung eines Wirkungsflächenmodells mit einer Funktion der partiellen kleinsten Quadrate in der Modellanpassungs-Plattform.
Partielle kleinste Quadrate (PLS) in JMP

Verwenden Sie die Modellierung der partiellen kleinsten Quadrate in JMP Pro für die statistische Modellierung, Variablenauswahl und prädiktive Analyse.

Zurück nach oben

Clustern von Variablen

Clustern von Variablen in JMP

Das Clustern von Variablen für eine schnelle und einfache Dimensionsreduktion bietet eine Möglichkeit, Ihre Vorhersageprobleme einfacher zu lösen.

Wenn Sie eine große Zahl von Variablen für die Vorhersage eines Ergebnisses haben, sollten Sie die Variablenzahl möglichst reduzieren, um die Vorhersage zu vereinfachen. Eine mögliche Reduktionstechnik ist die bekannte Methode der Hauptkomponentenanalyse (Principal Component Analysis, PCA). Die aus der Hauptkomponentenanalyse gewonnenen Variablen können jedoch schwierig zu interpretieren sein. Eine alternative Strategie ist die Verwendung des Variablen-Clustering in JMP Pro. Es hilft Ihnen zu verstehen, ob Ihre Zielgrößen in Cluster gruppiert sind, und zu bestimmen, wie viele Cluster die Zielgrößen enthalten. Wenn Sie in JMP Pro, Version 11, einen Cluster innerhalb des Berichts auswählen, wird automatisch die repräsentativste Spalte des Clusters in der Datentabelle ausgewählt. Dadurch ist es wesentlich schneller und einfacher, Modellbegriffe festzulegen bzw. die Dimensionsreduktion durchzuführen.

Zurück nach oben

Dokumentation

Hier finden Sie ein PDF zu den neuen Funktionen in JMP und JMP Pro, sowie einen Link zur JMP Online Dokumentation mit Suchfunktion (in englischer Sprache).

Zurück nach oben