JMP® Pro

Tecniche sofisticate per analisi avanzate

JMP Pro, la versione avanzata dello strumento di analisi JMP, è pensata per chi ha bisogno di tecniche­ di modellizzazione sofisticate per anticipare e pianificare meglio il futuro. Realizzato per soddisfare le esigenze di scienziati e ingegneri, il software di analisi statistica JMP Pro di SAS offre funzionalità avanzate di visualizzazione, esplorazione, analisi e comunicazione dei dati in modo interattivo, tutte caratteristiche distintive di JMP.

Inoltre, JMP Pro offre un'ampia gamma di tecniche sofisticate: costruzione di modelli predittivi con crossvalidation tramite numerosi metodi, moderne tecniche di modellizzazione, funzionalità di confronto­ di modelli e calcolo della media, tecniche multivariate avanzate, diagrammi a blocchi di affidabilità, array di copertura, modelli misti, modelli uplift e metodi avanzati di statistica computazionale.

Gli avanzati metodi di analisi offerti da JMP Pro rimuovono qualsiasi ostacolo­ all'esplorazione statistica e aumentano la capacità di scoprire il messaggio nascosto nei dati. In questo modo l'utente può migliorare il livello di innovazione, sfruttare un approccio più proattivo e disporre di maggiore controllo sul futuro.

Collection of JMP Pro Screenshots

Principali caratteristiche

JMP Pro continua a stupirmi. Offre sempre nuove tecniche e strumenti di modellizzazione che semplificano il mio lavoro di analista di dati. La piattaforma Regressione generalizzata è rapida e facile da usare. Inoltre, la possibilità di creare variabili di test/convalida in tempo reale è utilissima.
Dick De Veaux
Dick De Veaux

C. Carlisle e Margaret Tippit docenti di statistica, Williams College

Modelli predittivi

Il data mining si basa su avanzati strumenti per la stima di modelli estesi che consentono una generalizzazione efficace con dati nuovi. JMP Pro include una serie completa di algoritmi per la costruzione di modelli più efficaci dai dati a disposizione. Due delle tecniche più utili per la costruzione di modelli predittivi sono gli alberi di decisione e le reti neurali.

La piattaforma di Partizione in JMP Pro automatizza il processo di creazione di alberi attraverso metodologie all'avanguardia. La foresta di bootstrap, tecnica basata su foreste casuali, costruisce decine di alberi di decisione utilizzando sottoserie casuali di dati e di variabili candidate, quindi calcola le medie. Attraverso la tecnica degli alberi boosted vengono generati svariati alberi semplici, che stimano ripetutamente i residui dall'albero precedente. La piattaforma di Partizione di JMP Pro stima anche i modelli K vicini più prossimi (K-NN). Questi metodi permettono di costruire modelli che spesso permettono di ottenere previsioni più efficaci rispetto ai modelli di alberi di decisione semplici.

La piattaforma avanzata Neurale, disponibile in JMP Pro, consente di generare reti neurali a uno o due livelli con la possibilità di scegliere tra tre funzioni di attivazione e costruzione automatica di modelli con boosting a gradienti. Questa piattaforma gestisce in modo completamente automatico i valori mancanti e la trasformazione delle variabili X continue garantendo un notevole risparmio di tempo e fatica. Inoltre, sono incluse opzioni di stima robusta.

Le piattaforme Partizione e Neurale di JMP Pro si avvalgono della crossvalidation. Lo scopo della convalida è descritto nella sezione successiva. Inoltre, la regressione stepwise, la regressione logistica (nominale e ordinale) e l'analisi discriminante di JMP Pro supportano l'utilizzo di una colonna di convalida.

Crossvalidation

Per ottenere modelli predittivi efficaci è necessario disporre di metodi di convalida infallibili; inoltre, in presenza di modelli estesi, vi è un rischio elevato di incorrere nei problemi legati alla sovraparametrizzazione. I modelli estesi dovrebbero sempre essere sottoposti a crossvalidation: JMP Pro offre questa funzione tramite partizionamento dei dati o holdback. Il principio di suddivisione in set di dati di training, convalida e test, ormai consolidato, permette di evitare le sovraparametrizzazioni e garantire che i modelli non dipendano esclusivamente dalle proprietà del campione specifico utilizzato per generarli.

L'approccio generale alla crossvalidation di JMP Pro consiste nell'utilizzare una colonna di convalida. È possibile suddividere i dati facilmente in diverse serie per svariati scopi utilizzando la utility Colonna di convalida (con campione puramente casuale o stratificato). Il set di training è utilizzato per la costruzione dei modelli. Il set di convalida è impiegato nel processo di costruzione del modello per determinarne la complessità. Infine, il set di test viene interamente tenuto fuori dal processo di costruzione del modello e utilizzato per valutare la qualità del modello. Per set di dati più limitati e su determinate piattaforme è possibile utilizzare anche la crossvalidation su k partizioni.

In tal modo i modelli sono facilmente generalizzabili e adattabili ai dati futuri, ad esempio a nuovi clienti, nuove procedure o nuovi rischi, garantendo la possibilità di dedurre previsioni più accurate.

Confronto di modelli

Nel mondo reale, alcune tipologie di modelli si adattano bene a determinate situazioni ma poco ad altre. JMP Pro offre numerose soluzioni di adattamento a situazioni reali: è sufficiente individuare la più appropriata alle condizioni specifiche. Un approccio tipico alla costruzione di modelli consiste nel provare modelli diversi: modelli più o meno complessi, modelli con o senza determinati fattori/predittori, modelli costruiti utilizzando metodi di modellizzazione diversi o addirittura medie di modelli multipli (modelli complessivi).

Ciascuno di essi presenterà misure di qualità comuni da utilizzare per la valutazione del modello: R2, tasso errori di classificazione, curve ROC, AUC, lift, ecc.

Il Confronto dei modelli di JMP Pro permette di paragonare le previsioni salvate nelle colonne di diverse stime e scegliere la migliore combinazione di bontà di adattamento, parsimonia e crossvalidation. JMP Pro esegue il confronto in modo automatico. Allo stesso tempo è possibile interagire con i Profiler visuali del modello per individuare i fattori importanti scelti da ciascun modello. JMP Pro effettua il confronto di modelli multipli contemporaneamente e provvede anche al calcolo delle medie di modelli semplici, ove richiesto.

Modellizzazione moderna

La regressione generalizzata è una categoria di nuove tecniche di modellizzazione particolarmente adatte alla costruzione di modelli più efficaci, anche in presenza di dati complessi. Essa esegue la stima di modelli lineari generalizzati usando metodi di regressione regolarizzata o con penalizzazione.

Le tecniche standard risultano inefficaci in presenza di predittori fortemente correlati o in presenza di un numero di predittori superiore alle osservazioni. Inoltre, in presenza di numerosi predittori correlati (caso frequente con i dati osservazionali), è possibile che la regressione stepwise o altre tecniche standard producano risultati insoddisfacenti. In molti casi i modelli risultano caratterizzati da sovra-stima e generalizzano inadeguatamente i nuovi dati. Ma come fare per decidere quali variabili selezionare prima della modellizzazione e, ancora peggio, quanto tempo si perde per la pre-elaborazione manuale dei data set nella fase di preparazione della modellizzazione?

La regressione generalizzata è una struttura di modellizzazione completa, che accompagna dalla selezione variabile, attraverso la diagnostica dei modelli, fino al confronto delle medie dei Minimi quadrati, alla previsione inversa e al profiling. JMP Pro è l'unico strumento a offrire questa funzionalità.

Le tecniche di regolarizzazione disponibili con la personalità di regressione generalizzata includono Ridge, Lazo, Lazo adattivo, Rete elastica e Rete elastica adattiva per agevolare l'identificazione delle X che potrebbero celare un potenziale esplicativo. L'utilizzo di queste tecniche è semplice come quello delle altre personalità di modellizzazione in Stima modello: una volta identificata la risposta, è sufficiente costruire gli effetti del modello e scegliere la stima e il metodo di convalida desiderati. JMP effettua automaticamente la stima dei dati, esegue all'occorrenza la selezione delle variabili e costruisce un modello predittivo generalizzabile sui nuovi dati. È possibile anche utilizzare una tecnica stepwise in avanti, eseguire la regressione dei quantili o la stima semplice utilizzando la massima verosimiglianza.

Infine, la regressione generalizzata offre opzioni per scegliere la distribuzione appropriata per la risposta da modellizzare, permettendo di lavorare su risposte più varie quali conteggi, dati con numerosi outlier o dati distorti.

Tecniche multivariate avanzate

JMP Pro include diverse tecniche avanzate per la costruzione di modelli più efficaci in presenza di problemi con dati che richiedono metodi di stima multivariata.

Minimi quadrati parziali State tentando di effettuare la modellizzazione di tabelle di dati che contengono più colonne che righe? Le tecniche tradizionali non producono risultati adeguati, ma i Minimi quadrati parziali sì. I Minimi quadrati parziali (PLS) costituiscono una tecnica di modellizzazione potente e preziosa, soprattutto quando si lavora con un numero di variabili X superiore alle osservazioni, con variabili X altamente correlate, con un numero elevato di variabili X o con svariate variabili Y e molte variabili X. In tutte le situazioni summenzionate, i Minimi quadrati tradizionali non permettono di ottenere risultati soddisfacenti.

La modellizzazione PLS stima i modelli lineari sulla base di diversi fattori, in particolare su combinazioni lineari di variabili esplicative (le X). I fattori sono ottenuti in modo tale da massimizzare la covarianza tra le X e la risposta o le risposte (le Y). Con JMP Pro è possibile costruire modelli PLS con risposte continue o categoriche (PLS-DA), specificare i termini di curvatura o gli effetti di interazione ed eseguire l'imputazione di valori mancanti.

Clusterizzazione di variabili Per prevedere un risultato in presenza di un numero elevato di variabili, potrebbe essere utile ridurre il numero di variabili per semplificare il problema di previsione. Una possibile tecnica di riduzione della dimensionalità è il rinomato metodo dell'analisi delle componenti principali (PCA). Le variabili ottenute con la PCA, tuttavia, potrebbero risultare difficili da interpretare.

In alternativa è possibile utilizzare la clusterizzazione delle variabili con JMP Pro per comprendere se le risposte sono raggruppate in cluster e per determinare il numero di cluster contenuto nelle risposte. La selezione di un cluster qualsiasi all'interno del report identifica automaticamente la colonna più rappresentativa del cluster nella tabella di dati, permettendo di specificare in modo molto più rapido e semplice i termini del modello o di eseguire la riduzione della dimensionalità.

Diagrammi a blocchi di affidabilità

Capita spesso di dover analizzare l'affidabilità di sistemi analitici particolarmente complessi, ad esempio un array di memorizzazione RAID con più unità fisse o un aeroplano con quattro motori. JMP mette a disposizione numerosi strumenti per analizzare l'affidabilità dei singoli componenti all'interno di questi sistemi. Ma con JMP Pro ora è possibile considerare l'affidabilità dei singoli componenti, costruire sistemi complessi con componenti multipli e analizzare l'affidabilità di un intero sistema tramite la piattaforma Diagramma a blocchi di affidabilità.

Essa permette di prevedere con maggiore efficacia l'affidabilità dell'intero sistema e determinare le prestazioni attese sulla base delle prestazioni attuali dei singoli componenti. È possibile effettuare analisi what-if in modo semplice considerando vari disegni e confrontando i grafici di più progetti. La funzione permette inoltre di determinare i punti migliori per aggiungere ridondanza e ridurre il rischio di guasti del sistema. Con i diagrammi a blocchi dell'affidabilità è possibile disegnare e porre rimedio ai punti deboli del sistema con facilità, oltre a essere meglio informati per evitare guasti del sistema in futuro.

Array di copertura

Gli array di copertura sono utilizzati per test di applicazioni in cui le interazioni fattoriali rischiano di provocare anomalie. Le singole esecuzioni sperimentali possono essere dispendiose. Di conseguenza, il disegno di esperimenti deve permettere di ottimizzare la probabilità di individuare i difetti riducendo al minimo il dispendio di tempo e denaro. Gli array di copertura rendono possibile tutto questo. JMP Pro permette di disegnare un esperimento per testare i sistemi deterministici e coprire tutte le possibili combinazioni di fattori fino a un certo ordine.

Inoltre, in presenza di combinazioni di fattori che danno origine a condizioni implausibili, il filtro interattivo delle combinazioni non consentite permette di escludere automaticamente dal piano tali combinazioni di impostazioni di fattori.

Uno degli enormi vantaggi deriva dal fatto che JMP Pro è uno strumento di analisi statistica e non un semplice strumento per il disegno di array di copertura. Con JMP Pro è possibile eseguire qualsiasi tipo di analisi statistica. Ad esempio, attualmente nessun altro software per il disegno di array di copertura permette anche di analizzare i dati sfruttando la regressione generalizzata.

Con JMP Pro è possibile importare qualsiasi tipo di disegno di array di copertura, generato con qualsiasi software, e ottimizzarlo ulteriormente, per poi analizzare i risultati. È possibile disegnare gli array personalmente senza dover fare affidamento su terzi per la costruzione degli esperimenti. Eseguite test più intelligenti con gli array di copertura di JMP Pro.

Modelli misti


I modelli misti permettono di analizzare i dati spazio-temporali. I modelli misti possono essere impiegati ad esempio nel disegno di studi che prevedono la misurazione di soggetti multipli in diverse fasi nell'ambito di studi clinici prolungati nel tempo, oppure per disegni crossover nei settori farmaceutico, manifatturiero o chimico.

JMP Pro permette di adattare modelli misti ai dati e specificare effetti fissi, casuali e ripetuti, mettere in correlazione gruppi di variabili e creare effetti per soggetti e fattori continui, il tutto grazie a un'interfaccia intuitiva con il semplice utilizzo del mouse.

Inoltre, ora è possibile calcolare i parametri di covarianza per un'ampia varietà di strutture di correlazione: ad esempio, quando le unità sperimentali su cui i dati vengono misurati possono essere raggruppate in cluster e i dati provenienti da un cluster comune sono correlati; oppure, quando vengono effettuate misure ripetute sulla stessa unità sperimentale e tali misure ripetute sono correlate o presentano una variabilità mutevole.

È inoltre facile determinare visivamente la struttura spaziale più adatta (se presente) da utilizzare nella specifica del modello quando si costruiscono modelli misti con JMP Pro.

Modelli uplift

Quando il budget per le iniziative di marketing è limitato, potrebbe essere necessario ottimizzare i risultati inviando offerte unicamente a soggetti inclini a rispondere in modo positivo. Questo compito potrebbe sembrare impegnativo, specialmente in presenza di data set di grandi dimensioni e di un numero elevato di possibili predittori comportamentali o demografici. Tuttavia, questo tipo di previsione è reso possibile da JMP Pro e dai modelli uplift. Questo metodo, noto anche come modellizzazione incrementale, true-lift o net, è stato sviluppato per contribuire a ottimizzare le decisioni di marketing, definire protocolli per farmaci personalizzati o, in termini più generali, identificare caratteristiche di soggetti maggiormente inclini a rispondere a particolari azioni.

I modelli uplift di JMP Pro permettono di stimare i modelli che presentano partizioni per massimizzare le differenze di trattamento. Aiutano a identificare i gruppi di soggetti maggiormente inclini a rispondere positivamente a un'azione, nonché a prendere decisioni efficaci e mirate che permettano di ottimizzare l'allocazione delle risorse e l'impatto sui soggetti.

Statistica computazionale avanzata

JMP Pro include test statistici esatti per tabelle di contingenza e test statistici non parametrici esatti per ANOVA a una variabile. Inoltre, JMP Pro include un metodo generale per le statistiche di bootstrapping nella maggior parte dei report di JMP.

La funzione di bootstrap consente di approssimare la distribuzione di campionamento di una statistica. JMP Pro è l'unico software di analisi statistica che consente il bootstrap su una statistica senza necessità di scrivere una sola riga di codice. Per funzione di bootstrap con un clic intendiamo la possibilità reale di eseguire il bootstrap di qualsiasi quantità in un report JMP con la semplice pressione di un tasto.

Questa tecnica è particolarmente utile quando si mettono in discussione assunti modello (o in loro assenza). Ad esempio, provate ad applicare le tecniche di bootstrap a risultati di modelli non lineari utilizzati per generare previsioni o determinare gli intervalli di copertura intorno a quantili. Il bootstrap può inoltre costituire un'alternativa per misurare il grado di incertezza nei modelli predittivi. Il bootstrap permette di valutare il livello di confidenza delle stime con un numero inferiore di assunti; tutto questo è reso ancora più semplice grazie alla funzione di bootstrap con un clic di JMP Pro.

La ricchezza di SAS® a vostra disposizione

Parte integrante della famiglia di prodotti SAS per l'analisi predittiva e il data mining, JMP Pro è facilmente collegabile a SAS per beneficiare di un numero maggiore di opzioni, sfruttare l'imbattibile precisione di SAS Analytics e utilizzare funzionalità avanzate di integrazione dati. Con o senza collegamento a SAS, JMP Pro è in grado di generare codice SAS di scoring per nuovi dati in modo semplice e rapido con i modelli creati in JMP.

 

Condividere e comunicare i risultati

DOW Flags

Dow Chemical ha adottato JMP Pro per la potenza offerta: i responsabili delle decisioni esigono infatti i migliori strumenti per l'esplorazione di data set estesi e l'estrazione efficiente della maggiore quantità possibile di informazioni.

Leggete la storiay

L'obiettivo di JMP è sempre stato quello di favorire l'esplorazione e l'individuazione del metodo più efficace per comunicare i risultati delle esplorazioni all'interno dell'organizzazione. JMP Pro include tutte le funzioni visive e interattive di JMP, oltre a garantire l'accessibilità dei dati in modi che probabilmente ritenevate impensabili. Attraverso il collegamento dinamico di dati, grafici e statistiche, JMP Pro trasforma le vostre indagini in diagrammi tridimensionali o grafici animati che mostrano i cambiamenti nel tempo e permettono di ottenere preziose informazioni utilizzabili per la creazione dei modelli e il processo di spiegazione.

Funzionalità esclusive di JMP® Pro

JMP Pro include tutte le caratteristiche di JMP, oltre alle funzioni supplementari di analisi avanzata elencate di seguito.


Modelli predittivi

Alberi di classificazione e regressione (modellizzazione di partizione)*
  • Foreste di bootstrap, tecnica basata su foreste casuali
  • Alberi con boosting
  • K-nearest neighbors prediction (K-NN).
  • Supporto per la colonna di convalida
Modellizzazione di reti neurali*
  • Gestione automatizzata di dati mancanti
  • Selezione automatica del numero di unità nascoste con boosting a gradienti
  • Stima di reti neurali a uno e due livelli
  • Trasformazione automatizzata di variabili di input
  • Tre funzioni di attivazione (tangente iperbolica, lineare, gaussiana)
  • Salvataggio di colonne di crossvalidation generate in modo casuale.
  • Salvataggio di covariate trasformate
  • Supporto per la colonna di convalida
Regressione stepwise
  • Supporto per la colonna di convalida
Regressione logistica (nominale e ordinale)
  • Supporto per la colonna di convalida
Analisi discriminante
  • Supporto per la colonna di convalida
Minimi quadrati standard
  • Supporto per la colonna di convalida

Cross-Validation

General approach using validation column and validation role in modeling platform launch dialogs.
Validation column utility
  • Automatic partitioning of data into training, validation and test portions; creation of validation columns.
  • Purely random or stratified random methods to create the holdback sets.
  • Validation column creation from platform launch by clicking validation column role.

Confronto di modelli

  • Confronto automatico di modelli costruiti con JMP Pro
  • Profiler
  • Statistiche di stima (R2, tasso errori di classificazione, curve ROC, AUC, lift)
  • Calcolo della media del modello

Modellizzazione moderna

Regressione generalizzata
  • Tecniche di regolarizzazione: Ridge, Lazo, Lazo adattivo, Rete elastica, Rete elastica adattiva
  • Selezione in avanti
  • Regressione quantile
  • Distribuzione normale, di Cauchy, esponenziale, gamma, beta, binomiale, beta-binomiale, di Poisson, binomiale negativa
  • Distribuzioni con eccesso di zeri (zero-inflated): binomiale, di Poisson, binomiale negativa, gamma.
  • Scelta delle tecniche di convalida: colonna di convalida, KFold, holdback, leave-one-out, BIC, AICc.

Tecniche multivariate avanzate

Creazione di modelli di Minimi quadrati parziali (PLS)
  • La personalità PLS in Stima modello supporta la risposta continua o categorica, nonché fattori, interazioni e termini polinomiali continui o categorici.
  • Imputazione dei valori mancanti di tipo NIPALS
  • Salvataggio di colonne di crossvalidation generate in modo casuale
  • Un'opzione Standardizza X che centra e scala le singole variabili incluse in un effetto polinomiale prima di applicare le opzioni di centratura e scalabilità.
  • Scelta dei metodi di convalida: Colonna di convalida, K sottoinsiemi, holdback, lascia fuori uno
Analisi delle componenti principali (PCA)
  • Clusterizzazione delle variabili nell'analisi delle componenti principali (PCA)

Diagrammi a blocchi sull'affidabilità

  • Costruzione di modelli sull'affidabilità di sistemi complessi
  • Uso di nodi di base, seriali, paralleli, knot e K su N per la costruzione di sistemi
  • Costruzione di disegni nidificati utilizzando elementi dalla libreria di disegno

Array di copertura

  • Disegno e analisi degli array di copertura.
  • Ottimizzazione dei disegno dopo la creazione per la riduzione delle ulteriori esecuzioni.
  • Utilizzo del filtro combinazioni non consentite per specificare le regioni di test non ammissibili.
  • Importazione degli array di copertura creati con altri software; analisi della copertura e, in via opzionale, ulteriore ottimizzazione.

Mixed Models

  • Specifica di effetti fissi, casuali e ripetuti
  • Correlazione di gruppi di variabili, creazione di effetti per l'oggetto e continui
  • Scelta della struttura di covarianza ripetuta
  • I variogrammi costituiscono uno strumento diagnostico visivo per determinare la struttura di correlazione spaziale (eventualmente) più appropriata.

Modelli uplift

  • Metodo degli alberi di decisione per identificare i segmenti di consumatori maggiormente inclini a rispondere in modo positivo a un'offerta o a un trattamento
  • Tecnica di modellizzazione incrementale, true-lift, di rete
  • Supporto per la colonna di convalida

Statistica computazionale avanzata

Analisi a una variabile
  • Test non parametrici esatti
Analisi della contingenza
  • Misure esatte di associazione
Bootstrapping generale
  • Bootstrap delle statistiche nella maggior parte dei report con un unico clic

*Genera codici SAS pronti all'uso con SAS Model Manager


Requisiti di sistema

JMP è eseguibile su sistemi operativi Microsoft Windows e Mac OS. Supporta sistemi a 32 e a 64 bit.


Back to Top