JMP® Pro

Des techniques sophistiquées pour des analyses poussées

Version avancée de JMP, JMP Pro a été créé pour les analystes expérimentés en quête de méthodes de modélisation sophistiquées pour mieux anticiper l'avenir et élaborer des plans fiables.­ Conçu pour les scientifiques et les ingénieurs, le logiciel d'analyse statistique JMP Pro de SAS offre toutes les fonctions interactives de visualisation, d'exploration, d'analyse et de communication des données de JMP.

De plus, JMP Pro inclut une multitude de techniques sophistiquées : modélisation prédictive avec validation faisant appel à différentes méthodes, techniques de modélisation modernes, comparaison de modèles, calcul de moyennes de modèles, techniques multivariées évoluées, diagrammes de fiabilité avec blocs, tableaux de recouvrement, modèles mixtes, modèles uplift (levier) et méthodes de calcul statistique avancées.­

Vous avez donc toutes les cartes en main pour simplifier vos analyses statistiques et mieux exploiter vos données.­ Résultat : vous ferez rapidement des découvertes capitales, ce qui vous permettra d'être plus proactif et de mieux maîtriser l'avenir.

Copies d’écran JMP Pro

Principales fonctionnalités

JMP Pro m'impressionne sans cesse. J'y trouve toujours des outils et techniques de modélisation inédits pour me simplifier la tâche au quotidien. La plate-forme Régression généralisée est rapide et simple d'emploi. Et la possibilité de créer des variables de test/validation à la volée est formidable.
Dick De Veaux
Dick De Veaux

C. Carlisle et Margaret Tippit, professeur de statistiques, Williams College

Modélisation

Le data mining repose sur ces outils avancés permettant d'ajuster les grands modèles particulièrement efficaces pour généraliser les nouvelles données. JMP Pro offre une multitude d'algorithmes permettant de créer de meilleurs modèles à partir de vos données. Les arbres de décision et les réseaux de neurones figurent parmi les techniques de modélisation prédictive les plus efficaces.

La plate-forme Partition de JMP Pro fait appel à des méthodes modernes pour automatiser le processus de construction arborescente. La forêt aléatoire (bootstrap forest) développe des dizaines d'arbres de décision à partir de sous-ensembles (ou jeux) aléatoires des données et de variables candidates, puis établit la moyenne de ces arbres. La technique de l'arbre augmenté (boosted tree) consiste à créer plusieurs arbres simples en ajustant constamment les résidus de l'arbre précédent. La plate-forme Partition de JMP Pro ajuste aussi les modèles K-NN (K voisins les plus proches). Ces méthodes permettent de créer des modèles qui fournissent souvent de meilleures prévisions que les modèles à base d'arbres de décision simples.

La plate-forme avancée Réseaux de neurones permet de construire des réseaux de neurones à une ou deux couches à l'aide de trois fonctions d'activation au choix et d'élaborer automatiquement un modèle via l'option Gradient Boosting. Cette plate-forme traite automatiquement les valeurs manquantes et la transformation des X continus, ce qui vous simplifie la tâche. Elle comprend en outre de solides options d'ajustement.

Les plates-formes Partition et Réseaux de neurones de JMP Pro tirent toutes deux parti de la validation. Les avantages de la validation sont abordés à la section suivante. Par ailleurs, dans JMP Pro, la régression pas à pas, la régression logistique (nominale et ordinale) et l'analyse discriminante prennent en charge l'utilisation d'une colonne de validation.

Validation

Pour une modélisation prédictive efficace, vous avez besoin d'outils de validation performants, les grands modèles étant de surcroît propices au surajustement. Les grands modèles doivent toujours faire l'objet d'une validation, ce qui est possible dans JMP Pro par le biais du partitionnement de données— ou retenue. La méthode consistant à diviser les données en jeux d’apprentissage, de validation et de test est utilisée depuis longtemps pour éviter le surajustement et s'assurer que les modèles créés ne sont pas exclusivement liés aux propriétés de l'échantillon sur lequel ils reposent.

Dans JMP Pro, l'approche générale de la validation consiste à utiliser une colonne de validation. L'utilitaire Colonne de validation vous permet de subdiviser facilement vos données en jeux au moyen d'un échantillon aléatoire simple ou stratifié. Le jeu d’apprentissage sert à créer le ou les modèles. Le jeu de validation sert, dans le processus de construction de modèles, à déterminer le niveau de complexité du modèle. Enfin, le jeu de test, qui est complètement exclu du processus de construction du modèle, permet d'évaluer la qualité du ou des modèles. Pour les jeux de données de petite taille, la validation en k blocs peut également être employée dans certaines plates-formes.

La validation permet de créer des modèles qui se prêteront bien à la généralisation des données futures — relatives aux nouveaux clients, processus ou risques — de sorte que vous puissiez procéder à des inférences.

Comparaison de modèles

Dans la réalité, un type de modèle peut être parfaitement adapté à certaines situations, mais inefficace dans d'autres. Dans JMP Pro, les techniques d'ajustement sont nombreuses et vous devez identifier celle qui convient le mieux à une situation donnée. L'une des approches de construction de modèle les plus courantes consiste à essayer un grand nombre de modèles différent : des modèles plus ou moins complexes, des modèles avec ou sans certains facteurs/régresseurs, des modèles créés à l'aide de diverses méthodes, et même des moyennes de plusieurs modèles (modèles d'ensemble).

Chacun de ces modèles inclura des mesures de qualité communes qui pourront être utilisées dans le cadre de leur évaluation : R carré, taux d’erreurs de classification, courbes ROC, AUC, courbes Lift, etc.

Modélisation moderne

La régression généralisée est un ensemble de nouvelles techniques de modélisation permettant de créer de meilleurs modèles prédictifs, même avec des données complexes. Elle ajuste les modèles linéaires généralisés selon des méthodes de régression régularisée ou avec pénalité.

En présence de régresseurs étroitement corrélés ou d'un nombre de régresseurs supérieur au nombre d'observations, les techniques d'estimation standard échouent. Lorsque les régresseurs corrélés sont nombreux (comme c'est souvent le cas dans les données d'observation), les résultats de la régression pas à pas et des autres techniques standard sont parfois décevants. Ces modèles sont souvent surajustés et ne se généralisent pas très bien. Mais comment choisir les variables à éliminer avant la modélisation? Et comment ne plus perdre de temps à pré-traiter manuellement les données?

La plate-forme Régression généralisée offre un cadre de modélisation complet: de la sélection des variables aux comparaisons des moyennes des moindres carrés, en passant par le diagnostic de modèle, la prévision inverse et le profilage. Et tout cela est uniquement disponible dans JMP Pro.

Les techniques de régularisation disponibles dans le cadre de la régression généralisée — Ridge, Lasso, Lasso adaptatif, Elastic Net et Elastic-net adaptatif — facilitent l'identification des X à caractère explicatif. Ces techniques sont aussi simples que les autres méthodes de modélisation de la plate-forme Modèle linéaire ; il suffit d'identifier la réponse, de choisir les effets du modèle et de sélectionner la méthode d'estimation et de validation souhaitée. JMP ajuste automatiquement les données, sélectionne les variables (le cas échéant) et crée un modèle prédictif pouvant être généralisé. Vous pouvez également utiliser une technique pas à pas ascendante, effectuer une régression quantile ou un ajustement simple à l'aide de la méthode du maximum de vraisemblance.

Enfin, grâce à des options permettant de choisir la distribution adaptée à la réponse que vous êtes en train de modéliser, la plate-forme Régression généralisée vous permet de modéliser une plus grande variété de réponses (quantités — ou dénombrements —, données aux valeurs aberrantes multiples, données faussées, etc.).


Techniques multivariées avancées

JMP Pro propose plusieurs techniques avancées pour vous permettre de créer de meilleurs modèles lorsque vous êtes confronté à des données exigeant des méthodes d'ajustement multivariées.

Moindres carrés partiels. Avez-vous déjà essayé de modéliser des données comportant davantage de colonnes que de lignes ? Les techniques classiques sont inefficaces, contrairement à celle des moindres carrés partiels (PLS, Partial Least Squares). Cette puissante technique de modélisation est indispensable dans de nombreux cas : nombre de variables X supérieur à celui d'observations, variables X étroitement corrélées, nombre élevé de variables X, ou rares variables Y et nombreuses variables X. Autant de situations où la technique des moindres carrés ordinaire ne produit que des résultats décevants.

La modélisation des moindres carrés partiels ajuste les modèles linéaires en fonction des facteurs, à savoir les combinaisons linéaires de variables explicatives (X). Les facteurs sont obtenus de manière à optimiser la covariance entre les X et la(es) réponse(s) (Y). Dans JMP Pro, vous pouvez créer des modèles PLS avec des réponses continues ou catégorielles (PLS-DA), spécifier des termes de courbure ou des effets d'interaction, et réaliser des imputations de valeurs manquantes.

Classification des variables. Face à une multitude de variables, le premier réflexe d'un utilisateur chargé de prévoir des résultats est d'en réduire le nombre pour résoudre plus rapidement son problème de prévision. La fameuse méthode d'analyse en composantes principales (ACP) est l'une des techniques de réduction de dimension possibles. Toutefois, elle produit souvent des variables difficiles à interpréter.

Une autre stratégie consiste à utiliser la fonction de classification des variables de JMP Pro, qui permet de savoir si les réponses sont regroupées en classes et de déterminer le nombre de classes contenues dans les réponses. Lorsque vous sélectionnez une classe au sein d'un rapport, la colonne la plus représentative de la classe est automatiquement sélectionnée dans la table de données, ce qui accélère et facilite la définition de termes de modèle ou la réduction de la dimension.

 

Diagramme de fiabilité

Vous devez souvent analyser la fiabilité d'un système analytique complexe – une baie de stockage RAID comportant plusieurs disques durs ou un quadriréacteur, par exemple. JMP met à votre disposition de nombreux outils pour analyser la fiabilité des différentes composantes de ce type de système. Avec la nouvelle plate-forme Diagramme de fiabilité de JMP Pro, vous pouvez en outre évaluer la fiabilité de composantes isolées, créer un système complexe avec de multiples composantes et analyser la fiabilité d'un système tout entier.

Cette plate-forme vous permet de mieux prévoir la fiabilité globale du système et d'en pronostiquer les performances d'après celles de chaque composante. Vous pouvez réaliser facilement des analyses de simulation en étudiant différentes conceptions et en comparant les graphiques de plusieurs plans. Vous pouvez en outre identifier les points qui se prêtent le mieux à l'ajout de redondance et réduire la probabilité de défaillance d'un système. Grâce à la fonction Diagramme de fiabilité, vous pouvez aisément concevoir un système, en combler les lacunes et mieux anticiper les dysfonctionnements à venir.


Tableaux de recouvrement

Les tableaux de recouvrement sont utilisés dans le domaine du test, lorsque les interactions entre les facteurs peuvent être sources d'échec. Chaque essai expérimental peut être coûteux. Il s'agit donc de créer un plan d'expériences qui maximisera la probabilité de trouver des défauts dans les délais et budgets les plus serrés possibles. C'est à cela que servent les tableaux de recouvrement. JMP Pro vous permet de créer un plan d'expériences pour tester les systèmes déterministes et couvrir toutes les combinaisons de facteurs possibles jusqu'à un certain ordre.

Ainsi, dès lors que des combinaisons de facteurs créent des conditions non plausibles, vous pouvez utiliser le filtre interactif Combinaisons non autorisées pour les exclure automatiquement du plan d'expériences.

JMP Pro présente l'immense avantage d'être bien plus qu'un simple outil de création de tableaux de recouvrement : il permet également d'effectuer toutes sortes d'analyses statistiques. Par exemple, il n'existe à l'heure actuelle aucun autre logiciel permettant à la fois de créer des tableaux de recouvrement et d'analyser des données à l'aide d'une régression généralisée.

JMP Pro offre également la possibilité d'importer tout type de tableau de recouvrement (généré à partir de n'importe quel logiciel) pour l'optimiser et analyser les résultats. Vous pouvez créer les tableaux vous-même, sans faire appel à qui que ce soit d'autre. Avec JMP Pro, vous réalisez des tests plus intelligents grâce aux tableaux de recouvrements.

Modèles mixtes

Les modèles mixtes permettent d'analyser les données de temps et d'espace. Vous pouvez notamment vous en servir dans les plans d'étude mesurant plusieurs sujets à différents stades d'un essai pharmaceutique, ou dans les plans d'étude croisés de l'industrie pharmaceutique ou chimique ou du secteur industriel.

JMP Pro vous permet d'ajuster des modèles mixtes à vos données pour spécifier des effets fixes, aléatoires et répétés, corréler des groupes de variables et configurer des sujets et des effets continus dans une seule et même interface intuitive de type « glisser-déposer ».

Par ailleurs, il est désormais possible de calculer les paramètres de covariance d'un plus grand nombre de structures de corrélation. Par exemple, lorsque les unités expérimentales dont vous mesurez les données peuvent être regroupées en clusters et que les données d'un cluster commun sont corrélées. Ou encore, lorsque vous relevez des mesures répétées dans une unité expérimentale et que ces mesures sont corrélées ou mettent en évidence des fluctuations de la variabilité.

Déterminez également facilement (visuellement) la structure à covariance spatiale à utiliser dans la spécification de votre modèle lorsque vous créez des modèles mixtes dans JMP Pro.

 

Modèles uplift (levier)

Pour améliorer l'impact d'un budget marketing limité, vous envisagez peut-être d'envoyer des offres aux personnes les plus susceptibles d'y répondre favorablement. Mais cette tâche peut sembler décourageante, surtout en présence de vastes jeux de données et de nombreux régresseurs comportementaux ou démographiques possibles. Les modèles uplift de JMP Pro vous aideront à réaliser ce type de prévision. Cette méthode — également appelée modélisation incrémentielle, true-lift ou modélisation en réseau — a été développée pour optimiser les décisions marketing, définir des protocoles médicaux personnalisés ou, plus généralement, identifier les caractéristiques de sujets sensibles à certaines actions.

Dans JMP Pro, la modélisation uplift ajuste les modèles de partition identifiant des divisions pour optimiser une différence due au traitement. Les modèles aident à identifier les groupes d'individus les plus enclins à répondre favorablement à une action; ils contribuent à la prise de décisions efficaces et ciblées qui améliorent l'allocation des ressources et l'impact individuel.


Calculs statistiques avancés

JMP Pro inclut des tests statistiques exacts pour les tableaux de contingence et des tests statistiques exacts non paramétriques pour les ANOVA à un facteur. Il offre également une méthode générale pour procéder au bootstrapping de statistiques dans la majorité des rapports JMP.

Le bootstrapping établit une approximation de la distribution d'échantillonnage d'une statistique. JMP Pro est le seul progiciel statistique qui permet de procéder au bootstrapping d'une statistique sans programmation. Grâce au bootstrapping en un clic, il suffit en effet d'un simple clic pour procéder au bootstrapping d'une quantité sous forme de rapport JMP.

Cette technique est utile lorsque les hypothèses théoriques sont remises en question, voire inexistantes. Par exemple, essayez d'appliquer des techniques de bootstrapping aux résultats d'un modèle non linéaire utilisés pour établir des prévisions ou essayez de déterminer des intervalles de couverture autour de quantiles. Vous pouvez également utiliser le bootstrapping pour évaluer le degré d'incertitude d'un modèle prédictif. Le bootstrapping permet d'évaluer la fiabilité de vos estimations à partir d'un nombre d'hypothèses restreint — et est largement simplifié avec la fonction de bootstrapping en un clic de JMP Pro.


Connexion à SAS®

JMP Pro faisant partie des offres SAS d'analyse prédictive et de data mining, vous pouvez aisément le connecter à SAS pour aller plus loin et bénéficier ainsi de la sophistication de SAS Analytics et des fonctions d'intégration de données. Avec ou sans connexion active à SAS, JMP Pro est capable de produire du code SAS pour évaluer rapidement le score de nouvelles données via les modèles créés dans JMP.

 

Partagez et diffusez les résultats

Drapeaux DOW

Dow Chemical a choisi JMP Pro pour doter ses collaborateurs du meilleur outil du marché en matière d'exploration et d'extraction de données volumineuses.

Lire l'article

La découverte fait partie intégrante de JMP, tout comme la communication des résultats dans l'entreprise. JMP Pro regroupe toutes les fonctions visuelles et interactives de JMP et offre ainsi des représentations de données inédites. Grâce à la liaison dynamique des données, graphiques et statistiques, JMP Pro donne vie à vos recherches sous forme de graphiques 3D ou animés qui évoluent dans le temps et mettent en évidence de nouvelles informations précieuses pour le processus de construction de modèles et d'explication.

Fonctionnalités exclusives de JMP® Pro

JMP Pro reprend toutes les fonctionnalités de JMP, auxquelles s'ajoutent les fonctions d'analyse avancée ci-dessous.


Modélisation prédictive

Arbres de classification et de régression (modèles de partition)*
  • Technique des forêts aléatoires (bootstrap forests).
  • Arbres boostés (boosted trees).
  • Prévision « k voisins les plus proches » (K-NN).
  • Prise en charge de la colonne de validation.
Modélisation de réseau neuronal*
  • Traitement automatique des données manquantes.
  • Sélection automatique du nombre d'unités masquées grâce aux forêts décisionnelles.
  • Ajustement de réseaux de neurones à une ou deux couches.
  • Transformation automatique des variables d'entrée.
  • Trois fonctions d'activation (tangente hyperbolique, linéaire, gaussien).
  • Sauvegarde de colonnes de validation générées de manière aléatoire.
  • Sauvegarde de covariables transformées.
  • Prise en charge de la colonne de validation.
Régression pas à pas
  • Prise en charge de la colonne de validation.
Régression logistique (nominale et ordinale)
  • Prise en charge de la colonne de validation.
Analyse discriminante
  • Prise en charge de la colonne de validation.
Moindres carrés standard
  • Prise en charge de la colonne de validation.

Validation

Approche générale faisant appel à une colonne de validation et à une fonction de validation dans les boîtes de dialogue de lancement des plates-formes de modélisation.
Utilitaire Colonne de validation
  • Partitionnement automatique des données en jeux d'apprentissage, de validation et de test; création de colonnes de validation.
  • Méthodes aléatoires simples ou stratifiées pour créer les jeux de retenue.
  • Création de colonnes de validation dans les fenêtres de lancement des plates-formes par simple clic sur la fonction de la colonne de validation.

Comparaison de modèles

  • Comparaison automatique des modèles créés dans JMP Pro.
  • Profileur.
  • Tests d'ajustement (R carré, taux d’erreurs de classification, courbes ROC, AUC, courbes Lift).
  • Calcul de la moyenne de modèles.

Modélisation moderne

Régression généralisée
  • Techniques de régularisation : Ridge, Lasso, Lasso adaptatif, Elastic Net, Elastic-net adaptatif.
  • Sélection Forward.
  • Régression quantile.
  • Distribution normale, de Cauchy, exponentielle, gamma, bêta, binomiale, binomiale bêta, de Poisson et binomiale négative.
  • Distribution binomiale, binomiale bêta, de Poisson, binomiale négative et gamma avec inflation à zéro.
  • Techniques de validation au choix : colonne de validation, K-fold, retenue, leave-one-out (en supprimer un(e)), BIC et AICc.

Techniques multivariées avancées

Modélisation des moindres carrés partiels (PLS)
  • La méthode d'analyse statistique PLS de la plate-forme Modèle linéaire gère les réponses continues et catégorielles, les facteurs continus et catégoriels, ainsi que les interactions et les termes polynomiaux.
  • Imputation de valeurs manquantes de type NIPALS.
  • Sauvegarde de colonnes de validation générées de manière aléatoire.
  • L'option Standardiser X permet de centrer et d'adapter les variables individuelles incluses dans un effet polynomial avant d'appliquer les options de centrage et de mise à l'échelle.
  • Méthodes de validation au choix : colonne de validation, K-fold, retenue, leave-one-out (en supprimer un(e)).
Analyse en composantes principales (ACP)
  • Classification des variables dans une analyse en composantes principales (ACP).

Diagrammes de fiabilité

  • Créez des modèles de fiabilité des systèmes complexes.
  • Créez des systèmes avec des nœuds basiques, en série, en parallèle, knot et de type K sur N.
  • Créez des plans à effets emboîtés à l'aide d'éléments de la bibliothèque de plans.

Tableaux de recouvrement

  • Concevez et analysez des tableaux de recouvrement.
  • Optimisez les plans une fois créés pour réduire leurs délais d'exécution.
  • Utilisez le filtre Combinaisons non autorisées pour spécifier les régions de test inapplicables.
  • Importez des tableaux de recouvrement créés dans d'autres logiciels  analysez le recouvrement et optimisez-le, le cas échéant.

Modèles mixtes

  • Spécifiez des effets fixes, aléatoires et répétés.
  • Corrélez des groupes de variables, configurez des sujets et des effets continus.
  • Choix de la structure de covariance répétée.
  • Les variogrammes fournissent un diagnostic visuel permettant de déterminer la structure de corrélation spatiale la plus appropriée, le cas échéant.

 

 


Modèles uplift (levier)

  • Méthode à base d'arbre de décision permettant d'identifier les segments de consommateurs les plus sensibles à une offre ou un traitement.
  • Incrémentielle, true-lift, modélisation en réseau.
  • Prise en charge de la colonne de validation.

Calculs statistiques avancés

Analyse à un facteur (ANOVA)
  • Tests exacts non paramétriques.
Analyse de contingence
  • Mesures d'association exactes.
Bootstrapping général
  • D'un clic, procédez au bootstrap de statistiques dans la plupart des rapports.

*Génère du code SAS exploitable avec SAS Model Manager


Configuration requise

JMP s'exécute sous Microsoft Windows et Mac OS. Il est compatible avec les systèmes 32 et 64 bits.


Back to Top