JMP® Pro
- 概要
- 視覚的な発見
- 予測モデル
- 対話的データマイニング
- モデルの比較
- ブートストラップ
- 正確検定
ロバストな予測モデルを作成するための視覚化と分析
ロバストな予測は、計画立案において必要不可欠です。顧客の生涯価値を管理する際であれ、複雑なエンジニアリングプロセスをモニタリングする際であれ、最も成功する企業は、将来を洞察するため、これまでのデータを用いて変化する環境に常に適応しています。そこにJMP Proが必要になります。
ビジネスにおいて、以下のような疑問が投げかけられるでしょう。
- 顧客が最も好むWebページはどれか?
- 無駄をなくして生産能力を確保する目的で、不具合の可能性が高いためあらかじめ廃棄すべきロットはどれか?
- 現在使用している製品やサービスをアップグレードする可能性のある顧客は誰か?
- これまでの履歴から、顧客が次に買いそうな製品は何か?
- どのような取引が期待に反することになりそうか?
- どのくらいの確率で顧客はローンを返済するか?
正確な予測をするためには、過去を記録した質の高いデータが必要です。しかし多くの場合、こうしたデータは多様なソースから収集されているため、重複と矛盾が発生します。モデルを最適化して、ロバストな予測を行うために、主要な要因を少ないコストで発見することが必要です。このためには、誰にでも使用できる、わかりやすい視覚的インターフェースによって、最新のモデリング技術を使うことができるソフトウェアが必要です。
JMP Proこそが、このためのソフトウェアです。データから適切に将来を予測し、より優れた計画を立てるお手伝いをします。JMP Proは、強力な予測モデリング機能により、高品質のデータから将来を予測するモデルを適切に導きます。JMP Proは、データへの直感的なアクセスと優れた操作性、対話性、さまざまな統計手法、そして機能の拡張が可能であるという特徴を備えています。JMP Proを利用することで、最新の予測モデリング、交差検証、関連の指標における正確測定、ブートストラップ法、そしてモデルの比較が可能になります。こうした機能はすべて、JMPと同様にデスクトップ環境から利用できます。
JMP® Pro が提供するアルゴリズム
- 複数の予測式の適合度を比較するためのモデル比較
- 学習、検証、およびテストセットを使用するモデル検証
- ブートストラップ森、ランダム森
- ブースティングツリー
- 3つの活性化関数を備えた多層ニューラルネットワーク
- 早期打ち切りルールを使用した勾配ブースティングニューラルネットワーク
- 交差検証を用いたステップワイズ回帰
- 多くの統計量の容易なブートストラップ
- 分割表における正確検定
- 一元配置の分散分析に対する正確検定
視覚的な発見
JMPは、統計的発見のためのソフトウェアです。JMP Proには、JMPのすべての統計機能が含まれており、これまで思いつかなかったような方法でデータを活用できます。動的にリンクしたデータ、グラフ、統計量によって、JMP Proは、3Dプロットや経時変化を示すアニメーショングラフから、データを「生きた」ものとし、モデル構築に情報を与える価値ある新しい洞察を生み出します。その対話性により、他者が容易に理解し、それに基づいて行動できる方法で、ストーリーを語ることができます。
JMP Proは、JMP同様、データに対して独特のアプローチを持っています。これは、大容量のデータであっても同様です。1つの課題は、有用なモデルを構築するために必要な形状でデータを取得することです。JMP Proの豊富なデータの再構成、再設定や再コード化のツールにより、データの前処理(モデル構築において最も時間のかかる作業)を容易にし、分析用の高品質なデータを迅速に確保できます。さらに、JMPスクリプト言語(JSL)によってSASやRを起動し、必要に応じてデータ管理や分析の手法を拡張できます。また、完全にカスタマイズされたソリューションのために、JMPはアプリケーションビルダーでユーザーの要求に合わせたオーダーメイドのアプリケーションを構築することもできます。アプリケーションビルダーは、JSLのための対話的な開発環境として使用できます。そのドラッグ&ドロップのユーザーインターフェイス設計とバックエンドスクリプトのフルコントロールにより、最も困難な統計的問題に取り組むために適切なJMP Proの機能を使用するアプリケーションを作成することができます。
一般化されたモデルの作成
記述的モデリングは、 統計量とグラフを使用して、過去のデータを理解する手助けをします。有効な予測モデルは、未来をも見通すことが求められます。誰でも、前年のパフォーマンスを記述することはできますが、適切なツールと最新の技術なしで、翌年を予測するモデルを構築することは、はるかに困難です。有効な予測モデルのためには、モデルを検証する信頼できる方法が必要です。また、大規模モデルでは、オーバーフィットの問題が発生する恐れがあります。大規模モデルには交差検証の必要がありますが、JMP Proはその機能を備えています。
JMP Proは、データの分割または保留による検証機能、さらに視覚的な比較ツールを備えています。学習、検証、テストセットに分割する方法は、オーバーフィットを避けるために長い間使用されており、構築するモデルが、モデルを構築するために使用された特定のサンプルの特性に依存してないようにします。これにより、将来のデータ(新しい顧客、新しいプロセス、新しいリスク)を適切に予測するモデルが生み出されます。つまり、将来についてデータに基づく推論を行うことができるのです。
モデルの選択
最も良い予測モデルを見つけるためには、最適なモデルを選ぶ必要があります。JMP ProにはJMPが提供するすべての線形および非線形のモデル作成機能が搭載され、さらに追加機能として、交差検証を用いたステップワイズ回帰、「パーティション」プラットフォームでの決定木の自動構築、「モデルのあてはめ」プラットフォームでのPLS回帰、拡張されたニューラルネットワークのプラットフォーム、および統計量のブートストラップがあります。
JMP Proの「パーティション」プラットフォームは、最新の方法でツリーの構築プロセスを自動化します。ブートストラップ森は、データをランダムに抽出し、何十もの決定木を作成して、これらのツリーで計算された各要因の影響を平均化します。ブースティングツリーは、あてはめたツリーの残差にツリーを次々にあてはめ、多数のシンプルなツリーを構築します。
JMP Proの拡張された「ニューラル」プラットフォームでは、選択可能な3つの活性化関数および勾配ブースティングを使用したモデル作成を含む、1層または2層のニューラルネットワークを構築できます。このプラットフォームは、連続量の入力変数の欠測値の自動変換を行い、時間と手間を節減します。さらに、入力に対するペナルティ関数や、複数のカテゴリの応答をモデル化する機能も搭載しています。
拡張された「PLS回帰」プラットフォームでは、PLSモデルの検証法として、交差検証や他のモデリングのプラットフォームが提供する形式と同じ種類の検証法を提供しています。また、手法としてNIPALSとSIMPLSアルゴリズムのいずれかを選ぶことができます。
「モデルのあてはめ」プラットフォームでは、PLSの説明変数として、カテゴリの因子に加えて、交互作用項と高次の多項式を含めることができます。また、データの保留による検証を行うことによって、有用なPLSモデルをあてはめることができます。
SASユーザーのために
JMP Proは、予測とデータマイニングを行うSAS製品の1つです。JMP Proは、SASとの接続が可能なため、SAS Analyticsの豊富な機能を利用できます。SASとの接続の有無にかかわらず、JMP Proは、JMPで作成したモデルから、SASコードを迅速かつ容易に出力して、新しいデータをスコアリングできます。
モデルの比較
現実世界では、一部のモデルは特定の状況で適切にあてはまりますが、他の状況ではうまくあてはまらないことがあります。JMP Proには、あてはめの方法が多数あり、与えられた状況でどれが最も適切か見つけ出す必要があります。場合によっては、「モデルのあてはめ」のプラットフォームから行う通常の線形モデルが最も良く機能することがありますが、その場合でさえ、モデルに含まれる変数を決定する必要があります。これ以外の場合にも、ニューラルネットや決定木などのデータマイニングモデルがよりあてはまることがありますが、最も適切なモデルを選択することは必ずしも簡単ではありません。
JMP Proの新しい「モデルの比較」のプラットフォームを使用すると、さまざまなあてはめから保存したすべての予測式を比較でき、あてはまりの良さ、モデルのシンプルさ、そして検証結果から最適な組み合わせを選ぶことができます。JMP Proは、自動的にこの比較を行い、従来から使われている適合度の指標や他の指標を使用して、多数の方法でモデルを比較することができます。また同時に、モデルのプロファイルと対話して、各モデルが取り上げている重要な要因を表示することもできます。適合度、診断のプロットおよびプロファイルの結果によって、モデルの比較が簡単になり、将来への正しい経路を決定する上で役に立ちます。
モデル予測の精度
ブートストラップは、統計量の標本分布を近似します。データはリサンプリングされ(復元抽出)、統計値が計算されます。このプロセスが繰り返され、統計量の分布が得られます。JMP Proは、プログラミングを必要とせずに統計量をブートストラップできる唯一の統計ソフトウェアです。簡単なクリック操作だけで、レポートの任意の統計量をブートストラップできます。
分布の仮定に疑問があるとき、または仮定が存在するかわからない場合に、この手法は有効です。ブートストラップは、予測モデルの不確実性を測るための代替方法として使用できます。たとえば、予測するために使用されている非線形モデルの結果にブートストラップ法を適用してみてください。ブートストラップでは、より少ない仮定で結果の信頼性を評価することができます。JMP Proのブートストラップにより、複雑なループコードを記述することなく、この強力な分析テクニックを活用できます。
正確検定
データが小さい、まばらである、タイ(同値)が多い、バランスが取れていない、または大きな標本に適用できる前提や近似が疑わしいといった場合は、正確検定によってより信頼できる推測が行えます。分割表の分析において、JMP ProはFisher検定(列・行の関連)、Cochran-Armitage検定(別の変数の水準間に見られる、二項割合の傾向性の検定)、κ係数(同水準を持つ2変数の一致性の検定)を可能にします。
また、一元配置分析のプラットフォームにおいて、Wilcoxon検定(Mann-Whitney)、メディアン検定、van der Waerden検定、およびKolmogorov-Smirnov検定の正確検定を、2群の比較において可能にします。すべての正確検定は二変量の関係のプラットフォームに含まれており、選択されたXまたはYの変数が的確な条件を満たす場合にのみ実行可能です。これにより、現実にありがちなデータでも信頼性のある推定手法を利用できるようになります。




