公開日: 11/25/2021

外れ値分析

[外れ値分析]メニューには、中心からの距離のプロットの表示/非表示を切り替えるオプションがあります。この距離の計算は、相関構造に基づきます。たとえば、図3.5のA点は、いずれの座標においても外れていませんが、相関構造を考慮したときに外れているために、外れ値とみなされます。

図3.5 外れ値の例 

Example of an Outlier

[外れ値分析]メニューのオプションはいずれも、距離のプロットの表示/非表示を切り替えます。検定は、プロットの下部に表示される有意水準(α)で行われます。距離の計算方法には、以下のものがあります。

Mahalanobisの距離

各点から平均ベクトル(重心)までのMahalanobisの距離。Mahalanobisの距離は、データの平均・標準偏差・相関係数行列に基づいて計算されます。行番号に対して距離がプロットされます。距離が大きくなっている点をクリックすると、どの行が外れ値になっているかがわかります。Mahalanobis距離の計算を参照してください。

ジャックナイフ法による距離

ジャックナイフ法で計算した距離。この距離は、該当する行を除いたときの平均・標準偏差・相関係数行列に基づいて計算されます。特にデータに1個だけ外れ値がある場合、ジャックナイフ法が役立ちます。外れ値が1つある場合、通常のMahalanobis距離ではその1つの外れ値に影響され、外れ値を識別しにくくなったり、通常の点が実際よりも離れた位置にあるように見えたりします。ジャックナイフ法による距離の計算を参照してください。

T2

Mahalanobis距離の2乗。このプロットは多変量管理図において広く使用されています。このプロットには、T2統計量がプロットされ、また上側管理限界が描かれます。管理限界よりも上にある値は、外れ値の可能性があります。T2距離の計算を参照してください。

図3.6 「外れ値分析」プロット 

Outlier Analysis Plots

距離の保存

プロットの赤い三角ボタンのメニューから[保存]オプションを選択すると、距離をデータテーブルに保存できます。

メモ: その際、計算式は保存されないため、データテーブルに変更を加えても距離の再計算は行われません。データテーブル内で、列の追加/削除や値の変更を行ったときは、[分析]>[多変量]>[多変量の相関]を選択して、もう一度計算をやり直してください。

各行の距離が保存されるほか、[外れ値分析]で指定された上側管理限界の値を保持する列プロパティも作成されます。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).