要因スクリーニング計画
スクリーニング計画とは?
スクリーニング計画は、実験計画の一種で、工程や結果に影響を与える可能性のある多くの変数の中から、最も影響力のある因子を特定するための初期ステップとして実施されることがよくあります。これは、比較的少ない実験回数で、以降の実験にどの因子を含めるべきかを体系的に決定するための効率的かつ厳密な方法です。スクリーニングとは、「重要な少数」と「取るに足らない多数」を分けることを指します。
スクリーニング計画はいつ使用すべきですか?
スクリーニング計画は、以下のいずれかが該当する場合に有用です。
- 研究するべき潜在的な因子が多数存在する。
- 重要な因子は不明である。
- 因子の効果は不明である。
すべての状況で因子をスクリーニングする必要はないかもしれません。例として、因子数が少ない場合や、想定できる最も複雑なモデルにあてはめるために必須なすべての実験が実施できる余裕がある状況では、スクリーニング手法が不要になる場合があります。
スクリーニング計画を行う理由と方法
実験の過程では、複数の実験を段階的に行う場合があります。多くの場合、実験の初期段階では、工程に影響を与える 可能性のある さまざまな因子を思い浮かべます。最初のタスクは、潜在的に重要な効果(主効果と、場合によっては交互作用効果)を多数リストアップし、最も重要な少数に絞り込むことです。検討すべき因子が多い場合、完全実施要因計画は時間や費用がかかりすぎる可能性があります。完全実施要因計画においては、通常、三因子以上の交互作用を持つモデルを適用することにはあまり関心がないため、計画が無駄になることがあります。しかし、スクリーニング計画は、より少ない実験回数で最大の効果を特定するのに役立ちます。
スクリーニング計画と分析方法の有効性は、4つの重要な原則に依存しています。これらの原則はすべての状況で当てはまるわけではありませんが、実際には十分に一般的であり、非常に有用であることが判明しています。
稀薄性(Sparsity)
効果の稀薄性とは、多くの候補因子があり、さらに多くの潜在的な効果がある場合でも、1つの応答に対して実際に重要になるのはそのうちのごく一部であるという原則です。
階層化
階層性の原則とは、モデル項の次数が上がるほど、その効果が重要である可能性は低くなるという原則です。言い換えると、3因子間の交互作用のような高次のモデル項は、2因子間の交互作用のような低次のモデル項よりも重要である可能性が低く、2因子間の交互作用は主効果よりも重要である可能性が低いということです。
遺伝(Heredity)
遺伝性とは、高次項が重要である場合、同じ因子に関連する低次の効果も重要であることが多いという原則です。つまり、例として、X1および X3 の交互作用が重要である場合、X1または X3 の主効果も重要である可能性が高いということです。
射影性(Projection)
射影性とは、重要でない効果がモデルから削除され、重要な効果を含むより少ない因子による低次元計画に「射影」された際に、効果の推定可能性や推定値の独立性などの望ましい統計的性質がどの程度維持されるかを指す原則です。優れた射影性を持つ計画は、この因子のサブセットを分析する際に信頼できる結果をもたらします。
スクリーニング実験を計画する際の最初のステップは、工程に関連するすべての因子を特定することです。結果には、関心のある因子(実験中に変更でき、応答に影響を与えると予想される因子)と、工程にランダムな変動(ノイズ)をもたらす可能性のある因子が含まれます。理想的には、実験中にこれらのノイズ要因を制御するか、統計モデルの中でそれらの影響を考慮します。また、交互作用のような高次の効果の可能性も考慮する必要があります。
実際には、すべての潜在的な因子とその交互作用を実験に含めることができないことがあります。計画の決定は、いくつかの考慮事項に依存します。
- 実験予算に関連してスクリーニングすべき因子数。
- 実験を実施するために必要な時間。
- あてはめたいモデルの複雑さ(主効果のみを推定するのか、または2因子間の交互作用の一部またはすべてを推定するのか)。
- 事前知識または主題に関する専門知識の性質と量。
- 重要な効果を見逃した場合に発生する、重要な情報を見逃すコスト。
場合によっては、重要な効果を特定するために複数の実験を実施する必要がある場合があります。たとえば、初期の実験では2因子間の交互作用を推定できなかったため、それらを検証するには追加の実験を行う必要があります。
スクリーニング実験を計画するために使用できる手法は多数あります。「古典的」な計画(たとえば、一部実施要因計画やPlackett-Burman計画)は、20世紀初頭に開発され、広く知られているものの、いくつかの制約があります。カスタム計画および決定的スクリーニング計画のような最新の手法は、アルゴリズム的アプローチを使用し、多くの利点を提供します。どのような手法を使用するかに関わらず、スクリーニング計画は工程を改善または最適化する方法を決定するための最初のステップです。
スクリーニング計画:例
製造工程において、関心のある応答は 収率(Yield) と 不純物(Impurity) であるとします。あなたは、工程の設定を調整して、収率を 最大化 し、不純物を 最小化 するというタスクを任されました。まず、何が応答に影響を与え、またどのように影響を与えるかを理解する必要があります。
あなたとチームは、収率と 不純物 に影響を与えると考えられる9つの因子を挙げました。うち、7つは連続因子であり、2つはカテゴリカル因子です。これまでの経験に基づいて、あなたとチームは、その因子が本当に重要である場合に、実験で検出できるほど十分大きな応答変化を生み出す因子の範囲と水準を設定します。
因子およびその範囲、水準は以下のとおりです。
- ブレンド時間(Blend Time):10~30分
- 圧力(Pressure): 60-80 kPa
- pH: 5~8
- 撹拌速度(Stir Rate): 100-120 rpm
- 触媒(Catalyst): 1-2%
- 温度(Temperature): 摂氏15-45度
- 供給速度(Feed Rate): 10-15L/分
- ベンダー(Vendor): 安価(Cheap)、高速(Fast)、良好(Good)
- 粒子サイズ(Particle Size): 小(Small)、大(Large)
9つの因子すべてが重要であるとは考えていません(効果の稀薄性の原理)が、現時点ではどの因子が重要になるかはわかりません。少なくとも1つの因子間の交互作用があり、2次効果も存在する可能性がありますが、それらは主効果(階層性の原則)ほど重要ではないと予想しています。また、もし交互作用が存在しているのであれば、それは実験で特定した重要な主効果が関係しているものだと想定しています(遺伝性の原則)。最後に、モデルから重要でない効果を取り除くことができれば、元の計画で推定ができなかった交互作用でも、重要な主効果に対する交互作用効果を推定できる可能性があることも理解しています(射影性)。
考えられるスクリーニング戦略は多数あります。主効果 のみ を推定できる小規模な実験、主効果と いくつかの 2因子間の交互作用を推定できる中規模な実験、または主効果および すべての 可能な2因子間の交互作用を推定できる大規模な実験です。どの戦略を使用するかは、主に上記の考慮事項に基づき決まります。(二次の効果は、通常、重要な因子を特定した後に最適化実験で検討されます。)
この例では、スクリーニング実験の予算が限られているため、主効果のみの計画から始めて重要な因子を選別することにしたとします。主効果よりも強い交互作用が存在する場合には、これは危険な戦略である可能性があることを認識していますが、スクリーニングの原則に基づいて判断し、この実験の結果を明確にする必要がある場合は追加実験の予算を組んでいます。
戦略および計画が完成したので、22回の実験を計画します。そのうちの4つは 中心点 であり、すべての連続因子を中間水準に設定する実験です。
計画に中心点を含める理由はいくつかあります。中心点は、繰り返しのない計画に反復性を持たせ、純粋誤差を推定し、モデル内の項に対する統計的検定を行うことができます。計画全体に中心点の実験を散りばめ、実験中に工程で予期しない変更が発生していないかを監視することができます。これらの実験からの応答は反復であるため、互いに類似した値になると予想されます。
スクリーニング計画の文脈では、中心点を用いて、あてはまりの悪さ(LOF)検定を通じて応答に曲率(曲面性)が存在するかを 検出 できます。あてはまりの悪さ検定が統計的に有意な場合、モデルが1つ以上の2次項が欠けている可能性を示しています。実験は、2次項の 推定 を可能にするようには設計されておらず、単に検出するためのものでした。あてはまりの悪さ検定が統計的に有意なことから、応答の曲率を理解するために追加の実験が必要であることが示唆されます。
実験を実施し、以下の表に示される応答の 収率 と 不純物 を記録します。
各応答に対して重回帰分析を使用してモデルをあてはめます。各因子は、各応答に対して(対数価値と呼ばれる指標に基づいて)重要度順に下のグラフに示されています。
スクリーニング実験に基づいて、収率に最も大きな効果を与えるのは、温度および pH であることがわかりました。不純物に最も影響するのは、温度、pH、ベンダーです。
これらの結果に基づいて、次のステップとしては、モデルを縮小する(重要でない項を削除する)、重要な項とその交互作用(可能な場合)を含む新しいモデルをあてはめる、あてはまりの悪さ検定を調べて、いずれかの応答に曲率の証拠があるかどうかを確認することが含まれます。これらの結果は、工程を理解し、最終的に最適化しようとする際に、後続の実験に関する決定の指針となります。