決定的スクリーニング計画
決定的スクリーニング計画とは?
決定的スクリーニング計画(DSD)は、多くの連続因子の中で、応答に最も強く影響を与える因子を特定するための特別な構造をもつ実験計画です。DSDは少ない実験回数で済み、同程度の実験数の標準的スクリーニング計画よりも多くの利点があります。重要な効果を特定する際の曖昧さを減らし、各因子の曲線性(非線形性)効果を特定できるようにし、少数の因子のサブセットに対し完全2次モデルの推定をサポートします。
決定的スクリーニング計画を使用すべき理由
決定的スクリーニング計画は、一部実施要因計画やPlackett-Burman計画などの標準的なスクリーニング計画に比べて多くの利点があります。これらの標準的な計画では、主効果や2因子交互作用は交絡し、2因子交互作用同士は完全に交絡することがあり、重要な効果の特定に曖昧さをもたらします。さらに、中心点を含む標準的なスクリーニング計画では、1つ以上の因子における曲線性の 存在 を特定できますが、追加実験を行わない限り、どの因子に曲線性があるかを特定することはできません。標準的な計画と比較すると、DSDには複数の利点があります。
- 主効果は2因子交互作用に対して直交しており、2因子交互作用が存在しても主効果の推定値にバイアス(偏り)はありません。
- 2因子交互作用が互いに完全に交絡することはなく、重要な2因子交互作用効果を特定する際の曖昧さが軽減されます。
- 主効果と2次効果のみを含むモデルでは、すべての2次効果を推定可能です。これにより、応答との関係でどの特定の因子が曲線性率を示すかを識別できます。
DSDは少数の実験でこれらの利点を実現します。6つ以上の因子に対して、これらの実験数は因子数の2倍よりわずかに多い程度です。たとえば、連続因子が14の場合、最小サイズのDSDに必要な実験数は29回だけで、対応する完全実施要因計画のごく一部です(2 14 = 16,384実験)。比較すると、レゾリューション(解像度)IVの一部実施要因計画には少なくとも32回の実験が必要です。DSDと同様に、主効果と2因子交互作用の交絡を回避しますが、DSDとは異なり、一部の2因子交互作用は互いに完全交絡し、中心点が追加されても各因子の曲線性を評価することはできません。DSDは効率的な計画でありながら、比較的多くの情報を収集できます。
スクリーニングを超えたレベルで、重要な因子の数が少ない場合に、DSDは応答曲面法による応答の最適化を直接可能にします。6因子以上のDSDでは、任意の3因子の完全2次モデルを推定できますが、18因子以上のDSDは任意の4因子の完全2次モデルをあてはめることができ、24因子以上のDSDは任意の5因子の完全2次モデルをあてはめることができます。これは、幸運にも重要な因子が少ない場合、同じ計画でスクリーニングと応答の最適化の両方を使用できることを意味します。そうでない場合は、必要に応じて実験を追加してDSDを拡張することもできます。
決定的スクリーニング計画の作成方法
DSDの利点は、その特別な構造によるものです。例として、6つの連続因子を持つDSDのこの計画表を考えてみましょう。各因子は、高水準が1、低水準が-1、中間の水準値が0になるようにコードされています。
| 実行 | X1 | X2 | X3 | X4 | X5 | X6 |
| 1 | 0 | 1 | 1 | 1 | 1 | 1 |
| 2 | 0 | -1 | -1 | -1 | -1 | -1 |
| 3 | 1 | 0 | -1 | 1 | 1 | -1 |
| 4 | -1 | 0 | 1 | -1 | -1 | 1 |
| 5 | 1 | -1 | 0 | -1 | 1 | 1 |
| 6 | -1 | 1 | 0 | 1 | -1 | -1 |
| 7 | 1 | 1 | -1 | 0 | -1 | 1 |
| 8 | -1 | -1 | 1 | 0 | 1 | -1 |
| 9 | 1 | 1 | 1 | -1 | 0 | -1 |
| 10 | -1 | -1 | -1 | 1 | 0 | 1 |
| 11 | 1 | -1 | 1 | 1 | -1 | 0 |
| 12 | -1 | 1 | -1 | -1 | 1 | 0 |
| 13 | 0 | 0 | 0 | 0 | 0 | 0 |
DSDは 折り重ね(foldover) 計画であり、各実験は、すべての因子の値の符号が反転した別の実験とペアになっています。例として、実験1および実験2は折り重ねペアを形成し、実験2は単に実験1の値の符号を反転させます。同じことは実験3、4、5、6などにも適用され、実験13はすべての因子の中水準値で測定された中心点です。計画の折り重ね的側面により、主効果と2因子交互作用の交絡が解消されます。
どの折り重ねペアでも、1つの因子は両方の実験で中水準値で設定される一方、他のすべての因子は低水準または高水準の値で測定されることに注意してください。これにより、標準的なスクリーニング計画のように角や中心だけでなく、因子空間の辺にも実験点が配置されます。この計画の特徴により、すべての2次効果が推定可能になります。
最初の3つの因子で計画をプロットすると、DSDの構造がさらに明確になります。各点(中心点を除く)には、立方体の「鏡像」の位置にある対応する折り重ね点があることに注目してください。計画には因子空間の辺にある中点も含まれ、各因子は中心点を含めると中水準の点で合計3回測定されます。
この計画例は、6つの連続因子に対する最小実験数を示しています。実際には、設計に架空の効果を持たない因子(偽因子)を導入することによって、少なくとも4回の追加実験を含めることが推奨されます。そうすることで、DSDでは重要な2因子交互作用および2次の曲線性を検出する能力が大幅に向上します。
では、DSDの計画を作成するにはどうすればよいのでしょうか。自分でゼロから行う必要はありません。JMPのような統計ソフトウェアで計画プロセス全体を処理することができます。
決定的スクリーニング計画の例
あなたがバイオテクノロジー企業のエンジニアであり、抽出収量をミリグラム単位で最大化することを目標に、新しい抽出プロセスを開発するタスクを負っているとします。まず、どの工程因子が収量に最も強く影響するかを特定する必要があります。最初に、溶液中の複数の溶媒、PH、時間をテストすることから始めます。因子および範囲は以下のとおりです。
- メタノール(Methanol):(0~10 mL)
- エタノール(Ethanol):(0~10 mL)
- プロパノール: (0〜10 mL)
- ブタノール(Butanol):(0~10 mL)
- pH:(6~9)
- 時間(Time):(1~2時間)
すべての因子が連続因子であり、2因子交互作用と2次の曲線性が存在する可能性があり、スクリーニング後に追加の実験をほとんど(またはまったく)行わずに、重要な因子に完全な2次モデルをあてはめたいと考えているため、DSDを使用します。2次効果をより良く検出するために、最小実験数の13回に加えて4回の実験を追加することにします。以下の17回実験のDSDを使用し、収率(Yield)列に結果を記録します。
| 実行 | メタノール | エタノール | プロパノール | ブタノール | PH | 時間 | 収益 |
| 1 | 0 | 10 | 5 | 0 | 6 | 2 | 23.43 |
| 2 | 0 | 0 | 10 | 10 | 7.5 | 1 | 4.85 |
| 3 | 5 | 10 | 10 | 10 | 9 | 2 | 40.91 |
| 4 | 10 | 10 | 0 | 10 | 6 | 1 | 21.68 |
| 5 | 0 | 0 | 10 | 0 | 9 | 2 | 3.09 |
| 6 | 10 | 0 | 10 | 0 | 6 | 1.5 | 26.09 |
| 7 | 5 | 5 | 5 | 5 | 7.5 | 1.5 | 30.05 |
| 8 | 0 | 0 | 0 | 10 | 6 | 2 | 11.99 |
| 9 | 0 | 10 | 0 | 10 | 9 | 1.5 | 11.54 |
| 10 | 10 | 5 | 10 | 10 | 6 | 2 | 33.46 |
| 11 | 10 | 10 | 0 | 0 | 7.5 | 2 | 47.44 |
| 12 | 10 | 0 | 0 | 5 | 9 | 2 | 23.58 |
| 13 | 5 | 0 | 0 | 0 | 6 | 1 | 22.26 |
| 14 | 10 | 0 | 5 | 10 | 9 | 1 | 27.07 |
| 15 | 0 | 10 | 10 | 5 | 6 | 1 | 3.35 |
| 16 | 0 | 5 | 0 | 0 | 9 | 1 | 3.18 |
| 17 | 10 | 10 | 10 | 0 | 9 | 1 | 21.67 |
各因子の主効果を視覚化すると、メタノールと 時間 が 収率 に強い正の効果を及ぼし、エタノールもわずかに正の効果を及ぼすことがわかります。プロパノール、ブタノール、pHの線は平坦に見え、これらの因子の主効果がほとんど無視できることを示唆しています。主効果のみの重回帰 モデルでは、メタノール、エタノール、時間の主効果が有意であることが確認できます。DSDを使用したため、まだ調査していない重要な2因子交互作用によって主効果の推定値にバイアスが入らないことが保証されています。あなたはメタノール、エタノール、時間を重要な因子として前へ進むことにしました。
6因子DSDを使用して3つの重要な因子を特定したため、設計に実験を追加することなく、完全2次モデルを適合させることができます。最適化に使用する最終モデルを決めるために、変数選択法を用いた重回帰分析を行います。そのモデルは、メタノールの効果が2次の曲線性を示し、エタノールと 時間 には2因子交互作用があることが明らかになります。つまり、エタノールは 時間 が短いときには効果が無視できるほど小さいですが、時間が長いときには強い正の効果を示します。
最終モデルを用いて、以下の最適な因子設定を特定します。この設定により、平均 収率 が45.34mgになると予測されます。
- メタノール = 8.13 mL
- エタノール = 10 mL
- 時間 = 2時間