アルゴリズム型スクリーニング計画
アルゴリズム型スクリーニング計画とは?
アルゴリズム型スクリーニング計画は、実験計画(DOE)ソフトウェアによって構築され、実験特有の状況に対応します。アルゴリズム型の計画では、因子のスクリーニングに統計的に最適な計画を作成しながら、さまざまな因子タイプ、計画領域の制約、ランダム化の制約、さまざまな実験数を組み込むことができます。
アルゴリズム型スクリーニング計画は、どのようなときに使用すべきですか?
アルゴリズム型スクリーニング計画は、ほぼすべてのスクリーニングの用途で使用できます。これらは、古典的なスクリーニング計画では対応できない特定のニーズや製薬がある状況で特に役立ちます。
なぜアルゴリズム型スクリーニング計画を使用するのですか?
スクリーニング計画は、多くの因子のうちどれが応答に最も強く影響するかを特定する効率的な方法を提供します。アルゴリズム型スクリーニング計画は、実験の都合上、従来のスクリーニング計画、たとえば一部実施要因計画やPlackett-Burman計画の実施が非現実的または不可能な場合に役立ちます。
古典的なスクリーニング計画は、長年にわたり効果的に使用されてきました。しかし、こういった計画は、何十年も前に、日常的なDOEシナリオに適用するための広範な解として作成されたものです。実際には、実験者は、古典的な実験計画では容易に対応できない状況や課題に直面することがあります。例として、古典的なスクリーニング計画では、因子空間の探索が不可能または実施不可能な領域での実験が必要になったり、予算を超える数の実験が必要になったりします。古典的なスクリーニング計画では、計画に合わせて状況を調整する必要があり、その結果、通常は試すはずの因子や水準を除外したり、統計的な利点を損なうように計画を手動で変更したり、その他の欠点が生じる可能性があります。
アルゴリズム型スクリーニング計画は、コンピューターアルゴリズムを使用して、独自の実験状況にカスタマイズされた計画を構築します。アルゴリズム型の計画では、以下を含む多くのカスタマイズが可能です(これらに限定されません)。
- 実験予算に合った実験数を指定する。
- 多くの異なる因子タイプを1つの計画に組み合わせる。
- 因子設定の望ましくない組み合わせを避けるために、設計空間を制限する。
- ランダム化に対してさまざまな制約を課す。
アルゴリズム型スクリーニング計画はどのように構築されますか?
アルゴリズム型スクリーニング計画は、要求に基づいてDOEソフトウェアによって構築されます。因子とそのタイプ、望ましい実験数、計画空間の制約、その他のパラメータを指定した後、ソフトウェアはアルゴリズムを使用して、それらの仕様を満たす統計的に最適なスクリーニング計画を提示します。また、計画を主効果のみのスクリーニングに使用するか、特定の関心のある高次効果のスクリーニングに使用するかを指定することもできます。
ここでの「統計的に最適」は、計画の統計的特性を定量化する指標(最適化基準)によって定義されます。典型的なスクリーニング計画では、最適化基準は、その計画が因子効果をどれほど精度よく推定できるかを定量化します。スクリーニング実験では、どの因子が応答に最も強く影響するかを正確に判断するために、高精度な効果推定値が必要であるため、この基準が用いられます。他のDOEの場面では、別の最適化基準が有用です。たとえば、アルゴリズム型応答曲面実験では通常、応答の正確な予測値を作成するモデル構築をどの程度サポートするかを定量化する最適化基準を使用します。
アルゴリズム型スクリーニング計画の例はどのようなものですか?
スクリーニング計画の概要ページで紹介されているものと同じシナリオから開始しましょう。さらに複雑な要素が加わっています。
たとえば、あなたが新しい医薬品の製造工程を開発している製薬会社で働いているとします。医薬品の不純物に最も強く影響を与える因子を特定する必要があります。最終的な目標は、それらの因子に応答曲面法を適用して、不純物を最小化する因子設定を見つけることです。このスクリーニング実験の因子は次のとおりです:
- 混合時間(Blend Time):(連続変数、10〜30分)
- 圧力(Pressure):(連続変数、60~80kPa)
- pH:(連続変数、5〜8)
- 攪拌速度(Stir Rate):(連続変数、100~120 RPM)
- 触媒(Catalyst):(連続変数、1%~2%)
- 温度(Tempereture):(連続変数、摂氏15°~45°)
- 供給速度(Feed Rate):(連続変数、10~15L/分)
- ベンダー(Vendor):(3水準のカテゴリカル、3つの異なる原材料ベンダー)
- 粒子サイズ(Particle Size):(2水準のカテゴリカル、小および大)
この実験を設計する際には、2つの複雑な問題に直面します。まず、リソースの制約により、実験回数は15回に制限され、因子空間の768の組み合わせのうち2%未満しかカバーできません。この疎(スパース)な計画では、各因子の主効果を評価するほかに、1つ以上の連続因子の効果における2次曲率の可能性を考慮する必要があります。そのためには、少なくとも1つの中心点(すべての連続因子の中間値での実験)が必要です。次に、高い 圧力 を維持しながら低い 温度 で実施することとその逆は実現不可能であることがわかっているため、因子空間のこれらの領域での実験を回避するように設計に制約を加える必要があります。この制約は以下にグラフで示されており、赤い領域は避けるべき因子空間の部分を表しています。
最初に古典的なスクリーニング計画を構築しようとしますが、ほとんどの古典的なスクリーニング計画はカテゴリカル因子が2水準であると仮定しており、ベンダーが3水準であるため、選択肢が直ちに制限されます。使用可能な古典的な計画(L18計画)は、最低18回の実行が必須であり、さらに 圧力 と 温度 の制約を考慮できないため、古典的な計画を使用せず、アルゴリズム型計画を選択することにしました。
JMPなどのDOEソフトウェアを使用して、因子空間の実験不可能な領域に実験点を置かない15回の実験計画を作成します。このソフトウェアによると、計画には最低11回の実験が必要であり、7つの連続因子、1つの3水準カテゴリ因子、1つの2水準カテゴリ因子に対する切片と主効果を推定するための必要な数です。k水準の因子では、k-1のモデルパラメータを推定する必要があることに注意してください。予算にはまだ4回の実験が残っているので、アルゴリズムが2つの中心点と2回の反復実験を含む計画を生成するように指定します。これらを組み合わせることで、連続的な効果が2次曲線(曲面効果)が存在するかどうかを評価することができます。(これについては、データを分析する際に詳しく説明します。)計画テーブルは以下のとおりで、その後に 圧力(Pressure) と 温度(Temperature ) の空間での計画を示すグラフが続きます。
| 実行 | ブレンド時間 | 圧力 | PH | 攪拌速度 | 触媒 | 温度 | 供給速度 | ベンダー | 粒子サイズ |
| 1 | 30 | 80 | 8 | 100 | 1 | 45 | 10 | 安い | スモール |
| 2 | 30 | 80 | 5 | 120 | 2 | 45 | 15 | 高速 | スモール |
| 3 | 10 | 65 | 5 | 100 | 2 | 45 | 15 | 安い | 大 |
| 4 | 10 | 80 | 8 | 120 | 1 | 45 | 15 | 良い | 大 |
| 5 | 30 | 80 | 5 | 120 | 2 | 45 | 15 | 高速 | スモール |
| 6 | 10 | 60 | 8 | 120 | 2 | 15 | 15 | 安い | スモール |
| 7 | 20 | 69.9 | 6.5 | 110 | 1.5 | 30.1 | 12.5 | 良い | 大 |
| 8 | 30 | 60 | 8 | 100 | 1 | 15 | 15 | 高速 | 大 |
| 9 | 10 | 60 | 5 | 120 | 1 | 40 | 10 | 高速 | スモール |
| 10 | 20 | 69.9 | 6.5 | 110 | 1.5 | 30.1 | 12.5 | 良い | 大 |
| 11 | 30 | 60 | 8 | 100 | 1 | 15 | 15 | 高速 | 大 |
| 12 | 30 | 75 | 5 | 120 | 1 | 15 | 10 | 安い | 大 |
| 13 | 10 | 80 | 8 | 100 | 2 | 20 | 10 | 高速 | 大 |
| 14 | 10 | 80 | 5 | 100 | 1 | 20 | 15 | 良い | スモール |
| 15 | 30 | 60 | 8 | 100 | 2 | 40 | 10 | 良い | スモール |
この計画がこれまでに見たどの古典的なスクリーニング計画とも異なっていることに気付かれるでしょう。圧力と 温度 はいずれも、2水準または3水準ではなく、5つの水準で測定されます。また、中心点が 圧力 と 温度 の範囲の中間値(つまり、圧力は69.9、温度は30.1)に近い位置で測定されているものの、正確に中間値ではないことにも気づきます。これは、計画アルゴリズムが 圧力 と 温度 の制約を遵守しながら、分析段階で正確なパラメータ推定を目指して、統計的に最適な設計を見つけた結果です。また、圧力と 温度 のグラフの左上または右下の隅に実験点がないため、制約が確かに守られていることもわかります。代わりに、アルゴリズムは、制約で許可されている範囲で、それらの領域にできるだけ近い点を配置します。
次に、15回の実験をランダムな順序で行い、その都度生じる不純物の水準を測定し、その後、主効果のみを含む重回帰分析モデルを使用して結果を分析します。分析により、p値が0.05未満の3つの因子(温度、ベンダー、pH)が明らかになり、不純物への効果の統計的証拠が示されました。他の因子は影響がないか、影響が無視できるほど小さいという結論に至りました。
| 因子 | p値 |
| 温度 | 0.00204 |
| ベンダー | 0.01744 |
| PH | 0.01750 |
| 供給速度 | 0.19999 |
| 触媒 | 0.24683 |
| ブレンド時間 | 0.49980 |
| 攪拌速度 | 0.52453 |
| 圧力 | 0.82430 |
| 粒子サイズ | 0.92482 |
次に、明らかにした効果の性質を理解するためにグラフを作成します。グラフは、温度と pH の両方の効果が正の方向であり、その範囲全体で 温度 の効果がより大きいことを示しています。また、ベンダーの効果には明確なパターンが見られ、「安価(Cheap)」は「高速(Fast)」や「良好(Good)」よりも不純物レベルが著しく高いことがわかります。また、2つの中心点(白丸で表示)が 温度 と pH の影響を示す線よりもかなり下にあることに気づきます。これは少なくとも1つの連続因子における2次曲率を示唆していますが、中心点ではどの因子が原因であるかを特定することはできません。
最後に、あてはまりの悪さ (LOF) 検定を用いて、モデルが2次曲線のような効果を欠いているかどうかを検定します。この検定では計画に少なくとも1回の反復が必要であり、賢明にも、アルゴリズム型計画に反復を含めるように指定しています。検定のp値は 0.05未満なので、モデルに何らかの効果が欠けていると結論付けられます。これはグラフの曲線の視覚的評価と一致しています。あなたは、特定した3つの有意な因子を対象に、新しい実験で計画を拡張して、2つ連続因子の2次曲率と、3つの因子間のすべての2因子交互作用を推定できる応答曲面計画を生成することを決定します。
あてはまりの悪さ(LOF; Lack Of Fit)
| 要因 | 自由度 | 平方和 | 平均平方 | F値 |
| あてはまりの悪さ(LOF) | 1 | 39.73 | 39.73 | 94.11 |
| 純粋誤差 | 3 | 1.27 | 0.42 | p値(Prob>F) |
| 合計誤差 | 4 | 41.00 | 0.0023* |