実験計画(DOE)

実験計画法(DOE)とは何ですか?

実験計画法(DOE)は、科学者やエンジニアが工程に対するさまざまな入力(速度、温度、ベンダーなど)が、その工程の出力(収率、不純物、コストなど)に及ぼす影響を研究するために使用する体系的なアプローチです。DOEは複雑なシステムを理解し、データに基づいて信頼性のある意思決定を行うための強力で効率的なフレームワークです。

DOEはいつ使用すべきですか?

大まかに言って、計画された実験は、以下の場合に役立ちます。

  • ある因子または複数の因子が、関心のある応答に影響を与えるかどうかを判断する。
  • 因子と応答の間の潜在的な関係を理解する。
  • どの因子設定(特定の温度やベンダーなど)が望ましい結果(最大の収率など)を得られるかを特定して、1つ以上の応答を最適化する。

なぜ一度に1つの因子だけを変更する方法ではいけないのでしょうか?

一度に1つの因子だけを変更する実験の方が直感的または簡単に思えるかもしれませんが、DOEを使用することの利点を示すために簡単な例を見てみましょう。

一度に1因子だけ変えるアプローチ(OFAT)では、その他のすべての因子を一定の水準に保ちながら、その1つの因子の設定値(水準)を変えて影響を調べます。次に、実験の各因子に対してこの手順を繰り返します。

OFATの例

たとえば、化学プロセスの 収率(Yield) を最大化することに関心があるとし、温度(Temperature)pH収率 の重要な因子であることがわかっているとします。現在の因子設定(温度 = 25°C および pH = 5.5)では 収率 は83%です。

温度25℃およびpH5.5の設定で収率83%を示すグラフ

収率を向上させることができるかどうかを判断するため、pHが現在の設定のままで 温度 を変化させます。以前の経験から、15°C未満または45°Cを超える温度では工程がうまく機能しないことを知っているため、温度をその範囲で5°C刻みで変化させ、結果を記録することにしました。

pHを5.5に固定し、温度を5度ずつ増加させた場合の収率のグラフ

pHを5.5で固定し、温度を30°Cに設定したときに最大の 収率 85%が得られることがわかります。これは現在の設定からわずかな改善です。

次に、温度を30°Cに固定し、pHを変化させることにします。過去の経験に基づいて、pHを5から8まで0.5刻みで変化させ、結果を記録することにします。

温度を30度に固定し、pHを0.5刻みで上昇させた収率のグラフ

これらの13の実験結果から、各因子を一度に1つずつ変化させた場合、温度が30°C、pHが6に設定されると、収量が86%で最大化されると結論付けました。また、これらの値を超えるか下回ると、収率が減少するようです。言い換えれば、各因子と応答の関係には曲線的な関係が見られるようです。

OFATテストに基づく各因子と応答の関係を示す3次元グラフ

しかし、このOFAT実験が温度pH収率の間の真の関係を捉えたことを本当に確信できるでしょうか。温度pH を体系的に 同時 に変化させなかったため、これらの因子 間の 交互作用の存在を調査することはできません。つまり、温度収率 への影響が pH のレベル(水準)に応じて変化するかどうか、またはその逆が起きるかを判断することはできません。もし実際に交互作用があるのであれば、収率という応答の形は、OFAT実験の後に結論づけたものとはまったく違ったものになるかもしれません。

これら2つの因子間に交互作用があるかを評価し、応答が因子の範囲(実験領域)全体で実際にどのように振る舞うかを理解するには、どのような実験を行う必要があるでしょうか。温度pH のすべての可能な組み合わせをその範囲内で実験することもできますが、時間がかかり、費用がかさみます。この例では、因子を一定の刻み幅で変化させると、実験領域全体をカバーするために 49回の実験を 行う必要があります。

OFATアプローチを用いて因子設定のすべての可能な組み合わせに対応するために必須な49回の実験を示すグラフ

DOEは、温度および pH収率 にどのように影響するか、そしてそれらの交互作用があるかどうかを学ぶ、より良い方法を提供します。見ていきましょう。

設計された実験の使用

この2因子の例では、実験領域を正方形の頂点として定義します。両方の因子が低水準にある場合、両方の因子が高水準にある場合、そして一方の因子が低水準で他方が高水準にある組み合わせです。

正方形の角で定義された実験領域を示すグラフ

これらの処理の組み合わせを実験することで、収率に対する各因子の個々の効果と、交互作用の有無を推定できます。因子の中間水準で実験を追加することにより、応答の形状における曲率(曲がり)を推定できます。

極地(コーナー)および中間水準での因子設定を含むグラフ

処理の組み合わせは、合計で9つあります。可能な場合には、少なくとも1つの処置の組み合わせを反復(繰り返し)することで、モデル内の項の統計的有意性を検定することができます。この例では、実験は12回の実験で構成されており、9通りの処理の組み合わせに、3回の反復を加えています。実験外の変動要因が結果に影響を与えないようにするために、実験はランダムな順序で行い、結果を記録します。

ランダムな順序で12回の実験と対応する結果を記録した表

この実験の結果は、収率の最大値(91%)が 温度 が45°Cで pH が8のときに得られることを示しており、これはOFAT実験の最良結果(最大 収率 は86%)を上回る改善です。実験領域内で、温度pH の設定の未テストの組み合わせで、さらに高い 収率 を生み出す条件が存在する可能性はあるでしょうか。追加の実験を行わずに、その質問に答えるにはどうすべきでしょうか。

データを分析するときは、温度pH収率の関係を記述する統計モデルを構築しています。これは 内挿 モデルです。つまり、これを使用して、実験領域内の実験されていない因子の組み合わせに対しても、収率の予測を行うことができます。このモデルには、温度pH の個々の効果、それらの交互作用、それらの2次効果が含まれており、βは推定された係数です。

$$ Predicted\:Yield = \beta_0 + \beta_1 Temp + \beta_2 pH + \beta_{12} Temp * pH + \beta_{11} Temp^2 + \beta_{22} pH^2 $$

この応答の可視化では、OFATデータが示す形状とは異なっています。実験領域の中心から減少するのではなく、温度および pH が上昇すると、曲面が盛り上がってねじれるように変化していることがわかります。このねじれは、2つの因子間に交互作用があることを示唆し、OFAT実験では検出されなかった(できなかった)ものです。

DOEに基づく各因子と応答の関係を示す3次元グラフ

このモデルを使用して、将来収率 の予測値を立てたり、特に実験領域の 収率 を最大化すると予測される 温度 および pH の設定を見つけることができます。この例では、温度が45度に設定され、pHが7に設定されたときに 収率 が92%で最大になると予測していますが、この組み合わせは直接実験していません。

DOEモデルが予測した最適設定を強調表示するグラフ

もちろん、最大の 収率 を予測する因子設定でさらにいくつかの実験をして、この予測を確認したいと思うでしょう。

要約

この例では、現在の工程の設定から始めたOFAT実験は、収率を最大化するための最適な設定を見つけることができず、温度pH の間に交互作用があるかどうかを評価するために必要なデータを提供しませんでした。実際、OFAT手法はシステムの真の挙動を明確に捉えそこねています。

OFATの方法で最適条件を見つける唯一の方法は、実験領域内のすべての処理の組み合わせを実験することでした。このシナリオでは、49回の個別の実験が必要となり、しかも因子は2つしかありません。因子が5、10、あるいはそれ以上ある場合、このアプローチでどれほどの実験が必要になるか、想像してみてください。

上の例では、計画された実験により、考えられるすべての因子の組み合わせを実験する必要なく、温度pH の交互作用を含むモデルをあてはめ、実験領域全体で予測を行うことができました。このようにして、すべての組み合わせを実験する必要がある場合よりもはるかに少ない実験回数で、最適な設定を見つけることができました(12回 vs 49回、つまり約25%)。これは、非常に限られた数の因子を使用した単純な例でした。DOEを使用する利点は、因子の数が増えるほど大きくなります。