実験計画の主要原則

実験計画の3つの基本原則とは?

  • 実験順序の ランダム化 により、実験に体系的なバイアスが入り込むのを防ぎます。ランダム化とは、実験をランダムな順序で実施することだけでなく、実験するたびに条件をリセットすることも指します。
  • ブロック化(局所管理)は、ノイズ要因による変動を削減または制御するために使用される計画手法です。
  • 反復により、実験者は実験誤差の推定ができます。

これら3つの基本原則(手法)は、実験計画の基本となります。ランダム化はバイアスを低減するために使用され、他の2つの原則は実験の精度を高めるために役立ちます。

ランダム化

実験の各試行では、処理(因子の水準の組み合わせ)を適用し、その応答を記録します。実験をランダム化すると、処理がランダムな順序で実施されます。ランダム化は、制御されていない(または潜在的な)変数の効果を平均化します。

例を見てみましょう。チタン部品の洗浄プロセスを研究していると仮定します。このプロセスには、バスタイム(Bath Time)溶液タイプ(Solution Type) という2つの因子があります。ランダム化せずに実験を行います。6つの試行をすべて行うのに1日かかります。朝は バスタイム を10分にしてすべての処理を行い、午後は バスタイム を30分にしてすべての処理を行います。その間、気温と湿度は一日を通して上昇しています。

潜在変数の影響を減らすために、ランダム化の前後で処置の組み合わせを示す2つのテーブル。

その後の分析で、バスタイムが有意であると結論付けるかもしれません。しかし、処理をランダム化していないため、バスタイムの効果を周囲の温度や湿度の影響から分離することはできません。これらの効果は混同され(交絡し)ています。処理をランダム化することで、この混同を防ぐことができます。

ブロック

ノイズ変数によるブロック化

ノイズ変数による変動の影響を最小限に抑えるために、ブロック化と呼ばれるテクニックを使用できます。たとえば、異なるバッチで実験を行う場合、各バッチはそれぞれ特性が異なる可能性があります。

変数X1、X2、および応答Yを含む8つの実験パターンを示す2つのデータバッチ。各バッチには、X1およびX2水準のすべての4つの組み合わせが含まれます。

実験をブロックに分割して、実験全体で異なるバッチによる潜在的な変動のバランスをとることができます。

パターン、ブロック、X1、X2、Yという変数を含む実験計画テーブル。実験でバッチがブロック変数として使用される方法を示すため、2つのバッチにブロックとしてラベルが付けられています。

さらに、実験を複数日にわたって行う場合、日々の変動を制御できないと、結果に多くの説明できない変動が加わる可能性があります。実験に 日(Day) をブロック変数として含めると、日々の変動を分析に考慮できるため、重要な効果をより適切に検出できます。

変更が困難な因子に対する制限付きランダム化

制御されていない変数や、潜在的な変数の効果を平均化するためのランダム化が重要であることについて学びました。しかし、すべての実験処理を完全にランダム化できない場合もあります。変更が困難な因子や、特定の順序でのみ変更できる因子があるかもしれません。

オーブンの温度を表す実験的因子としてラベル付けされたオーブンの図。

たとえば、実験の因子としてオーブンの温度を考えてみましょう。

オーブンが設定温度に達するまでに時間がかかるため、実験ごとにオーブンの温度を変更することは現実的ではありません。

オーブンのイラストと時計のアイコン。実行ごとに温度を変更するのは非現実的であることを示すテキストが添えられています。

変更が困難な因子がある場合、完全にランダム化された実験の代わりに、スプリットプロット実験(分割実験)またはストリッププロット実験(2方分割実験)を実行します。スプリット計画、ストリッププロット計画を使用して実験をランダム化する方法の詳細については、JMPのカスタム実験計画無料eコースのレッスン3を参照してください。

反復

反復とは、同じ実験条件を1回以上繰り返し、その繰り返した設定に対して新たな測定を行うという考え方です。単一の処理、処理のサブセット、またはすべての処理を繰り返す(反復する)ことができます。完全反復実験では、各処理は少なくとも1回反復されます。反復により、実験誤差、すなわち実験によって説明されない変動(因子を変更しても説明できない応答の変動)を推定できます。統計的有意性を検定するためには、実験誤差の推定が必要です。

たとえば、上述の洗浄実験においては、実験には6つの処理のそれぞれに対して少なくとも1回の実験が必要です。バスタイム = 10および溶液タイプ = 1の設定で処理を反復すると仮定します。実験の順序をランダム化すると、この処理の組み合わせが2回目の実験としても、7回目の実験としても出現する可能性があります。1つまたは複数の実験点で反復をすることで、因子設定が同じ場合の応答の変動、つまり実験誤差を推定できます。複数の計画点を反復することで、誤差の推定が向上します。

たとえば、4種類のドリルビットが金属シートに作るくぼみの深さを測定して、その硬度を比較する実験を考えてみましょう。この実験の最初の数ステップには、以下のようなタスクが含まれます。

反復は、同一の処理を複数の実験単位に割り当てるときに発生します。反復の不適切な解釈は、測定の繰り返しと混同してしまいます。

この実験では、実験単位が4つに制限されているため、4種類のドリルビット(処理)のそれぞれについてサンプルサイズは1つしかありません。これが不十分であると心配な場合は、各金属シートに2つの処理(ドリルビットを押し当てる)を適用して、2つのくぼみを測定することを検討します。これにより、各処理に対して2つの観測値(つまり1つの反復)が得られると考えます。

このアプローチの何が問題でしょうか?

真の反復とは、複数の実験単位に同じ処理を適用することを意味します。金属シートは単一の実験単位として定義されているため、個々の金属シートに異なる処理(ドリルビット)を適用することはできません。各シートを2回使用することは、真の反復ではなく 疑似反復 を実施することになります。同じ金属シートからの観測値は相互に依存しているため、2つのサンプルを独立したものとして扱うのは適切ではありません。