Principios clave del diseño experimental
¿Cuáles son los tres principios básicos del diseño experimental?
- La aleatorización de las ejecuciones, o ensayos experimentales, evita que se introduzcan sesgos sistemáticos en el experimento. La aleatorización se refiere no solo a realizar las ejecuciones en un orden aleatorio, sino también a restablecer las condiciones después de cada ejecución.
- La disposición en bloques es una técnica de diseño que se utiliza para reducir o controlar la variabilidad de factores molestos.
- La replicación habilita al experimentador para obtener una estimación del error experimental.
Estos tres principios básicos o técnicas son fundamentales para el diseño experimental. La aleatorización se utiliza para reducir el sesgo, mientras que los otros dos principios ayudan a aumentar la precisión en el experimento.
Aleatorización
Para cada ensayo en el experimento, o ejecución experimental, se aplica un tratamiento y se registra la respuesta. Cuando aleatoriza el experimento, ejecuta los tratamientos en orden aleatorio. La aleatorización promedia los efectos de las variables no controladas (o latentes).
Veamos un ejemplo. Suponga que está estudiando un proceso de limpieza para piezas de titanio, con dos factores, Tiempo de baño y Tipo de solución. Usted realiza el experimento sin aleatorización. Se requiere un día para llevar a cabo las seis pruebas. Ejecuta todos los tratamientos con Tiempo de baño en 10 minutos en la mañana, y todos los tratamientos con Tiempo de baño en 30 minutos en la tarde. Mientras tanto, la temperatura ambiente y la humedad aumentan a lo largo del día.
En su análisis posterior, podría concluir que el Tiempo de baño es significativo. Sin embargo, como no aleatorizó los tratamientos, no puede separar el efecto del Tiempo de baño de los efectos de la temperatura ambiente y la humedad. Estos efectos se confunden. Aleatorizar los tratamientos puede prevenir esta confusión.
Disposición en bloques
Disposición en bloques para variables molestas
Puede usar una técnica llamada disposición en bloques para minimizar el impacto de las variaciones causadas por las variables molestas. Por ejemplo, si realiza el experimento en diferentes lotes, los lotes individuales pueden ser diferentes entre sí.
Puede dividir su experimento en bloques para equilibrar la variación potencial de los diferentes lotes en las ejecuciones de su experimento.
Además, si está llevando a cabo su experimento durante más de un día, la variación sin control de un día a otro puede agregar una gran cantidad de variación inexplicable a sus resultados. Si incluye Día como una variable de disposición en bloques en su experimento, puede contar con la variación de un día a otro en su análisis para que pueda detectar mejor sus efectos importantes.
Aleatorización restringida para factores difíciles de cambiar
Hemos aprendido acerca de la importancia de la aleatorización para promediar los efectos de las variables sin control o latentes. Sin embargo, hay ocasiones en las que podría no ser posible aleatorizar completamente todos sus tratamientos. Es posible que tenga factores que sean difíciles de cambiar o que solo se puedan cambiar en un orden determinado.
Por ejemplo, supongamos que un factor experimental sea la temperatura del horno.
Debido al tiempo que tarda el horno en alcanzar una temperatura establecida, no sería práctico cambiar la temperatura del horno entre cada ejecución.
Cuando tiene factores difíciles de cambiar como este, ejecutaría un experimento de diseños divididos o en franjas en lugar de un experimento completamente aleatorizado. Para obtener más información sobre cómo determinar la aleatorización de experimentos mediante diseños divididos y en franjas, consulte la Lección 3 del curso electrónico gratuito de Diseño personalizado de experimentos de JMP.
Replicación
La replicación es el concepto de repetir las mismas condiciones experimentales una o más veces y realizar nuevas mediciones para estas configuraciones repetidas. Puede repetir o replicar un solo tratamiento, un subconjunto de los tratamientos o todos los tratamientos. En un experimento completamente replicado, cada tratamiento se replica como mínimo una vez. La replicación habilita para estimar el error experimental, que es la variación no explicada en su experimento (es decir, la variación en sus respuestas que no se explica al cambiar sus factores). Es necesaria una estimación del error experimental para evaluar la significación estadística.
Por ejemplo, en el experimento de limpieza mencionado anteriormente, se requiere, como mínimo absoluto, una sola ejecución para cada uno de los seis tratamientos. Supongamos que replicamos el tratamiento en las configuraciones de Tiempo de baño = 10 y Tipo de solución = 1. Cuando aleatorizamos el orden de las ejecuciones, esta combinación de tratamientos podría ocurrir como la segunda ejecución y también como la séptima ejecución. Tener replicación para uno o más puntos de diseño permite una estimación de la variación en la respuesta cuando las configuraciones de factores son las mismas: en otras palabras, el error experimental. Replicar más de un punto de diseño mejorará la estimación del error.
Consideremos un experimento donde quiere comparar la dureza de cuatro tipos distintos de brocas midiendo la profundidad de las hendiduras que hacen en láminas de metal. Los primeros pasos para este experimento podrían incluir las siguientes tareas:
- Seleccionar todas las unidades (láminas de metal) del mismo lote.
- Asignar aleatoriamente tratamientos (brocas) a las unidades experimentales.
- Presionar una broca contra la lámina de metal.
- Medir y registrar la profundidad de la hendidura.
La replicación ocurre cuando se asignan tratamientos idénticos a más de una unidad experimental. Una interpretación incorrecta de la replicación es una medición repetida.
Supongamos que está limitado a cuatro unidades experimentales para este experimento, por lo que solo permite un tamaño de muestra de una para cada uno de los cuatro tipos de broca (el tratamiento). Si le preocupa que esto sea insuficiente, podría considerar aplicar dos tratamientos a cada hoja de metal y medir las hendiduras. Usted razona que esto le da un tamaño muestral de dos observaciones (o una replicación) para cada tratamiento.
¿Qué hay de malo en este enfoque?
La verdadera replicación significa aplicar el mismo tratamiento a más de una unidad experimental. No se pueden aplicar diferentes tratamientos (brocas) a una hoja de metal individual, ya que la hoja de metal se define como una única unidad experimental. Al utilizar cada hoja dos veces, se realiza una pseudorreplicación, no una replicación verdadera. No es apropiado tratar las dos muestras como independientes, porque las observaciones de la misma hoja de metal son interdependientes.