Diseño de experimentos
¿Qué es el diseño de experimentos?
El diseño de experimentos (DOE) es un enfoque sistemático utilizado por científicos e ingenieros para estudiar los efectos de diferentes entradas (por ejemplo, velocidad, temperatura o proveedor) en un proceso y las salidas de ese proceso (por ejemplo, rendimiento, impureza o coste). El DOE es un marco poderoso y eficiente para entender sistemas complejos y tomar decisiones de manera confiable y basadas en datos.
¿Cuándo debería usar el DOE?
En términos generales, un experimento diseñado puede ayudarle cuando usted quiere:
- Determinar si un factor, o grupo de factores, influye en una respuesta de interés.
- Comprender las posibles relaciones entre los factores y las respuestas.
- Optimizar una o más respuestas identificando qué configuración de factores (por ejemplo, una temperatura específica y un proveedor) produce un resultado deseado (por ejemplo, el mayor rendimiento).
¿Por qué no cambiar un factor a la vez?
Aunque pueda parecer más intuitivo o directo realizar un experimento en el que solo se cambie un factor a la vez, veamos un ejemplo sencillo para ilustrar la potencia del DOE.
En el enfoque de un factor a la vez (OFAT), se prueba un solo factor cambiando la configuración, o nivel, de ese factor mientras se mantienen todos los demás factores en un nivel constante. Luego repite este proceso para cada factor en su experimento.
Ejemplo de un factor a la vez
Supongamos, por ejemplo, que le interesa maximizar el Rendimiento de un proceso químico y sabe que la Temperatura y el pH son los principales impulsores del Rendimiento. En las configuraciones actuales de sus factores (Temperatura = 25°C y PH = 5.5), el Rendimiento es 83%.
Para determinar si puede aumentar el Rendimiento, decide conservar el PH en su configuración actual y variar la Temperatura. Sabe por experiencia previa que a temperaturas inferiores a 15 °C o superiores a 45 °C el proceso funciona mal, por lo que decide variar la Temperatura en ese rango en incrementos de 5 °C y registrar los resultados.
Cuando el PH se mantiene constante en 5.5, descubre que el máximo Rendimiento del 85% ocurre cuando la Temperatura se establece en 30 °C, lo cual es una pequeña mejora de la configuración actual.
A continuación, decide mantener la Temperatura fija en 30°C y variar el pH. Con base en la experiencia pasada, decide variar el pH de 5 a 8 en incrementos de 0.5 y registrar los resultados.
Del resultado de estas 13 pruebas donde varió un factor a la vez, concluye que el Rendimiento se maximiza al 86% cuando la Temperatura se establece a 30 °C y el pH es 6. También parece que el Rendimiento disminuye a medida que supera esos valores o está por debajo de ellos. En otras palabras, parece haber curvatura en la relación entre cada factor y las respuestas.
¿Pero realmente puede estar seguro de que este experimento OFAT ha capturado las verdaderas relaciones entre Temperatura, pH y Rendimiento? Dado que no varió la Temperatura y el pH juntos de manera sistemática, no puede investigar la posibilidad de una interacción entre estos factores. Es decir, no se puede determinar si el efecto de la Temperatura sobre el Rendimiento varía según el nivel de pH y viceversa. Si realmente existe una interacción, la forma de la respuesta, Rendimiento, podría ser muy diferente de lo que concluyó después de su experimento OFAT.
¿Qué tipo de experimento necesitaría hacer para evaluar si estos dos factores interactúan entre sí y para entender cómo se comportan verdaderamente las respuestas a través de los rangos de los factores (la región experimental)? Podría probar todas las combinaciones posibles de temperatura y pH a lo largo de sus rangos, pero eso sería lento y costeso. En este ejemplo, necesitaría realizar 49 pruebas para cubrir toda la región experimental, asumiendo que cambia los factores en el mismo incremento.
El DOE ofrece una mejor manera de aprender cómo la Temperatura y el pH afectan el Rendimiento y si interactúan. Echemos un vistazo.
Utilizando un experimento diseñado
Para este ejemplo de dos factores, definimos la región experimental como las esquinas de un cuadrado: ambos factores en sus niveles bajos, ambos factores en sus niveles altos, y las combinaciones donde un factor es bajo y el otro es alto.
Probar estas combinaciones de tratamientos le permite estimar los efectos individuales de cada factor en el Rendimiento, así como sus posibles interacciones. Agregar pruebas con los factores en sus niveles medios le permite estimar cualquier curvatura en la forma de la respuesta.
En total, hay nueve combinaciones de tratamientos. Replicar (repetir) al menos una de las combinaciones de tratamiento cuando sea posible permite probar la significación estadística de los términos en su modelo. En este ejemplo, el experimento consta de 12 pruebas o ejecuciones: nueve combinaciones de tratamientos más tres repeticiones. Para garantizar que los resultados no se vean afectados por fuentes de variación fuera del experimento, realice las ejecuciones en orden aleatorio y registre los resultados.
Los resultados de este experimento indican que el Rendimiento máximo (91%) se produce cuando la Temperatura es de 45°C y el pH es de 8, lo que supone una mejora con respecto a los mejores resultados del experimento OFAT (donde el Rendimiento máximo fue del 86%). ¿Es posible que haya una combinación no probada de configuraciones para la Temperatura y el pH dentro de la región experimental que produzca un Rendimiento aún mayor? ¿Cómo respondería a esa pregunta sin realizar más pruebas?
Al analizar los datos, está construyendo un modelo estadístico que describe la relación entre la Temperatura, el pH y el rendimiento. Este es un modelo de interpolación, lo que significa que se puede utilizar para hacer predicciones en combinaciones no probadas de los factores dentro de la región experimental. El modelo incluye términos para los efectos individuales de Temperatura y pH, sus interacciones y sus efectos cuadráticos, donde los βs son los coeficientes estimados:
$$ Predicted\:Yield = \beta_0 + \beta_1 Temp + \beta_2 pH + \beta_{12} Temp * pH + \beta_{11} Temp^2 + \beta_{22} pH^2 $$
En esta visualización de la respuesta, la forma es distinta a la indicada por los datos de OFAT. En lugar de disminuir desde el centro de la región experimental, se puede observar que la superficie se eleva y gira a medida que aumentan la Temperatura y el pH. El giro sugiere una interacción entre los dos factores, algo que no fue, y no podría ser, detectado por el experimento OFAT.
Luego puede usar este modelo para hacer predicciones sobre valores futuros de Rendimiento, y en particular, para buscar la configuración de Temperatura y pH dentro de la región experimental que se predice para maximizar el Rendimiento. En este ejemplo, el modelo predice que el Rendimiento se maximizará en un 92% cuando la Temperatura se establezca en 45°C y el pH se establezca en 7, una combinación que usted no probó directamente.
Por supuesto, tendrá que confirmar esta predicción realizando algunas pruebas más en la configuración de factores que predicen el máximo Rendimiento.
Resumen
En este ejemplo, el experimento OFAT que inicia con la configuración actual del proceso no encontró la mejor configuración para maximizar el Rendimiento y no proporcionó los datos que necesitaría para evaluar si existe una interacción entre la Temperatura y el pH. De hecho, el método OFAT claramente no capturó el verdadero comportamiento del sistema.
La única forma de buscar esas configuraciones con el método OFAT habría sido probar cada posible combinación de tratamientos dentro de la región experimental. En este escenario, eso significaría 49 pruebas separadas, y solo había dos factores. Imagínese cuántas pruebas requeriría este enfoque en una situación más realista en la que tuviera cinco factores, diez factores o más.
En nuestro ejemplo anterior, los experimentos diseñados le permitieron ajustar un modelo que incluyó la posible interacciones entre la Temperatura y el pH, y realizar predicciones a lo largo de la región experimental sin tener que probar cada combinación posible de los factores. Al hacerlo, pudo buscar la mejor configuración con muchas menos ejecuciones que si tuviera que probar todas las combinaciones (12 frente a 49 o cerca de 25%). Fue un ejemplo simple con un número de factores muy limitado. Los beneficios de usar el DOE solo aumentan cuantos más factores tenga.