Diseño de experimentos

¿Qué es el diseño de experimentos?

El diseño de experimentos (DOE) es un enfoque sistemático utilizado por científicos e ingenieros para estudiar los efectos de diferentes entradas (por ejemplo, velocidad, temperatura o proveedor) sobre un proceso, y los resultados de dicho proceso (por ejemplo, rendimiento, impureza o costo). El DOE es un marco potente y eficaz para comprender sistemas complejos y tomar decisiones de forma fiable y basada en datos.

¿Cuándo debo utilizar el DOE?

En términos generales, un experimento diseñado puede resultar útil cuando desea:

  • Determinar si un factor o un grupo de factores influyen en una respuesta de interés.
  • Comprender las posibles relaciones entre factores y respuestas.
  • Optimizar una o más respuestas mediante la identificación de las configuraciones de factores (por ejemplo, una temperatura específica y un proveedor) que producen un resultado deseado (por ejemplo, el mayor rendimiento).

¿Por qué no conviene cambiar un factor por vez?

Aunque pueda parecer más intuitivo o sencillo realizar un experimento en el que solo se cambie un factor por vez, veamos un ejemplo sencillo para ilustrar el poder de usar DOE.

En el enfoque de un factor por vez (OFAT), cambia la configuración o el nivel de ese factor para probar un factor único, y se mantienen todos los demás factores en un nivel constante. A continuación, repite este proceso para cada factor del experimento.

Ejemplo de OFAT

Supongamos, por ejemplo, que le interesa maximizar el rendimiento de un proceso químico y sabe que la temperatura y el pH son factores clave del rendimiento. Con la configuración actual de los factores (temperatura = 25 °C y pH = 5,5), el rendimiento es del 83 %.

Gráfico que muestra un rendimiento del 83% para configuraciones de temperatura = 25°C y pH = 5.5

Para determinar si puede aumentar el rendimiento, decide mantener el pH en su valor actual y variar la temperatura. Sabe por experiencia previa que, a temperaturas inferiores a 15 °C o superiores a 45 °C, el proceso funciona mal, por lo que decide variar la temperatura en ese rango en incrementos de 5 °C y registrar los resultados.

Gráfico de porcentajes de rendimiento con pH fijado en 5.5 y temperatura que aumenta en incrementos de 5

Cuando el pH se mantiene constante en 5,5, descubre que el rendimiento máximo del 85 % se produce cuando la temperatura se ajusta a 30 °C, lo que supone una pequeña mejora respecto de la configuración actual.

A continuación, decide mantener la temperatura fija en 30 °C y variar el pH. En función de la experiencia, decide variar el pH de 5 a 8 en incrementos de 0,5 y registrar los resultados.

Gráfico de porcentajes de rendimiento con temperatura fija en 30 y pH que aumenta en incrementos de 0.5

A partir de los resultados de estas 13 pruebas, donde cambió un factor por vez, concluye que el rendimiento se maximiza en el 86 % cuando la temperatura se establece a 30°C y el pH a 6. También parece que el rendimiento disminuye a medida que supera o se mantiene por debajo de esos valores. Es decir, parece que existe una curvatura en la relación entre cada factor y la respuesta.

Gráfico tridimensional que muestra la relación entre cada factor y la respuesta basada en la prueba OFAT

Pero ¿puede estar realmente seguro de que este experimento OFAT captó las verdaderas relaciones entre la temperatura, el pH y el rendimiento? Como no varió la temperatura y el pH en conjunto, de forma sistemática, no puede investigar la posibilidad de una interacción entre estos factores. Es decir, no se puede determinar si el efecto de la temperatura sobre el rendimiento cambia en función del nivel de pH y viceversa. De hecho, si existe una interacción, la forma de la respuesta, el rendimiento, podría ser muy diferente a lo que usted concluyó tras su experimento OFAT.

¿Qué tipo de experimento necesitaría realizar para evaluar si estos dos factores interactúan entre sí y para comprender cómo se comporta realmente la respuesta en los rangos de los factores (la región experimental)? Podría probar todas las combinaciones posibles de temperatura y pH en todos sus rangos, pero eso llevaría mucho tiempo y sería costoso. En este ejemplo, tendría que realizar 49 pruebas para cubrir toda la región experimental y cambiar los factores en los mismos incrementos.

Gráfico que muestra las 49 pruebas necesarias para abordar todas las combinaciones posibles de configuración de factores con el enfoque OFAT

El DOE proporciona una mejor manera de saber cómo la temperatura y el pH afectan al rendimiento y si interactúan.  Echemos un vistazo.

Utilizando un experimento diseñado

Para este ejemplo de dos factores, definimos la región experimental como las esquinas de un cuadrado: ambos factores en sus niveles bajos, ambos factores en sus niveles altos y las combinaciones en las que un factor es bajo y el otro es alto.

Gráfico que muestra la región experimental definida por las esquinas de un cuadrado

Probar estas combinaciones de tratamientos le permite estimar los efectos individuales de cada factor en el rendimiento, así como su posible interacción. Sumar pruebas con los factores en sus niveles intermedios permite estimar cualquier curvatura en la forma de la respuesta.

Gráfico que incluye configuración de factores en los extremos (esquinas) y niveles medios

En total, existen nueve combinaciones de tratamientos. Replicar (repetir) al menos una de las combinaciones de tratamientos, cuando sea posible, permite comprobar la significación estadística de los términos del modelo. En este ejemplo, el experimento consta de 12 pruebas o ejecuciones: nueve combinaciones de tratamientos más tres réplicas. Para garantizar que los resultados no se vean afectados por fuentes de variación externas al experimento, realice las pruebas en orden aleatorio y registre los resultados.

Tabla que registra 12 ejecuciones en orden aleatorio y los resultados correspondientes

Los resultados de este experimento indican que el rendimiento máximo (91 %) se produce cuando la temperatura es de 45 °C y el pH es de 8, lo que representa una mejora respecto de los mejores resultados del experimento OFAT (donde el rendimiento máximo fue del 86 %). ¿Es posible que exista una combinación no probada de configuraciones para temperatura y pH dentro de la región experimental que produzca un alto rendimiento aun mayor? ¿Cómo respondería a esa pregunta sin realizar más pruebas?

Cuando analiza los datos, crea un modelo estadístico que describe la relación entre la temperatura, el pH y el rendimiento. Este es un modelo de interpolación, lo que significa que puede usarlo para hacer predicciones sobre combinaciones no probadas de los factores dentro de la región experimental. El modelo incluye términos para los efectos individuales de la temperatura y el pH, su interacción y sus efectos cuadráticos, donde las β son los coeficientes estimados:

$$ Predicted\:Yield = \beta_0 + \beta_1 Temp + \beta_2 pH + \beta_{12} Temp * pH + \beta_{11} Temp^2 + \beta_{22} pH^2 $$

En esta visualización de la respuesta, la forma es diferente de la que indican los datos de la OFAT. En lugar de disminuir desde el centro de la región experimental, puede ver que la superficie se eleva y se tuerce a medida que aumentan la temperatura y el pH. La curva indica una interacción entre los dos factores, algo que el experimento de la OFAT no detectó ni pudo detectar.

Gráfico tridimensional que muestra la relación entre cada factor y la respuesta según métodos de prueba del DOE

A continuación, puede utilizar este modelo para hacer predicciones sobre los valores futuros del rendimiento y, en particular, para encontrar los ajustes de temperatura y pH dentro de la región experimental que se predice que maximizan el rendimiento. En este ejemplo, el modelo predice que el rendimiento se maximizará al 92 % cuando la temperatura se establezca a 45 °C y el pH a 7, una combinación que no se probó directamente.

Gráfico que destaca la configuración óptima que predijo el modelo de DOE

Por supuesto que conviene confirmar esta predicción mediante algunas pruebas más con la configuración de factores que predicen el rendimiento máximo.

Resumen

En este ejemplo, el experimento OFAT que inició con la configuración actual del proceso no encontró la mejor configuración para maximizar el rendimiento y no proporcionó los datos que usted necesitaría para evaluar si existe una interacción entre la temperatura y el pH. De hecho, el método OFAT pasó claramente por alto el verdadero comportamiento del sistema.

La única forma de encontrar esa configuración con el método OFAT habría sido probar todas las combinaciones de tratamiento posibles dentro de la región experimental. En este caso, eso implica hacer 49 pruebas por separado, y solo había dos factores. ¡Imagine cuántas pruebas requeriría este enfoque en una situación más realista en la que tenga cinco, diez o más factores!

En nuestro ejemplo anterior, el experimento diseñado le permitió ajustar un modelo que incluía la posible interacción entre la temperatura y el pH, y hacer predicciones en toda la región experimental sin tener que probar todas las combinaciones posibles de los factores. De esta forma, pudo encontrar la mejor configuración con muchas menos pruebas que si hubiera tenido que probar todas las combinaciones (12 frente a 49, o alrededor del 25 %). Era un ejemplo sencillo con un número muy limitado de factores. Los beneficios de usar DOE solo aumentan cuantos más factores tenga.