Flujo de trabajo de diseño de experimentos

¿Cuál es el flujo de trabajo de diseño de experimentos (DOE)?

El diseño de experimentos (DOE) es un enfoque estructurado para planificar, realizar y analizar experimentos con el fin de comprender mejor cómo múltiples variables de entrada (factores) afectan a una variable de salida (respuesta). Un experimento diseñado puede ayudarnos a identificar relaciones de causa y efecto, y optimizar nuestros procesos o productos. El flujo de trabajo del DOE describe una secuencia típica de pasos para ejecutar correctamente un experimento diseñado.

El flujo de trabajo del DOE consta de seis pasos: definir, modelar, diseñar, introducir datos, analizar y predecir. El marco para diseñar un experimento sigue siendo el mismo independientemente del método de diseño experimental que elija.

Si bien estos pasos se refieren a un solo experimento, puede que se necesite una secuencia de experimentos para alcanzar el propósito experimental. El conocimiento del tema es fundamental para todos los pasos del DOE.

Figura 1: El marco DOE implica definir, modelar, diseñar, ingresar datos, analizar y predecir.

Definición

El propósito del experimento debe servir de guía para las elecciones de diseño durante el proceso del DOE. Hay una serie de preguntas que se deben responder durante el paso de definición, y todas están relacionadas con la información que se desea obtener al final del experimento.

Las preguntas a responder durante el paso de definición del marco DOE incluyen:

Dos propósitos comunes de DOE son identificar factores importantes de un gran conjunto de factores (comúnmente conocido como “cribado”) o caracterizar y optimizar un proceso. Su experimento podría tener más de un propósito.

Una vez establecido el propósito, se definen la respuesta y el factor. La respuesta es lo que se mide durante el experimento; el factor es lo que cambia durante el experimento para entender su impacto en la respuesta.

Figura 2: Para este ejemplo, nos interesa optimizar un proceso mediante la identificación de qué configuración de factores produce el mayor rendimiento y la menor impureza. El rendimiento y la impureza son las respuestas; el pH, la temperatura y el proveedor son los factores.

Modelo

Durante el paso del modelo, se especifica un modelo estadístico inicial. Un experimento diseñado es un conjunto de pruebas realizadas para apoyar un modelo estadístico propuesto. El modelo estadístico que especifica está directamente relacionado con el propósito del experimento. Los modelos de primer orden (solo efectos principales) se utilizan comúnmente para identificar factores activos (cribado), mientras que los modelos de segundo orden (incluidos los términos cuadráticos y de interacción) ofrecen mayor flexibilidad para predecir y optimizar respuestas. En función del enfoque de diseño que utilice, el modelo estadístico estará implícito en la elección de diseño, o puede especificar un modelo estadístico que solo incluya los efectos del modelo que desea calcular.

Figura 3: Se elige un modelo inicial de un diseño de superficie de respuesta con 18 ejecuciones.

Diseño

Durante este paso, se genera un diseño en función de las decisiones tomadas durante el paso del modelo. Cada fila del diseño es una ejecución y contiene las combinaciones de factores que desea probar. El diseño consta del número de ejecuciones necesarias para calcular el modelo estadístico propuesto, más algunas ejecuciones adicionales para estimar el error experimental. La evaluación del diseño también se realiza durante este paso. La evaluación del diseño es un conjunto de herramientas que utilizamos para comprender los puntos fuertes y las limitaciones del diseño, y para asegurarnos de que nuestro diseño proporcione la información necesaria dada la finalidad del experimento. La evaluación del diseño se puede utilizar para comparar dos o más diseños, y entender las ventajas y desventajas.

Figura 4: La tabla de datos de diseño para un experimento de 18 ejecuciones.

Entrada de datos

Para el paso de introducción de datos, el experimento se ejecuta siguiendo el orden de ejecución del diseño; las respuestas de cada ejecución se registran en la tabla de datos.

Figura 5: El experimento se ejecuta probando cada una de las filas de combinaciones de factores de la tabla de diseño. Los valores de respuesta se registran en la tabla de datos.

Análisis

Durante el paso de análisis, el modelo estadístico inicial especificado como “completo” se ajusta a los datos experimentales. Durante el cribado, el modelo consta de efectos principales o, a veces, algunas o todas las interacciones de dos factores. Cuando se desea predecir u optimizar el proceso, el modelo suele incluir efectos de segundo orden (interacciones cuadráticas y de dos factores). Un modelo estadístico común es el modelo de regresión lineal múltiple. Los efectos inactivos (no significativos) pueden eliminarse del modelo inicial completo para crear un modelo reducido. Si se recopila más de una respuesta durante el experimento, se ajusta un modelo individual para cada respuesta.

Figura 6: Se crea un modelo de regresión mediante el modelo inicial de los efectos que se deben calcular. Las líneas verdes continuas son términos que son estadísticamente significativos e influyen en el rendimiento de la respuesta. Se muestra el modelo “completo”.

Figura 7: El botón “Mejor modelo” reducirá el modelo al eliminar los términos inactivos del modelo “Completo”. Se muestra el “mejor modelo”.

Predicción

Durante este paso, el modelo reducido del paso de análisis se utiliza para predecir los valores futuros de la respuesta y, si se especificaron objetivos de respuesta, encontrar la configuración de los factores que se predice que cumplirán esos objetivos. El modelo es un modelo de interpolación, lo que significa que puede hacer predicciones para cualquier nivel de los factores dentro del rango de los factores, incluso si el diseño no probó esos niveles en particular.

Figura 8: El perfilador de predicción explica qué configuración de factores produce el mayor rendimiento y la menor impureza. En este caso, un pH de 7.14, una temperatura de 33.70 y el proveedor rápido producirán el mayor rendimiento y la menor impureza.