Diseños de cribado definitivo
¿Qué son los diseños de cribado definitivo?
Un diseño de cribado definitivo (DSD) es un diseño experimental especializado para identificar cuál de los muchos factores continuos influye más en una respuesta. Los DSD requieren un número pequeño de ejecuciones mientras ofrecen ventajas sobre los diseños de cribado estándar de un tamaño de ejecución similar. Reducen la ambigüedad en la identificación de efectos activos, permiten identificar la curvatura en los efectos de factores individuales y admiten la estimación de modelos cuadráticos completos en un pequeño subconjunto de factores.
¿Por qué debería usar un diseño de cribado definitivo?
Los diseños de cribado definitivo ofrecen numerosas ventajas sobre los diseños de cribado estándar, como los diseños factoriales fraccionales o de Plackett-Burman. Estos diseños estándar pueden crear alias de algunos efectos principales e interacciones de dos factores, así como confundir completamente las interacciones de dos factores entre sí, lo que lleva a ambigüedad en la identificación de efectos activos. Más allá de eso, aunque los diseños de cribado estándar con puntos centrales pueden identificar la presencia de curvatura en uno o más factores, no pueden determinar qué factores son la fuente de la curvatura sin requerir ejecuciones adicionales. En comparación, los DSD ofrecen varias ventajas:
- Los efectos principales son ortogonales a las interacciones de dos factores, lo que significa que sus estimaciones no están sesgadas cuando las interacciones de dos factores están activas.
- No hay dos interacciones de factores completamente confundidas entre sí, lo que reduce la ambigüedad al identificar los efectos de interacción de dos factores activos.
- Todos los efectos cuadráticos son estimables en modelos con solo efectos principales y efectos cuadráticos, lo que permite identificar qué factores específicos exhiben curvatura en su relación con la respuesta.
Los DSD ofrecen estos beneficios en un pequeño número de ejecuciones. Para seis o más factores, estos diseños requieren solo un poco más de ejecuciones que el doble del número de factores. Por ejemplo, con 14 factores continuos, un DSD de tamaño mínimo solo requiere 29 ejecuciones, una pequeña fracción del diseño factorial completo correspondiente (214 = 16,384 ejecuciones). En comparación, un diseño factorial fraccional de resolución IV requiere como mínimo 32 ejecuciones. Al igual que el DSD, evita el aliasing de los efectos principales y las interacciones de dos factores, pero a diferencia del DSD, confunde completamente algunas interacciones de dos factores entre sí y no puede evaluar la curvatura cuadrática en factores individuales, incluso si se agregan puntos centrales. El DSD recopila una cantidad relativamente grande de información mediante un diseño eficiente.
Más allá del cribado, los DSD pueden habilitar directamente la optimización de respuestas mediante la metodología de superficie de respuesta cuando el número de factores activos es pequeño. Un DSD para seis o más factores permite la estimación del modelo cuadrático completo en cualquiera de los tres factores, mientras que los DSD de 18 o más factores pueden ajustar el modelo cuadrático completo en cualquiera de los cuatro factores, y los DSD para 24 o más factores pueden ajustar el modelo cuadrático completo en cualquiera de los cinco factores. Esto significa que si tiene la suerte de contar con pocos factores activos, puede usar el mismo diseño tanto para el cribado como para la optimización de respuestas. De lo contrario, puede aumentar su DSD con ejecuciones adicionales según sea necesario.
¿Cómo se crea un diseño de cribado definitivo?
Los beneficios de los DSD se deben a su estructura especial. Para ilustrar, considere esta tabla de diseño para un DSD con seis factores continuos. Cada uno de los factores está codificado para tener un valor alto de 1, un valor bajo de -1 y un valor medio de 0.
| Ejecutar | X1 | X2 | X3 | X4 | X5 | X6 |
| 1 | 0 | 1 | 1 | 1 | 1 | 1 |
| 2 | 0 | -1 | -1 | -1 | -1 | -1 |
| 3 | 1 | 0 | -1 | 1 | 1 | -1 |
| 4 | -1 | 0 | 1 | -1 | -1 | 1 |
| 5 | 1 | -1 | 0 | -1 | 1 | 1 |
| 6 | -1 | 1 | 0 | 1 | -1 | -1 |
| 7 | 1 | 1 | -1 | 0 | -1 | 1 |
| 8 | -1 | -1 | 1 | 0 | 1 | -1 |
| 9 | 1 | 1 | 1 | -1 | 0 | -1 |
| 10 | -1 | -1 | -1 | 1 | 0 | 1 |
| 11 | 1 | -1 | 1 | 1 | -1 | 0 |
| 12 | -1 | 1 | -1 | -1 | 1 | 0 |
| 13 | 0 | 0 | 0 | 0 | 0 | 0 |
El DSD es un diseño foldover, en el que cada ejecución se empareja con otra ejecución en la que todos los valores de los factores tienen su signo invertido. Por ejemplo, las ejecuciones 1 y 2 forman un par foldover, y la ejecución 2 simplemente invierte los signos de los valores en la ejecución 1. Lo mismo se aplica a las ejecuciones 3 y 4, 5 y 6, y así sucesivamente, siendo la ejecución 13 un punto central medido en el valor medio de todos los factores. El aspecto de foldover del diseño elimina el aliasing de los efectos principales y las interacciones de dos factores.
Tenga en cuenta que dentro de cualquier par de foldover, un factor se mide en su valor medio en ambas ejecuciones, mientras que todos los demás factores se miden en sus valores bajos o altos. Esto coloca puntos a lo largo de los bordes del espacio factorial, no solo en las esquinas o en el centro, como en los diseños de cribado estándar. Este aspecto del diseño permite que todos los efectos cuadráticos sean estimables.
El gráfico del diseño en los tres primeros factores ilustra aún más la estructura de un DSD. Observa que cada punto (excepto el punto central) tiene un punto de foldover correspondiente que está en una ubicación "reflejada" a través del cubo. El diseño también incluye puntos medios en los bordes del espacio factorial, con cada factor medido en su punto medio como un total de tres tiempos al incluir el punto central.
Este diseño de ejemplo representa el número mínimo de corridas para seis factores continuos. En la práctica, se recomienda incluir al menos cuatro ejecuciones adicionales, lo cual se logra introduciendo factores inactivos ficticios en el diseño. Hacerlo aumenta enormemente la capacidad del DSD para detectar interacciones activas de dos factores y curvatura cuadrática.
¿Cómo puede crear su propio DSD? No se preocupe por hacerlo usted mismo; el software estadístico, como JMP, puede encargarse de todo el proceso de diseño por usted.
Un ejemplo de un diseño de cribado definitivo
Digamos que es un ingeniero en una empresa de biotecnología y tiene la tarea de desarrollar un nuevo proceso de extracción con el objetivo de maximizar el rendimiento de la extracción, medido en miligramos. Primero, debe identificar qué factores del proceso afectan más el rendimiento, y comienza probando múltiples solventes, pH y tiempo en solución. Sus factores y rangos son los siguientes:
- Metanol: (0 a 10 mL)
- Etanol: (0 a 10 mL)
- Propanol: (0 a 10 mL)
- Butanol: (0 a 10 mL)
- pH: (6 a 9)
- Tiempo: (1 a 2 horas)
Usted elige utilizar un DSD porque tiene todos los factores continuos, sospecha que pueden estar presentes interacciones de dos factores y curvatura cuadrática, y después del cribado le gustaría ajustar un modelo cuadrático completo en los factores activos sin la necesidad de muchas ejecuciones adicional o ninguna. Decide incluir cuatro ejecuciones adicionales al mínimo de 13 para detectar mejor los efectos de segundo orden. Utiliza el siguiente DSD de 17 ejecuciones y registra los resultados en las columnas de Rendimiento.
| Ejecutar | Metanol | Etanol | Propanol | Butanol | PH | Tiempo | Rendimiento |
| 1 | 0 | 10 | 5 | 0 | 6 | 2 | 23,43 |
| 2 | 0 | 0 | 10 | 10 | 7.5 | 1 | 4,85 |
| 3 | 5 | 10 | 10 | 10 | 9 | 2 | 40,91 |
| 4 | 10 | 10 | 0 | 10 | 6 | 1 | 21,68 |
| 5 | 0 | 0 | 10 | 0 | 9 | 2 | 3,09 |
| 6 | 10 | 0 | 10 | 0 | 6 | 1,5 | 26,09 |
| 7 | 5 | 5 | 5 | 5 | 7.5 | 1,5 | 30,05 |
| 8 | 0 | 0 | 0 | 10 | 6 | 2 | 11.99 |
| 9 | 0 | 10 | 0 | 10 | 9 | 1,5 | 11,54 |
| 10 | 10 | 5 | 10 | 10 | 6 | 2 | 33,46 |
| 11 | 10 | 10 | 0 | 0 | 7.5 | 2 | 47.44 |
| 12 | 10 | 0 | 0 | 5 | 9 | 2 | 23,58 |
| 13 | 5 | 0 | 0 | 0 | 6 | 1 | 22.26 |
| 14 | 10 | 0 | 5 | 10 | 9 | 1 | 27,07 |
| 15 | 0 | 10 | 10 | 5 | 6 | 1 | 3.35 |
| 16 | 0 | 5 | 0 | 0 | 9 | 1 | 3.18 |
| 17 | 10 | 10 | 10 | 0 | 9 | 1 | 21,67 |
Visualizar el efecto principal de cada factor muestra que el Metanol y el Tiempo tienen fuertes efectos positivos sobre el Rendimiento, mientras que el Etanol también tiene un efecto positivo menor. Las líneas de Propanol, Butanol y pH parecen sin cambios, lo que sugiere efectos principales insignificantes para estos factores. Un modelo de regresión múltiple de solo efectos principales confirma que los efectos principales de Metanol, Etanol y Tiempo están activos, y debido a que utilizó un DSD, sabe que las estimaciones de los efectos principales no están sesgadas por ninguna de las interacciones de dos factores activos que aún no ha investigado. Elige moverse hacia delante con Metanol, Etanol y Tiempo como sus factores activos.
Debido a que utilizó un DSD de seis factores e identificó solo tres factores activos, puede ajustar un modelo cuadrático completo sin agregar más ejecuciones al diseño. Utiliza la regresión múltiple con un método de selección de variables para llegar a un modelo final que se utilizará para la optimización. Ese modelo revela que el efecto de Metanol exhibe curvatura cuadrática y que Etanol y Tiempo exhiben una interacción de dos factores: Etanol ejerce un efecto insignificante cuando el Tiempo es bajo, pero un efecto fuerte cuando el Tiempo es alto.
Usando el modelo final, identifica la siguiente configuración de factores óptimos, que se predice producirán un Rendimiento medio de 45.34 mg.
- Metanol = 8,13 mL
- Etanol = 10 mL
- Tiempo = 2 horas