Diseños de cribado definitivo
¿Qué son los diseños de cribado definitivos?
Un diseño de cribado definitivo (DSD, por sus siglas en inglés) es un diseño experimental especializado que permite identificar cuál de entre varios factores continuos influye de manera más significativa en una respuesta. Los DSD requieren un número reducido de ejecuciones, al tiempo que ofrecen ventajas con respecto a los diseños de cribado estándar de un tamaño de ejecución similar. Reducen la ambigüedad a la hora de identificar los efectos activos, permiten detectar la curvatura en los efectos de factores individuales y facilitan la estimación de modelos cuadráticos completos en un pequeño subconjunto de factores.
¿Por qué debería utilizar un diseño de cribado definitivo?
Los diseños de cribado definitivos ofrecen numerosas ventajas con respecto a los diseños de cribado estándar, como los diseños factoriales fraccionarios o los diseños Plackett-Burman. Estos diseños estándar pueden asociar algunos efectos principales e interacciones de dos factores, así como generar confusión entre las interacciones de dos factores, lo que genera ambigüedad a la hora de identificar los efectos activos. Además, aunque los diseños de cribado estándar con puntos centrales pueden identificar la presencia de curvatura en uno o más factores, no pueden determinar qué factores son la fuente de la curvatura sin requerir ejecuciones adicionales. En comparación, los DSD ofrecen varias ventajas:
- Los efectos principales son ortogonales a las interacciones de dos factores, lo que significa que sus estimaciones no están sesgadas cuando las interacciones de dos factores están activas.
- No hay dos interacciones de dos factores que se confundan completamente entre sí, lo que reduce la ambigüedad a la hora de identificar los efectos activos de las interacciones de dos factores.
- La estimabilidad de los efectos cuadráticos es alta en modelos que incluyan únicamente efectos principales y efectos cuadráticos, lo que le permite identificar qué factores específicos presentan una relación no lineal con la respuesta.
Los DSD ofrecen estas ventajas en un número reducido de ejecuciones. Cuando hay seis o más factores, estos diseños solo requieren un número de ejecuciones ligeramente superior al doble del número de factores. Por ejemplo, con 14 factores continuos, un diseño DSD de tamaño mínimo requiere solo 29 ejecuciones, lo que supone una pequeña fracción del diseño factorial completo correspondiente (214 = 16,384 ejecuciones). En comparación, un diseño factorial fraccional de resolución IV requiere al menos 32 ejecuciones. Al igual que el DSD, evita el aliasing de los efectos principales y las interacciones de dos factores, pero, a diferencia del DSD, genera confusión por completo en algunas interacciones de dos factores entre sí y no permite evaluar la curvatura cuadrática en los factores individuales, incluso si se agregan puntos centrales. El DSD recopila una cantidad relativamente grande de información gracias a su diseño eficiente.
Más allá del cribado, los DSD pueden permitir directamente la optimización de la respuesta mediante la metodología de superficie de respuesta cuando el número de factores activos es reducido. Un DSD de seis o más factores permite estimar el modelo cuadrático completo en tres de los factores cualesquiera, mientras que los DSD de 18 o más factores pueden ajustar el modelo cuadrático completo en cuatro factores cualesquiera, y los DSD de 24 o más factores pueden ajustar el modelo cuadrático completo en cinco factores cualesquiera. Esto significa que, si tiene la suerte de contar con pocos factores activos, puede utilizar el mismo diseño tanto para la selección como para la optimización de la respuesta. De lo contrario, puede aumentar su DSD con ejecuciones adicionales según sea necesario.
¿Cómo se crea un diseño de cribado definitivo?
Las ventajas de los DSD se deben a su estructura especial. A modo de ejemplo, considere esta tabla de diseño para un DSD con seis factores continuos. Cada factor se codifica de manera que el valor elevado sea 1, el valor bajo sea -1 y el valor intermedio sea 0.
| ejecutar | X1 | X2 | X3 | X4 | X5 | X6 |
| 1 | 0 | 1 | 1 | 1 | 1 | 1 |
| 2 | 0 | -1 | -1 | -1 | -1 | -1 |
| 3 | 1 | 0 | -1 | 1 | 1 | -1 |
| 4 | -1 | 0 | 1 | -1 | -1 | 1 |
| 5 | 1 | -1 | 0 | -1 | 1 | 1 |
| 6 | -1 | 1 | 0 | 1 | -1 | -1 |
| 7 | 1 | 1 | -1 | 0 | -1 | 1 |
| 8 | -1 | -1 | 1 | 0 | 1 | -1 |
| 9 | 1 | 1 | 1 | -1 | 0 | -1 |
| 10 | -1 | -1 | -1 | 1 | 0 | 1 |
| 11 | 1 | -1 | 1 | 1 | -1 | 0 |
| 12 | -1 | 1 | -1 | -1 | 1 | 0 |
| 13 | 0 | 0 | 0 | 0 | 0 | 0 |
El DSD es un diseño plegado, en el que cada ejecución se empareja con otra en la que se invierte el signo de los valores de todos los factores. Por ejemplo, las ejecuciones 1 y 2 forman un par plegado: la ejecución 2 se limita a invertir el signo de los valores de la ejecución 1. Lo mismo se aplica a las ejecuciones 3 y 4, 5 y 6, y así sucesivamente; la ejecución 13 es un punto central medido en el valor intermedio de todos los factores. El aspecto de plegado del diseño elimina el aliasing de los efectos principales y las interacciones de dos factores.
Tenga en cuenta que, dentro de cada par de valores opuestos, un factor se mide en su valor intermedio en ambas series, mientras que todos los demás factores se miden en sus valores bajos o elevados. Esto permite ubicar puntos a lo largo de los bordes del espacio factorial, y no solo en las esquinas o en el centro, como ocurre en los diseños de cribado estándar. Este aspecto del diseño garantiza la estimabilidad de todos los efectos cuadráticos.
La representación gráfica del diseño en los tres primeros factores ilustra aún más la estructura de un DSD. Observe que cada punto (excepto el punto central) tiene un punto plegado correspondiente que se encuentra en una posición “simétrica” al otro lado del cubo. El diseño también incluye puntos medios en los extremos del espacio factorial, de modo que cada factor se mide en su punto medio un total de tres veces, incluyendo el punto central.
Este diseño de ejemplo representa el número mínimo de ejecuciones para seis factores continuos. En la práctica, se recomienda incluir al menos cuatro ejecuciones adicionales, lo cual se logra introduciendo factores ficticios inactivos en el diseño. De este modo, se incrementa considerablemente la capacidad del DSD para detectar interacciones activas de dos factores y curvatura cuadrática.
Entonces, ¿cómo puede crear su propio DSD? No se preocupe por hacerlo usted mismo; el software estadístico, como JMP, puede encargarse de todo el proceso de diseño.
Un ejemplo de un diseño de cribado definitivo
Supongamos que usted es ingeniero en una empresa de biotecnología y que tiene la tarea de desarrollar un nuevo proceso de extracción con el objetivo de maximizar el rendimiento de la misma, medido en miligramos. En primer lugar, debe identificar qué factores del proceso influyen más en el rendimiento, y debe comenzar probando diferentes disolventes, valores de ph y tiempos de permanencia en solución. Los factores y rangos son:
- Metanol: (0 a 10 mL)
- Etanol: (0 a 10 mL)
- Propanol: (0 a 10 mL)
- Butanol: (0 a 10 mL)
- pH: (6 a 9)
- Tiempo: (1 o 2 horas)
Usted opta por utilizar un DSD porque todos sus factores son continuos, sospecha que pueden existir interacciones de dos factores y curvatura cuadrática, y, tras la selección inicial, desea ajustar un modelo cuadrático completo en los factores activos sin necesidad de realizar muchas (o ninguna) ejecuciones adicionales. Decide incluir cuatro ejecuciones adicionales al mínimo de 13 para detectar mejor los efectos de segundo orden. Usa el siguiente DSD de 17 ejecuciones y anota los resultados en la columna Rendimiento.
| ejecutar | Metanol | Etanol | Propanol | Butanol | ph | tiempo | Rendimiento |
| 1 | 0 | 10 | 5 | 0 | 6 | 2 | 23.43 |
| 2 | 0 | 0 | 10 | 10 | 7.5 | 1 | 4.85 |
| 3 | 5 | 10 | 10 | 10 | 9 | 2 | 40.91 |
| 4 | 10 | 10 | 0 | 10 | 6 | 1 | 21.68 |
| 5 | 0 | 0 | 10 | 0 | 9 | 2 | 3.09 |
| 6 | 10 | 0 | 10 | 0 | 6 | 1,5 | 26.09 |
| 7 | 5 | 5 | 5 | 5 | 7.5 | 1,5 | 30.05 |
| 8 | 0 | 0 | 0 | 10 | 6 | 2 | 11.99 |
| 9 | 0 | 10 | 0 | 10 | 9 | 1,5 | 11.54 |
| 10 | 10 | 5 | 10 | 10 | 6 | 2 | 33.46 |
| 11 | 10 | 10 | 0 | 0 | 7.5 | 2 | 47.44 |
| 12 | 10 | 0 | 0 | 5 | 9 | 2 | 23.58 |
| 13 | 5 | 0 | 0 | 0 | 6 | 1 | 22.26 |
| 14 | 10 | 0 | 5 | 10 | 9 | 1 | 27.07 |
| 15 | 0 | 10 | 10 | 5 | 6 | 1 | 3.35 |
| 16 | 0 | 5 | 0 | 0 | 9 | 1 | 3.18 |
| 17 | 10 | 10 | 10 | 0 | 9 | 1 | 21.67 |
Al visualizar el efecto principal de cada factor, se observa que el metanol y el tiempo ejercen fuertes efectos positivos sobre el rendimiento, mientras que el etanol ejerce también un efecto positivo menor. Las líneas correspondientes al propanol, el butanol y el pH se observan planas, lo que sugiere que los efectos principales de estos factores son insignificantes. Un modelo de regresión múltiple que incluye únicamente los efectos principales confirma que los efectos principales de metanol, etanol y tiempo son activos; y, dado que utilizó un DSD, sabe que las estimaciones de los efectos principales no están sesgadas por ninguna interacción significativa entre dos factores que aún no haya investigado. Decide seguir adelante con el metanol, el etanol y el tiempo como factores activos.
Como utilizó un DSD de seis factores e identificó solo tres factores activos, puede ajustar un modelo cuadrático completo sin agregar más ejecuciones al diseño. Se utiliza la regresión múltiple junto con un método de selección de variables para obtener un modelo final que se empleará en la optimización. Ese modelo revela que el efecto del metanol exhibe una curvatura cuadrática y que el etanol y el tiempo exhiben una interacción de dos factores: el etanol ejerce un efecto insignificante cuando el tiempo es bajo, pero un fuerte efecto positivo cuando el tiempo es alto.
Utilizando el modelo final, se identifican los siguientes ajustes óptimos de los factores, que, según las previsiones, producirán un rendimiento medio de 45.34 mg.
- Metanol = 8.13 mL
- Etanol = 10 mL
- Tiempo = 2 horas