Diseños de cribado

¿Qué son los diseños de cribado?

Los diseños de cribado son un tipo de experimento diseñado que a menudo se lleva a cabo como un paso inicial en la identificación de los factores más influyentes entre muchas variables potenciales que afectan un proceso o resultado. Son un método eficiente y riguroso para determinar sistemáticamente qué factores deben incluirse en experimentos posteriores, utilizando un número relativamente pequeño de ejecuciones experimentales. El cribado consiste en separar "los pocos vitales de los muchos triviales".

¿Cuándo se deben usar diseños de cribado?

Los diseños de cribado pueden ser útiles cuando cualquiera de los siguientes es verdadero:

Es posible que no necesite evaluar factores en todas las situaciones. Por ejemplo, los métodos de cribado podrían no ser necesarios en situaciones en las que tenga un número de factores reducido, o pueda permitirse todas las ejecuciones de diseño necesarias para ajustar el modelo más complejo que pueda imaginar.

¿Por qué y cómo utilizar diseños de cribado?

El proceso de experimentación generalmente implica una secuencia de experimentos. A menudo, en las etapas iniciales de la experimentación, puede pensar en muchos factores que podrían influir en su proceso. La primera tarea es reducir la larga lista de efectos potencialmente importantes (efectos principales y, en algunos casos, interacciones) a unos pocos, los más importantes. Cuando se consideran muchos factores, los diseños factoriales completos pueden ser demasiado lentos o costosos de llevar a cabo. Los diseños factoriales completos también pueden ser ineficientes, ya que generalmente no se está interesado en ajustar un modelo con interacciones de tres o más factores (o como mínimo no todas). Sin embargo, los diseños de cribado pueden ayudar a identificar los efectos mayores en menos ejecuciones.

La efectividad de los diseños de cribado y los métodos de análisis depende de cuatro principios clave. Aunque estos principios no se mantienen en todas las situaciones, se ha encontrado que son lo suficientemente comunes en la práctica como para ser bastante útiles.

Escasez

El principio de escasez de efectos dice que aunque se pueden tener muchos factores candidatos con muchos más efectos potenciales, solo una pequeña porción de ellos será realmente importante para todas las respuestas.

Dos conjuntos de círculos que representan factores en nuestro diseño: a la izquierda, nueve factores candidatos etiquetados X1–X9; a la derecha, los factores importantes resaltados en naranja: X1, X3 y X8.

Jerarquía

El principio de jerarquía indica que la probabilidad de que un efecto sea importante disminuye conforme aumenta el orden del término del modelo. En otras palabras, un término del modelo de orden superior, como una interacción de tres factores, tiene muchas menos probabilidades de ser importante que un término del modelo de orden inferior, como una interacción de dos factores, y una interacción de dos factores tiene menos probabilidades de ser importante que un efecto principal.

Un diagrama que muestra la importancia relativa de diferentes efectos. A la izquierda, círculos grandes con etiquetas

Herencia

El principio de herencia dice que la presencia de términos de orden superior generalmente está asociada con la presencia de efectos de orden inferior de los mismos factores. Entonces, por ejemplo, si la interacción de X1 y X3 es importante, entonces es más probable que el efecto principal de X1 o X3 también sea importante.

Gráfico que compara efectos importantes en un modelo. A la izquierda hay dos círculos.

Proyección

La propiedad de proyección se refiere a qué tan bien un diseño conserva las propiedades estadísticas deseables (como la estimabilidad de los efectos y la independencia de las estimaciones) cuando se eliminan los efectos no importantes del modelo y el diseño se "proyecta" en un diseño de menor dimensión con menos factores (los efectos importantes). Un diseño con buenas propiedades de proyección producirá resultados confiables cuando se realice el análisis de este subconjunto de factores.

El primer paso para planificar un experimento de cribado es identificar todos los factores asociados a su proceso. Los resultados incluirán sus factores de interés (los factores que puede modificar durante el experimento y que espera que influyan en la respuesta) así como cualquier factor que pueda introducir variabilidad aleatoria, o ruido, en el proceso. Idealmente, puede controlar estos factores de ruido durante el experimento o tener en cuenta sus efectos en su modelo estadístico. También hay que considerar la posibilidad de efectos de orden superior, como las interacciones.

En la práctica, sin embargo, es posible que no pueda incluir todos los factores potenciales y sus interacciones en su experimento. Las decisiones de diseño dependerán de varias consideraciones, incluidas:

En algunos casos, es posible que necesite realizar más de un experimento para identificar los efectos importantes. Por ejemplo, tal vez el experimento inicial no le permitió estimar interacciones de dos factores, por lo que debe realizar experimentos adicionales para probarlas.

Hay muchos métodos que puede utilizar para diseñar un experimento de cribado. Los diseños “clásicos”, como los diseños factoriales fraccionales y los diseños de Plackett-Burman, se desarrollaron a principios del sigloXX y, aunque son ampliamente conocidos, tienen limitaciones Los métodos modernos, como los diseños personalizados y los diseños de cribado definitivos, usan un enfoque algorítmico y brindan numerosas ventajas. Independientemente del método que utilice, los diseños de cribado son un primer paso para determinar cómo mejorar u optimizar un proceso.

Diseños de cribado: un ejemplo

Supongamos que está desarrollando un proceso de fabricación donde las respuestas de interés son Rendimiento e Impureza. Se le ha encargado la tarea de encontrar la configuración en su proceso que maximice el Rendimiento y minimice la Impureza. Primero, debe comprender qué influye en las respuestas y de qué manera.

Usted y su equipo identifican nueve factores que creen que podrían ser importantes para afectar el Rendimiento y la Impureza. Siete de los factores son continuos y dos son categóricos. Con base en la experiencia previa, usted y su equipo eligen rangos de factores y niveles que deberían, si el factor es verdaderamente importante, producir un cambio lo suficientemente grande en las respuestas para ser detectado por su experimento.

Los factores y sus rangos o niveles son:

No espera que los nueve factores sean importantes (principio de dispersión de los efectos), pero, en este punto, no sabe cuáles serán. Sospecha que podría haber al menos una interacción de dos factores y posiblemente efectos cuadráticos, pero espera que sean menos importantes que los efectos principales (principio de jerarquía). También asume que todas las interacciones presentes implicarán los efectos principales importantes que identifique en su experimento (principio de herencia). Por último, sabe que si puede quitar los efectos no importantes de su modelo, podría estimar los efectos de interacción que involucran los efectos principales importantes, incluso si el diseño original no permitía su estimación (propiedades de proyección).

Existen muchas estrategias de cribado posibles: experimentos pequeños que permiten estimar soloefectos principales; experimentos de tamaño mediano que permiten estimar efectos principales y algunas interacciones de dos factores; o grandes experimentos que permiten estimar efectos principales y todas las interacciones de dos factores posibles. La estrategia que utilice se basa en gran medida en las consideraciones descritas anteriormente. (Los efectos cuadráticos suelen probarse en experimentos de optimización una vez que se han identificado los factores importantes).

Para este ejemplo, suponga que tiene un presupuesto bastante pequeño para su experimento de cribado, por lo que decide comenzar con un diseño de solo efectos principales para cribar factores importantes. Si bien se da cuenta de que esta podría ser una estrategia arriesgada, particularmente si hay interacciones presentes que son más fuertes que los efectos principales, se siente cómodo confiando en los principios de cribado y ha presupuestado experimentos adicionales si necesita aclarar los resultados de este.

Con la estrategia y la planificación listas, diseña un experimento con 22 ejecuciones. Cuatro de estas son puntos centrales: ejecuciones donde todos los factores continuos están en sus niveles medios.

Gráfico que muestra el punto central

Hay varios motivos para considerar la inclusión de puntos centrales en un diseño. Los puntos centrales pueden proporcionar replicación en un diseño que de otro modo no se replicaría, permitiendo estimar el error puro y obtener pruebas estadísticas para los términos de su modelo. Podría optar por distribuir las ejecuciones de puntos centrales a lo largo del diseño para monitorear si ocurren cambios inesperados en su proceso durante el experimento; espera que las respuestas de esas ejecuciones sean similares entre sí porque son replicaciones.

En el contexto de los diseños de cribado, los puntos centrales pueden utilizarse para detectar la presencia de curvatura en la respuesta a través de una prueba de falta de ajuste. Una prueba de falta de ajuste estadísticamente significativa indica que al modelo le pueden faltar uno o más términos cuadráticos. Debido a que el experimento no fue diseñado para permitir la estimación de términos cuadráticos, solo su detección, una prueba de ajuste significativo, sugiere la necesidad de experimentación adicional para entender la curvatura en la respuesta.

Usted ejecuta el experimento y registra las respuestas, Rendimiento e Impureza, que se muestran en la tabla a continuación.

Usa la regresión lineal múltiple para ajustar un modelo para cada respuesta. Los factores se muestran en orden de importancia (con base en una medida llamada Log utilidad) para cada respuesta en el gráfico siguiente.

Con base en su experimento de cribado, usted determina que para Rendimiento, los efectos mayores son Temperatura y pH. Los efectos más grandes para la Impureza son la Temperatura, el pH y el Proveedor.

Con base en estos resultados, sus próximos pasos podrían incluir reducir el modelo (eliminar términos no importantes), ajustar un nuevo modelo con los términos importantes y sus interacciones (si es posible), y examinar la prueba de falta de ajuste para ver si hay alguna evidencia de curvatura en cualquiera de las respuestas. Estos resultados pueden guiar sus decisiones acerca de experimentos subsecuentes mientras intenta entender y eventualmente optimizar su proceso.