Diseños de cribado

¿Qué son los diseños de cribado?

Los diseños de cribado son un tipo de experimento planificado que suele llevarse a cabo como primer paso para identificar los factores más influyentes entre las numerosas variables potenciales que afectan a un proceso o resultado. Son una forma eficaz y rigurosa de determinar de manera sistemática qué factores deben incluirse en los experimentos posteriores, utilizando un número relativamente reducido de ejecuciones experimentales. El cribado consiste en separar “lo esencial de lo trivial”.

¿Cuándo se deben emplear diseños de cribado?

Los diseños de cribado pueden ser útiles cuando se cumpla cualquiera de las siguientes condiciones:

Quizás no sea necesario cribar los factores en todas las situaciones. Por ejemplo, puede que no sea necesario recurrir a métodos de cribado en situaciones en las que el número de factores sea reducido, o cuando se disponga de los recursos necesarios para realizar todas las pruebas de diseño requeridas para ajustar el modelo más complejo que se pueda imaginar.

¿Por qué y cómo se usa el diseño de cribado?

El proceso de experimentación suele implicar una secuencia de experimentos. A menudo, en las primeras etapas de la experimentación, puede pensar en muchos factores que podrían influir en el proceso. La primera tarea consiste en reducir la larga lista de efectos potencialmente importantes (efectos principales y, en algunos casos, efectos de interacción) a los pocos más importantes. Cuando se consideran muchos factores, los diseños factoriales completos pueden ser demasiado lentos o costosos de realizar. Los diseños factoriales completos también pueden ser un desperdicio, ya que generalmente no le interesa ajustar un modelo con interacciones de tres factores o mayores (¡o al menos no todas!). Los diseños de cribado, sin embargo, pueden ayudarle a identificar los efectos mayores en menos ejecuciones.

La efectividad de los diseños de cribado y de los métodos de análisis depende de cuatro principios clave. Aunque estos principios no se cumplen en todas las situaciones, se ha comprobado que son lo suficientemente comunes en la práctica como para ser bastante útiles.

Dispersión

El principio de la dispersión de efectos establece que, si bien puede haber muchos factores candidatos con muchos más efectos potenciales, solo una pequeña porción de ellos resultará realmente importante para una respuesta concreta.

Dos conjuntos de círculos que representan factores en nuestro diseño: a la izquierda, nueve factores candidatos etiquetados como: X1–X9; a la derecha, los factores importantes resaltados en naranja: X1, X3 y X8

jerarquía

El principio de jerarquía dice que la verosimilitud de que un efecto sea importante disminuye a medida que aumenta el orden del término del modelo. En otras palabras, es mucho menos probable que un término del modelo de orden superior, como una interacción de tres factores, sea importante que un término del modelo de orden inferior, como una interacción de dos factores, y es menos probable que una interacción de dos factores sea importante que un efecto principal.

Un diagrama que ilustra la importancia relativa de los diferentes efectos. A la izquierda, grandes círculos etiquetados

Herencia

El principio de la herencia dice que la presencia de términos de orden superior suele estar asociada con la presencia de efectos de orden inferior de los mismos factores. Así, por ejemplo, si la interacción de X1 y X3 es importante, lo más probable es que el efecto principal de X1 o X3 también lo sea.

Gráfico que compara los efectos importantes de un modelo. A la izquierda hay dos círculos

Proyección

La propiedad de proyección se refiere a qué tan bien un diseño retiene propiedades estadísticas deseables (como la estimabilidad de los efectos y la independencia de las estimaciones) cuando los efectos no importantes se eliminan del modelo, y el diseño se “proyecta” en un diseño de menor dimensión con menos factores (los efectos importantes). Un diseño con buenas propiedades de proyección producirá resultados confiables al analizar este subconjunto de factores.

El primer paso para planificar un experimento de cribado es identificar todos los factores asociados con el proceso. Los resultados incluirán los factores de interés (los factores que puede modificar durante el experimento y que espera que afecten a la respuesta), así como cualquier factor que pueda introducir variabilidad aleatoria, o ruido, en el proceso. Idealmente, se pueden controlar estos factores de ruido durante el experimento o tener en cuenta sus efectos en el modelo estadístico. También se debe considerar la posibilidad de efectos de orden superior, como interacciones.

Sin embargo, en la práctica, es posible que no pueda incluir todos los factores potenciales y sus interacciones en su experimento. Las decisiones de diseño dependerán de varias consideraciones, entre ellas las siguientes:

En algunos casos, es posible que necesite realizar más de un experimento para identificar los efectos importantes. Por ejemplo, es posible que el experimento inicial no le haya permitido estimar las interacciones de dos factores, por lo que debe realizar experimentos adicionales para comprobarlas.

Existen muchos métodos que puede usar para diseñar un experimento de cribado. Los diseños “clásicos”, como los diseños factoriales fraccionales y los diseños de Plackett-Burman, se desarrollaron a principios del siglo XX, y aunque son ampliamente conocidos, tienen limitaciones. Los métodos modernos, como los diseños personalizados y los diseños definitivos de cribado, emplean un enfoque algorítmico y ofrecen muchas ventajas. Independientemente del método que utilice, el diseño de cribado es un primer paso para determinar cómo mejorar u optimizar un proceso.

Diseños de cribado: un ejemplo

Supongamos que está desarrollando un proceso de fabricación en el que las variables de interés son el rendimiento y las impurezas. Se le ha encomendado la tarea de encontrar los ajustes en su proceso que maximicen el rendimiento y minimicen las impurezas. Primero, necesita entender qué afecta a las respuestas y de qué manera.

Usted y su equipo han identificado nueve factores que, en su opinión, podrían influir de manera significativa en el rendimiento y las impurezas. Siete de los factores son continuos y dos son categóricos. Basándose en la experiencia previa, usted y su equipo eligen rangos y niveles de factores que, si el factor es realmente importante, deberían producir un cambio lo suficientemente grande en la respuesta como para que pueda detectarse en su experimento.

Los factores y sus rangos o niveles son:

No se espera que los nueve factores sean importantes (principio de la dispersión del efecto), pero, en este momento, no se sabe cuáles lo serán. Sospecha que podría haber al menos una interacción de dos factores y, posiblemente, efectos cuadráticos, pero espera que estos sean menos importantes que los efectos principales (principio de jerarquía). También asume que cualquier interacción que se produzca implicará los efectos principales importantes que identifica en su experimento (principio de herencia). Por último, usted sabe que, si logra eliminar los efectos no importantes de su modelo, es posible que pueda estimar los efectos de interacción que involucran a los efectos principales importantes, incluso si el diseño original no permitía su estimación (propiedad de proyección).

Existen muchas estrategias de cribado posibles: experimentos de pequeño tamaño que permiten únicamente los efectos principales; experimentos de tamaño mediano que permiten estimar los efectos principales y algunas interacciones de dos factores; o experimentos de gran tamaño que permiten estimar los efectos principales y todas las posibles interacciones de dos factores. La estrategia que se utilice dependerá en gran medida de las consideraciones descritas anteriormente. (Los efectos cuadráticos se suelen probar en experimentos de optimización una vez que se han identificado los factores importantes).

Para este ejemplo, supongamos que dispone de un presupuesto bastante reducido para su experimento de cribado, por lo que decide comenzar con un diseño que incluya únicamente los efectos principales para identificar los factores importantes. Aunque se da cuenta de que esta podría ser una estrategia arriesgada, sobre todo si existen efectos de interacción más fuertes que los efectos principales, se siente cómodo confiando en los principios de selección y ha previsto en el presupuesto la realización de experimentos adicionales en caso de que sea necesario aclarar los resultados de este.

Con la estrategia y la planificación completadas, diseña un experimento con 22 ejecuciones. Cuatro de ellos son puntos centrales: ejecuciones en los que todos los factores continuos se encuentran en sus niveles medios.

Gráfico que muestra el punto central

Hay varios motivos para considerar incluir puntos centrales en un diseño. Los puntos centrales pueden proporcionar replicación en un diseño que de otro modo no estaría replicado, lo que permite estimar el error puro y obtener pruebas estadísticas para los términos del modelo. Podría optar por distribuir series de puntos centrales a lo largo del diseño para supervisar si se producen cambios inesperados en su proceso durante el experimento; se espera que las respuestas de esas ejecuciones sean similares entre sí, ya que se trata de réplicas.

En el contexto de los diseños de cribado, los puntos centrales se pueden usar para detectar la presencia de curvatura en la respuesta mediante una prueba de falta de ajuste. Una prueba de falta de ajuste estadísticamente significativa indica que al modelo le pueden faltar uno o más términos cuadráticos. Dado que el experimento no fue diseñado para permitir la estimación de términos cuadráticos (solo su detección), una significativa falta de prueba de ajuste sugiere la necesidad de experimentos adicionales para entender la curvatura en la respuesta.

Ejecute el experimento y registre las respuestas, rendimiento e impurezas, que se muestran en la siguiente tabla.

Se utiliza la regresión lineal múltiple para ajustar un modelo para cada respuesta. Los factores se muestran por orden de importancia (basándose en una medida llamada log utilidad) para cada respuesta en el gráfico siguiente.

A partir de su experimento de cribado, usted determina que, en lo que respecta al rendimiento, los factores que más influyen son la temperatura y el pH. Los factores que más influyen en las impurezas son la temperatura, el pH y el proveedor.

Basándose en estos resultados, los siguientes pasos podrían consistir en reducir el modelo (eliminando los términos no relevantes), ajustar un nuevo modelo con los términos relevantes y sus interacciones (si es posible) y examinar la prueba de falta de ajuste para comprobar si hay indicios de curvatura en alguna de las respuestas. Estos resultados pueden servirle de guía a la hora de tomar decisiones sobre experimentos posteriores, a medida que intenta comprender y, en última instancia, llevar a cabo la optimización de su proceso.