Diseño algorítmico de superficies de respuesta

Style

section-padding-none

¿En qué consiste el diseño algorítmico para la metodología de superficies de respuesta (RSM)?

Un enfoque de diseño algorítmico para la metodología de superficies de respuesta (RSM, por sus siglas en inglés) utiliza diseños i-óptimos, cuyas propiedades estadísticas son similares a las de los diseños clásicos empleados en la metodología de superficies de respuesta para la optimización de la respuesta, tales como los diseños centrales compuestos (CCD) y los diseños Box-Behnken. Los diseños algorítmicos buscan maximizar uno de varios criterios de optimalidad, entre ellos la i-optimalidad. La i-optimalidad aborda la minimización de la varianza de predicción y se utiliza para modelos de segundo orden (efectos principales más cuadráticos e interacciones bidireccionales), donde las predicciones precisas tienen prioridad para la optimización de su respuesta.

¿Cuándo debería utilizar el diseño algorítmico para la RSM?

Los diseños algorítmicos para la RSM se pueden utilizar cuando el objetivo es la optimización. Son especialmente útiles cuando se necesita una flexibilidad en el diseño que va más allá de lo que ofrecen los diseños clásicos. Por ejemplo, el uso de diseños algorítmicos para la RSM sería efectivo cuando se tienen múltiples tipos de factores o restricciones en el espacio de diseño.

El diseño algorítmico para la RSM puede incluir:

Tipos de factores categóricos.
Combinaciones de factores inviables.
Bloqueo.
Modelos no estándar.
Aleatorización restringida.
Un presupuesto de ejecución personalizado.

Introducción al diseño algorítmico para la RSM

Un enfoque de diseño algorítmico para la RSM asocia el diseño a su problema en lugar de ajustar su problema a un diseño predeterminado. El software DOE, como JMP, utiliza un algoritmo para crear un diseño RSM que cumpla con sus especificaciones de diseño mediante la maximización de uno de varios criterios de optimalidad. El criterio de optimalidad utilizado para la RSM es la i-optimalidad, debido a su enfoque en predicciones precisas.

Veamos dos situaciones habituales en las que los diseños basados en algoritmos pueden aportar flexibilidad a la RSM. Hay muchas situaciones en las que un factor categórico también resulta de interés en un diseño de la RSM. Por ejemplo, supongamos que queremos comprender cómo influyen tres proveedores en nuestra variable de interés, además de tres factores continuos. Tradicionalmente, ejecutaríamos un diseño separado de RSM para cada proveedor, ya que en el diseño RSM clásico no se podía incluir un factor categórico. Para tres factores continuos, podríamos aplicar un diseño Box-Behnken de 15 ejecuciones. Un diseño Box-Behnken de 15 ejecuciones para cada uno de los tres proveedores suma un total de 45 ejecuciones, lo que supera rápidamente nuestro presupuesto de ejecuciones. Sin embargo, con los diseños algorítmicos, podríamos incluir el proveedor como factor adicional a los tres factores continuos y ejecutar un diseño para comprender el impacto en la respuesta en 24 ejecuciones. Las 24 ejecuciones se basan en métodos heurísticos para crear un diseño equilibrado de los términos del modelo de segundo orden propuesto, con algunas ejecuciones adicionales para estimar un término de error.

Otra situación en la que los diseños algorítmicos para la RSM pueden ofrecer flexibilidad es cuando existen combinaciones prácticas de niveles de factores que sabemos de antemano que son inviables por motivos tales como la seguridad. Por ejemplo, consideremos un ejemplo de optimización de un nuevo proceso de horneado de pizzas. Hay condiciones que sabemos que no darían como resultado una pizza aceptable. Si horneamos una pizza a alta temperatura y durante mucho tiempo, el resultado será una pizza quemada. Del mismo modo, hornear una pizza a baja temperatura durante poco tiempo dará como resultado una pizza poco cocida. En este ejemplo, la región de diseño tiene una forma irregular y presenta restricciones.

Los diseños algorítmicos para la RSM nos brindan la flexibilidad necesaria para hacer frente a estos retos de diseño, así como a otros casos, tales como el bloqueo y un presupuesto de ejecución personalizado. Los diseños algorítmicos pueden generar diseños clásicos utilizados en la RSM cuando resultan óptimos para las especificaciones del diseño.

Un ejemplo de diseño algorítmico para la RSM

Analicemos con más detalle el diseño presentado en la visión general del diseño de la RSM. El objetivo del experimento es mejorar un proceso mediante la determinación de las condiciones de funcionamiento que producen el mayor rendimiento y el menor nivel de impurezas. El objetivo de maximizar el rendimiento es tan importante como minimizar las impurezas. Para crear un diseño algorítmico, primero seleccionamos las respuestas y los factores.

Las respuestas y los factores son:

Rendimiento: el objetivo de respuesta es maximizarlo (cuanto más alto, mejor).
Impurezas: el objetivo de la respuesta es minimizarlas (cuanto más bajas, mejor).
pH: el rango del factor es de 5 a 8.
Temperatura: el rango del factor es de 15° a 45° centígrados.
Vendedor: hay tres vendedores (niveles de factores): bueno, rápido y barato.

Las decisiones operativas sobre qué valores de los factores de pH y temperatura utilizar, junto con qué proveedor se toman en función de cómo estos factores influirán en el rendimiento y las impurezas. El conocimiento de la materia también es importante para definir rangos de factores más reducidos. Es fundamental que los parámetros rendimiento e impurezas contengan el menor margen de error posible para poder tomar decisiones operativas precisas. El criterio de optimalidad i-óptima es ideal porque minimiza la varianza de predicción.

A continuación, debemos proponer un modelo estadístico inicial. El modelo estadístico propuesto está directamente relacionado con el objetivo de optimización de este experimento. Queremos proponer un modelo de segundo orden que incluya términos cuadráticos y de interacción, que ofrezcan flexibilidad para predecir y optimizar el rendimiento y las impurezas. Los términos cuadráticos correspondientes a los factores continuos nos permiten determinar si existe un pico o un valle en el rendimiento o en las impurezas entre los niveles alto y bajo de pH y temperatura. Los efectos cuadráticos no se pueden estimar para los factores categóricos. Cuando se especifican efectos cuadráticos en el modelo estadístico inicial propuesto, se añade un tercer nivel, el punto medio, al diseño para el pH y la temperatura. En el diseño, se realizarán pruebas de pH en los valores 5, 6.5 y 8, mientras que la temperatura se evaluará a 15 °C, 30 °C y 45 °C.

Los términos del modelo incluidos en el modelo estadístico inicial se indican en la siguiente figura.

Se genera un diseño i-óptimo a partir de los términos del modelo que incluimos. Si tomáramos otras decisiones, como por ejemplo restricciones en la región de diseño, estas influirían en el diseño generado. En este ejemplo, no contábamos con restricciones ni otras elecciones que pudieran influir en el diseño. El diseño consiste en el número de ejecuciones necesarias para estimar el modelo estadístico propuesto, más cinco o seis ejecuciones únicas adicionales destinadas a estimar el error del modelo. Para nuestro ejemplo, se propone un diseño RSM con 18 ejecuciones, tal y como se muestra a continuación.

Este diseño i-óptimo minimiza la varianza de predicción, tal y como se observa en las figuras siguientes. Observará que la varianza de predicción se mantiene baja en gran parte del espacio de diseño, mientras que aumenta cerca de las delimitaciones del espacio. Los gráficos que se muestran a continuación representan el rango de los factores en el eje X y la varianza en el eje Y.

Los valores de rendimiento e impurezas se registran en la tabla de datos una vez ejecutado el experimento, siguiendo el orden de corrida del diseño.

Para analizar los datos experimentales, utilizaremos la regresión lineal múltiple para ajustar el modelo estadístico inicial “completo” especificado tanto para el rendimiento como para las impurezas. Se ajusta un modelo individual para cada respuesta: rendimiento e impurezas. Los términos del modelo son los mismos que especificamos durante la configuración del diseño e incluyen los siguientes términos:

Constante.

Tres efectos principales (pH, temperatura y proveedor).

Tres interacciones de dos factores.

Dos efectos cuadráticos (para los factores continuos).

En ambos modelos, los efectos inactivos se eliminan del modelo mediante la selección de variables. Los efectos activos son términos que tienen una significación estadística e influyen en las respuestas. Al examinar el resumen de efectos de ambos modelos con los efectos activos, observamos que la curvatura es un efecto activo para la temperatura y el pH con el término cuadrático. Observamos que también existen interacciones activas entre el pH y el el proveedor, así como entre el pH y la temperatura.

Analicemos el modelo reducido para el rendimiento y las impurezas mediante el estudio de secciones transversales de la superficie, o perfiles. Para nuestro ejemplo, el objetivo de maximizar el rendimiento es tan importante como el de minimizar las impurezas. Para comprender las concesiones y encontrar una combinación de ajustes de factores que equilibre las concesiones entre ambos objetivos, combinamos los trazos de perfil y los optimizamos conjuntamente.

En este ejemplo, determinamos que al establecer el pH en 7.18, la temperatura en 33.71 y utilizar el proveedor “Fast” maximizará el rendimiento en 96.06 y minimizará las impurezas en un 0.82%. Cabe señalar, sin embargo, que podría haber otras combinaciones de factores que dieran lugar a resultados similares.

layout

2 column

Style

columns-75-25, section-top-padding-xsmall