Metodologia della superficie di risposta

Che cos'è la metodologia della superficie di risposta?

La metodologia della superficie di risposta (RSM, response surface methodology) viene utilizzata per sviluppare, migliorare o ottimizza un prodotto o processo. Questa metodologia coinvolge una raccolta di varie tecniche statistiche, grafiche e matematiche che vengono utilizzate per esplorare e modellare la forma di una risposta attraverso la regione sperimentale.

Quando dovrebbe essere usata la metodologia della superficie di risposta?

Utilizza i piani di screening per identificare i fattori che sono importanti nel determinare le qualità del tuo prodotto o i risultati del tuo processo. Dopo aver identificato i fattori importanti per te, la RSM ti aiuta a determinare le impostazioni dei fattori per ottimizzare la tua risposta o le tue risposte. Nello specifico, la RSM può aiutarti se hai:

  • Un obiettivo generale per la tua risposta (ad esempio, alto è meglio, inferiore è meglio, o entro un range è meglio).
  • Un obiettivo specifico per il tuo obiettivo (ad esempio, la risposta deve essere almeno 90%, meno di 5 mg/L, o a 20 ± 0,1 mm).
  • Più di una risposta, con un obiettivo univoco per ciascuna.

Inoltre, la RSM è più utile quando si è certi che esista una condizione ottimale entro la regione sperimentale.

Perché utilizzare la metodologia della superficie di risposta?

Supponiamo che tu abbia utilizzato un piano di screening per restringere l'elenco dei possibili fattori importanti nel tuo processo. Ora, vuoi trovare le impostazioni dei fattori che ottimizzano una o più risposte, ma hai bisogno di informazioni più dettagliate di quelle che puoi ottenere con un tipico esperimento di screening.

O forse sai già quali fattori sono importanti, ma sospetti che il processo possa essere migliorato per soddisfare meglio i tuoi obiettivi. In entrambi i casi, comprendere la forma della risposta – la superficie di risposta – ti aiuterà a identificare le impostazioni dei fattori che si prevede producano la risposta ottimale, indipendentemente da come questa sia definita (massimo, minimo o target).

Supponiamo per il momento che tutti i fattori presi in considerazione siano continui.

Un fattore sperimentale testato a due livelli fornisce i dati necessari per stimare un effetto lineare. Per un esperimento a fattore singolo, la superficie di risposta è modellata come una linea; per due fattori, la superficie viene modellata come un piano; per tre o più fattori, la superficie viene modellata come un iperpiano.

Ma spesso l'effetto di un fattore sulla risposta non è lineare. Tra i livelli bassi e alti di un fattore potrebbe esserci un picco (massimo) o una valle (minimo) nella risposta. In altre parole, si potrebbe notare una curvatura nella superficie di risposta. In quei casi, è difficile o addirittura impossibile trovare condizioni ottimali utilizzando piani che presuppongono una risposta lineare. Per stimare la curvatura nella risposta, è necessario aggiungere nuovi effetti al modello, il che richiede più punti di dati. Ad esempio, per stimare un effetto quadratico (cioè, X2), un fattore continuo deve essere testato su tre livelli, non solo due. I piani RSM includono un terzo livello (o talvolta di più) per ogni fattore continuo nell'esperimento.

Questi progetti possono essere eseguiti come esperimenti autonomi, ma possono anche basarsi sui dati esistenti per stimare effetti quadratici specificando livelli di fattori e combinazioni di trattamenti che non erano inclusi nei progetti precedenti. Supponiamo che tu abbia eseguito un esperimento di screening per scoprire quali fattori sono importanti. Hai già raccolto dati preziosi sul tuo sistema o processo, ma di solito non hai i dati necessari per stimare la curvatura. Aumentare i dati esistenti con un esperimento successivo che include un terzo livello per i fattori continui può essere un modo efficiente per modellare la superficie di risposta.

Trovare le impostazioni dei fattori che ottimizzano una o più risposte può essere impegnativo. Nella maggior parte delle situazioni, una risposta dipende da fattori multipli, cosa che rende la forma della superficie di risposta multidimensionale e potenzialmente complessa se i fattori interagiscono tra loro. La metodologia della superficie di risposta ti consente di esplorare quella superficie per trovare le migliori impostazioni dei fattori entro la regione sperimentale per raggiungere i tuoi obiettivi di risposta.

Metodologia della superficie di risposta: un esempio

Supponiamo di essere interessati a ottimizzare un processo identificando quali impostazioni dei fattori producono il rendimento più elevato e l'impurità più bassa. Ci è stato detto che gli obiettivi delle due risposte sono di pari importanza. Sulla base delle conoscenze precedenti, sappiamo che tre fattori sono importanti, ma desideriamo migliorare il processo individuando le condizioni operative che meglio soddisfano i nostri obiettivi. In questo esempio, non stiamo aumentando un design precedente come descritto sopra, ma stiamo creando un nuovo design RSM.

Le risposte e i fattori sono:

Per entrambi i fattori continui, pH e temperatura, vogliamo determinare se c'è un picco o una valle in entrambe le risposte tra i livelli alto e basso dei fattori. L'intervallo di interesse per il pH è da 5 a 8. Per capire se l'effetto di pH su resa e impurità non è lineare, testiamo un terzo, livello intermedio tra 5 e 8 (6,5). Lo facciamo anche per la temperatura con livelli di fattore di 15°, 30° e 45°. I tre livelli ci consentono di stimare l'effetto quadratico (curvatura) per i fattori continui. Gli effetti quadratici non possono essere stimati per fattori categorici. Siamo anche interessati a verificare se esistono interazioni tra i tre fattori. Un piano RSM con 18 esecuzioni permetterà di stimare l'effetto principale, le interazioni a due fattori e gli effetti quadratici.

Grafico a dispersione che mostra il pH rispetto alla temperatura per tre fornitori etichettati come Cheap (economico), Fast (veloce) e Good (buono). Ogni riquadro visualizza punti di dati a vari livelli di temperatura e pH.

Dopo aver condotto l'esperimento, le risposte vengono annotate nella tabella di dati.

Tabella di dati che mostra le 18 esecuzioni, le impostazioni per pH, temperatura e fornitore, e le risposte corrispondenti per resa e impurità.

Usa la regressione lineare multipla per modellare le risposte. Il modello completo per entrambi le risposte include i seguenti termini:

Dopo aver adattato modelli separati per resa e impurità, puoi utilizzare la selezione delle variabili per rimuovere i termini non significativi dai modelli. I termini che rimangono nei modelli ridotti per ogni risposta sono mostrati nella tabella sottostante.

Rendimento
Impurità
Temperatura
Temperatura*Temperatura
pH*Temperatura
Fornitore
pH*pH
pH*Fornitore
PH
pH*pH
PH
Temperatura

Nota: i termini del modello in corsivo non erano significativi ma rimangono nei modelli perché sono coinvolti in termini di ordine superiore.

Abbiamo scoperto che sia il pH che la temperatura e uno o più dei loro effetti di ordine superiore erano importanti per entrambe le risposte. Tuttavia, il fornitore (e la sua interazione con pH) era importante solo per l'impurità.

È possibile visualizzare la forma della superficie di risposta per i fattori continui con un grafico di superficie tridimensionale. È possibile vedere nei diagrammi dove nella regione sperimentale si potrebbero ottenere valori più alti di resa e valori più bassi di impurità.

Rendimento

Grafico di superficie tridimensionale rotante per la resa.

Impurità

Grafico di superficie tridimensionale rotante per l'impurità.

È possibile visualizzare la superficie di risposta osservando le sezioni trasversali della superficie o i profili. Qui puoi vedere come la modifica del livello di un singolo fattore influisce sui valori previsti delle risposte (mostrati a sinistra). E puoi vedere come i profili dei fattori coinvolti nelle interazioni cambiano a seconda del livello dell'altro fattore.

Immagine animata del profiler di previsione che mostra come la variazione dei livelli di pH, temperatura e fornitore influisca su valori di resa e impurità.

Gli obiettivi della risposta sono massimizzare la resa e minimizzare l'impurità. È possibile trovare una combinazione di impostazioni dei fattori entro la regione sperimentale che bilancia i compromessi tra entrambi gli obiettivi. In questo esempio, impostando il pH a 6,85, la temperatura a 34,25°, e utilizzando il fornitore Fast, si prevede di massimizzare la resa al 94,12% e di ridurre l'impurità allo 0,89%.

Grafico che mostra le impostazioni ottimali per pH, temperatura e fornitore per massimizzare la resa e ridurre al minimo l'impurità.

Potrebbero esserci altre combinazioni di fattori che produrrebbero risultati simili. Si potrebbero anche trovare impostazioni che produrrebbero una resa maggiore, ad esempio, ma a scapito di ridurre al minimo l'impurità, o viceversa. Potresti voler accettare quel compromesso, se ottimizzare una delle risposte fosse più importante dell'altra.