Piani di screening definitivi

Cosa sono i piani di screening definitivi?

Un piano di screening definitivo (DSD, definitive screening design) è un piano sperimentale specializzato per identificare quale tra i molti fattori continui influenza più fortemente una risposta. I DSD richiedono un numero ridotto di esecuzioni e offrono vantaggi rispetto ai piani di screening standard di dimensioni simili. Riducono l'ambiguità nell'identificare effetti attivi, permettono di identificare la curvatura negli effetti dei singoli fattori e supportano la stima di modelli quadratici completi in un piccolo filtra di fattori.

Perché dovresti usare un piano di screening definitivo?

I piani di screening definitivi offrono numerosi vantaggi rispetto ai piani di screening standard, come i disegni fattoriali frazionari o i piani Plackett-Burman. Questi piani standard possono creare alias per alcuni effetti principali e interazioni a due fattori, oltre a confondere completamente le interazioni a due fattori tra di loro, portando ad ambiguità nell'identificazione degli effetti attivi. Oltre a ciò, mentre i piani di screening standard con punti centrali possono identificare la presenza di curvatura in uno o più fattori, non possono determinare quali fattori sono l'origine della curvatura senza richiedere ulteriori esecuzioni. In confronto, i DSD offrono diversi vantaggi:

I DSD offrono questi vantaggi in un piccolo numero di esecuzioni. Per sei o più fattori, questi piani richiedono solo un numero di esecuzioni leggermente superiore al doppio del numero di fattori. Ad esempio, con 14 fattori continui, un DSD di dimensioni minime richiede solo 29 esecuzioni, una piccola frazione del corrispondente piano fattoriale completo (214 = 16.384 esecuzioni). In confronto, un piano fattoriale frazionario di risoluzione IV richiede almeno 32 esecuzioni. Come il DSD, evita l'alias degli effetti principali e delle interazioni a due fattori, ma a differenza del DSD, confonde completamente alcune interazioni a due fattori tra loro e non è in grado di valutare la curvatura quadratica nei singoli fattori, anche se vengono aggiunti punti centrali. Il DSD raccoglie una quantità relativamente grande di informazioni in un piano efficiente.

Oltre allo screening, i DSD possono direttamente attivare l'ottimizzazione delle risposte tramite la metodologia della superficie di risposta quando il numero di fattori attivi è ridotto. Un DSD per sei o più fattori permette la stima del modello quadratico completo in qualsiasi tre dei fattori, mentre i DSD di 18 o più fattori possono adattare il modello quadratico completo in qualsiasi quattro fattori, e i DSD per 24 o più fattori possono adattare il modello quadratico completo in qualsiasi cinque fattori. Ciò significa che se hai abbastanza fortuna da avere pochi fattori attivi, puoi utilizzare lo stesso piano sia per lo screening che per l'ottimizzazione della risposta. Altrimenti, puoi allargare il tuo DSD con esecuzioni aggiuntive secondo necessità.

Come si crea un piano di screening definitivo?

I vantaggi dei DSD sono dovuti alla loro particolare struttura. A titolo di esempio, considera questa tabella del piano per un DSD con sei fattori continui. Ogni fattore è codificato per avere un valore alto di 1, un valore basso di -1 e un valore intermedio di 0.

Esegui X1 X2 X3 X4 X5 X6
1 0 1 1 1 1 1
2 0 -1 -1 -1 -1 -1
3 1 0 -1 1 1 -1
4 -1 0 1 -1 -1 1
5 1 -1 0 -1 1 1
6 -1 1 0 1 -1 -1
7 1 1 -1 0 -1 1
8 -1 -1 1 0 1 -1
9 1 1 1 -1 0 -1
10 -1 -1 -1 1 0 1
11 1 -1 1 1 -1 0
12 -1 1 -1 -1 1 0
13 0 0 0 0 0 0

Il DSD è un piano foldover, con ogni esecuzione appaiata a un'altra in cui tutti i valori dei fattori hanno il segno inverso. Ad esempio, le esecuzioni 1 e 2 formano una coppia di inversione, con l'esecuzione 2 che semplicemente inverte i segni dei valori nell'esecuzione 1. Lo stesso vale per le esecuzioni 3 e 4, 5 e 6, e così via, con l'esecuzione 13 che è un punto centrale misurato al valore intermedio di tutti i fattori. L'aspetto foldover del design elimina l'aliasing degli effetti principali e delle interazioni a due fattori.

Nota che entro qualsiasi coppia di foldover, un fattore viene misurato al suo valore intermedio in entrambe le esecuzioni, mentre tutti gli altri fattori vengono misurati ai loro valori bassi o alti. Questo posiziona i punti lungo i bordi dello spazio dei fattori, non solo agli angoli o al centro, come nei piani di screening standard. Questo aspetto del piano rende stimabili tutti gli effetti quadratici.

Il diagramma del piano nei primi tre fattori illustra ulteriormente la struttura di un DSD. Occorre notare che ogni punto (tranne il punto centrale) ha un punto di foldover corrispondente che si trova in una posizione "speculare" nel cubo. Il piano include anche punti mediani ai bordi dello spazio dei fattori, con ciascun fattore misurato nel suo punto mediano un totale di tre volte, incluso il punto centrale.

Questo esempio di piano rappresenta il numero minimo di esecuzioni per sei fattori continui. In pratica, è consigliato di includere almeno quattro esecuzioni aggiuntive, ottenute introducendo fattori inattivi fittizi nel progetto. In questo modo si aumenta notevolmente la capacità del DSD di rilevare interazioni attive a due fattori e la curvatura quadratica.

Quindi, come si fa a creare il proprio DSD? Non preoccuparti, non dovrai farlo tu: un software statistico come JMP può gestire l'intero processo di progettazione al posto tuo.

Un esempio di piano di screening definitivo

Immagina di essere un ingegnere presso un'azienda biotecnologica e di avere il compito di sviluppare un nuovo processo di estrazione con l'obiettivo di massimizzare la resa dell'estrazione, misurata in milligrammi. Devi innanzitutto identificare quali fattori di processo influiscono maggiormente sulla resa e iniziare testando più solventi, pH e tempo di soluzione. I tuoi fattori e range sono:

Si sceglie di utilizzare un DSD perché si hanno tutti i fattori continui, si sospettano interazioni a due fattori e potrebbe essere presente una curvatura quadratica, e dopo lo screening si desidera adattare un modello quadratico completo nei fattori attivi senza la necessità di molte (o alcuna) esecuzioni aggiuntive. Hai scelto di includere quattro esecuzioni oltre il minimo di 13 per rilevare meglio gli effetti di secondo ordine. Utilizzi il seguente DSD a 17 esecuzioni e registri i risultati nella colonna della resa.

Esegui Metanolo Etanolo Propanolo Butanolo PH Tempo Rendimento
1 0 10 5 0 6 2 23,43
2 0 0 10 10 7,5 1 4,85
3 5 10 10 10 9 2 40,91
4 10 10 0 10 6 1 21,68
5 0 0 10 0 9 2 3,09
6 10 0 10 0 6 1,5 26,09
7 5 5 5 5 7,5 1,5 30,05
8 0 0 0 10 6 2 11,99
9 0 10 0 10 9 1,5 11,54
10 10 5 10 10 6 2 33,46
11 10 10 0 0 7,5 2 47,44
12 10 0 0 5 9 2 23,58
13 5 0 0 0 6 1 22,26
14 10 0 5 10 9 1 27,07
15 0 10 10 5 6 1 3,35
16 0 5 0 0 9 1 3,18
17 10 10 10 0 9 1 21,67

Visualizzando l'effetto principale di ciascun fattore si osserva che i valori metanolo e tempo esercitano forti effetti positivi sulla resa, mentre l'etanolo esercita un effetto positivo minore. Le linee per propanolo, butanolo e pH appaiono piatte, suggerendo effetti principali trascurabili per questi fattori. Un modello di regressione multipla di soli effetti principali conferma che gli effetti principali di metanolo, etanolo e tempo sono attivi e, poiché è stato utilizzato un DSD, si sa che le stime degli effetti principali non sono influenzate da interazioni attive a due fattori che non sono ancora state studiate. Scegli di andare avanti con metanolo, etanolo e tempo come fattori attivi.

Poiché hai utilizzato un modello senza un DSD a sei fattori e hai identificato solo tre fattori attivi, sei in grado di stimare un modello quadratico senza aggiungere ulteriori esecuzioni al piano. Utilizzi la regressione multipla con un metodo di selezione delle variabili per arrivare a un modello finale da utilizzare per l'ottimizzazione. Questo modello rivela che l'effetto del metanolo mostra una curvatura quadratica e che l'etanolo e il tempo mostrano un'interazione a due fattori: l'etanolo esercita un effetto trascurabile quando il valore del tempo è basso, ma un forte effetto positivo quando il valore del tempo è alto.

Utilizzando il modello finale, identifichi le seguenti impostazioni dei fattori ottimali, che si prevede producano una resa media di 45,34 mg.