Piani di screening algoritmici
Che cos'è un piano di screening algoritmico?
I piani di screening algoritmici sono costruiti dal software per il disegno di esperimenti (DOE) per adattarsi al tuo contesto sperimentale unico. Un piano algoritmico può incorporare molti diversi tipi di fattori, vincoli sullo spazio di progettazione, restrizioni sulla randomizzazione e un numero variabile di esecuzioni, il tutto producendo un piano statisticamente ottimale per lo screening dei fattori.
Quando utilizzare un piano di screening algoritmico?
I piani di screening algoritmico sono applicabili in quasi qualsiasi contesto di screening. Sono particolarmente utili quando la situazione presenta determinate esigenze o limitazioni che non possono essere soddisfatte da un piano di screening classico.
Perché utilizzare piani di screening algoritmici?
I piani di screening forniscono un modo efficiente per identificare quali tra molti fattori influenzano maggiormente una risposta. I piani di screening algoritmici sono utili quando i piani di screening classici, come i piani fattoriali frazionati e i piani di Plackett-Burman, sono impraticabili o impossibili da condurre nel tuo contesto sperimentale.
I piani di screening classici sono stati utilizzati efficacemente per anni. Tuttavia, questi piani sono stati creati molti decenni fa come soluzione ampie da applicare in scenari di routine del disegno di esperimenti (DOE). In pratica, gli sperimentatori possono dover affrontare contesti o sfide che i piani classici non possono facilmente gestire. Ad esempio, un piano di screening classico potrebbe richiedere un'esecuzione in un'area dello spazio dei fattori che è irrealizzabile o impossibile da esplorare, o potrebbe richiedere un numero di esecuzioni che supera il budget disponibile. I piani di screening classici possono forzarti ad adattare la tua situazione per adattarla al piano, il che potrebbe richiedere l'esclusione di fattori o livelli che altrimenti avresti testato, la modifica manuale del progetto a scapito dei suoi benefici statistici o altri svantaggi.
I piani di screening algoritmici utilizzano invece un algoritmo informatico per creare un piano personalizzato che stima il tuo contesto sperimentale unico. I piani algoritmici consentono molte personalizzazioni, tra cui, ma non solo:
- Specificare un numero di esecuzioni corrisponde al proprio budget di esecuzioni.
- Combinare molti tipi di fattori diversi all'interno di un piano singolo.
- Limitare lo spazio del piano per evitare combinazioni indesiderate delle impostazioni dei fattori.
- Imporre una varietà di restrizioni sulla randomizzazione.
Come vengono costruiti i piani di screening algoritmici?
Un software DOE elabora un progetto di screening algoritmico in base alle vostre esigenze. Dopo aver specificato i fattori e i loro tipi, il numero desiderato di esecuzioni, i vincoli sullo spazio del piano e altri parametri, il software utilizza un algoritmo per identificare un piano di screening statisticamente ottimale che soddisfi le specifiche indicate. È inoltre possibile specificare se il piano verrà utilizzato per lo screening solo degli effetti principali o per qualsiasi effetto di ordine superiore di interesse.
In questo contesto, "statisticamente ottimale" è definito da un valore numerico (un criterio di ottimalità) che quantifica una proprietà statistica del piano. In un tipico piano di screening, il criterio di ottimalità quantifica quanto bene il piano supporti stime precise degli effetti dei fattori. Viene eseguito negli esperimenti di screening perché sono necessarie stime precise degli effetti per determinare con precisione quali fattori influenzano più fortemente la risposta. Altri criteri di ottimalità sono utili per altri contesti del DOE: ad esempio, gli esperimenti algoritmici sulla superficie di risposta utilizzano in genere un criterio di ottimalità che quantifica quanto bene il piano supporti la costruzione di un modello che effettuerà previsioni precise della risposta.
Qual è un esempio di un piano di screening algoritmico?
Iniziamo con lo stesso scenario presentato nella pagina della panoramica sul piano di screening, ma con complicazioni aggiuntive.
Supponiamo che tu lavori presso un'azienda farmaceutica che sta sviluppando un processo di produzione per un nuovo farmaco. Devi identificare quali fattori influenzano maggiormente il livello di impurità del farmaco, con l'obiettivo finale di applicare la metodologia della superficie di risposta a tali fattori per trovare impostazioni dei fattori che riducano al minimo l'impurità. I fattori in questo esperimento di screening sono:
- Tempo di miscelazione: (continuo; da 10 a 30 minuti)
- Pressione: (continua; da 60 a 80 kPa)
- pH: (continuo; da 5 a 8)
- Velocità di agitazione: (continua; da 100 a 120 RPM)
- Catalizzatore: (continuo; dall'1% al 2%)
- Temperatura: (continua; da 15° a 45° Celsius)
- Portata: (continua; da 10 A 15 S/min)
- Fornitore: (categoriale a tre livelli; tre diversi fornitori di materie prime)
- Dimensione delle particelle: (categoriale a due livelli; piccolo e grande)
Nel progettare questo esperimento si incontrano due complicazioni. Prima di tutto, i vincoli delle risorse ti limitano a 15 esecuzioni, che possono coprire meno del 2% dei 768 angoli dello spazio dei fattori. Con questo piano sparso è necessario valutare l'effetto principale di ciascun fattore, così come la possibilità di curvatura quadratica negli effetti di uno o più fattori continui, richiedendo almeno un punto centrale (cioè, un'esecuzione al valore intermedio di tutti i fattori continui). In secondo luogo, sai che non è fattibile operare ad alta pressione mantenendo la temperatura bassa e viceversa, quindi devi vincolare il piano per evitare esecuzioni in queste aree dello spazio dei fattori. Questo vincolo è rappresentato graficamente di seguito, con le regioni rosse che rappresentano le aree dello spazio dei fattori da evitare.
All''inizio, tenti di costruire un piano di screening classico, il che limita immediatamente le tue opzioni perché la maggior parte dei piani di screening classici presuppone che qualsiasi fattore categorico sia a due livelli, mentre il fattore fornitore è a tre livelli. Il piano classico disponibile (un piano L18) richiede un minimo di 18 esecuzioni e non soddisfa il vincolo di pressione per temperatura, quindi decidi di rifiutare il piano classico a favore di un piano algoritmico.
Utilizzando il software DOE, come JMP, crei un piano a 15 esecuzioni senza esecuzioni negli angoli irrealizzabili dello spazio dei fattori. Il software ti dice che il piano richiederà un minimo di 11 esecuzioni, che è necessario per stimare l'intercettazione e l'effetto principale di sette fattori continui, un fattore categorico a tre livelli e un fattore categorico a due livelli. (Si noti che un fattore di livello k richiede la stima di k-1 parametri del modello.) Hai ancora quattro esecuzioni rimaste nel tuo budget, quindi specifichi che l'algoritmo dovrebbe produrre un piano con due punti centrali e due esecuzioni replicate. Insieme, aiuteranno a valutare se gli effetti continui presentano una curvatura quadratica. (Ne discuteremo ulteriormente quando analizzeremo i dati.) La tabella del piano è riportata di seguito, seguita da un grafico che mostra il disegno nello spazio pressione per temperatura.
| Esegui | Tempo di miscelazione | Pressione | PH | Velocità di agitazione | Catalizzatore | Temperatura | Tasso di alimentazione | Fornitore | Dimensione delle particelle |
| 1 | 30 | 80 | 8 | 100 | 1 | 45 | 10 | Economico | Piccolo |
| 2 | 30 | 80 | 5 | 120 | 2 | 45 | 15 | Veloce | Piccolo |
| 3 | 10 | 65 | 5 | 100 | 2 | 45 | 15 | Economico | Grande |
| 4 | 10 | 80 | 8 | 120 | 1 | 45 | 15 | Buono | Grande |
| 5 | 30 | 80 | 5 | 120 | 2 | 45 | 15 | Veloce | Piccolo |
| 6 | 10 | 60 | 8 | 120 | 2 | 15 | 15 | Economico | Piccolo |
| 7 | 20 | 69,9 | 6,5 | 110 | 1,5 | 30,1 | 12,5 | Buono | Grande |
| 8 | 30 | 60 | 8 | 100 | 1 | 15 | 15 | Veloce | Grande |
| 9 | 10 | 60 | 5 | 120 | 1 | 40 | 10 | Veloce | Piccolo |
| 10 | 20 | 69,9 | 6,5 | 110 | 1,5 | 30,1 | 12,5 | Buono | Grande |
| 11 | 30 | 60 | 8 | 100 | 1 | 15 | 15 | Veloce | Grande |
| 12 | 30 | 75 | 5 | 120 | 1 | 15 | 10 | Economico | Grande |
| 13 | 10 | 80 | 8 | 100 | 2 | 20 | 10 | Veloce | Grande |
| 14 | 10 | 80 | 5 | 100 | 1 | 20 | 15 | Buono | Piccolo |
| 15 | 30 | 60 | 8 | 100 | 2 | 40 | 10 | Buono | Piccolo |
Noti che il piano ha un aspetto diverso da qualsiasi piano di screening classico che tu abbia visto prima. Pressione e temperatura sono entrambe misurate a cinque livelli invece di due o tre. Noti anche che i punti centrali sono misurati vicino ma non esattamente ai valori medi degli intervalli di pressione e temperatura (cioè, 69,9 per pressione e 30,1 per temperatura). Questo è il risultato dell'algoritmo di progettazione che trova un piano statisticamente ottimale che rispetta il tuo vincolo di pressione per temperatura mentre cerca di ottenere una stima dei parametri precisa nella fase di analisi. Noti che il vincolo è stato effettivamente rispettato perché non ci sono esecuzioni nell'angolo in alto a sinistra o nell'angolo in basso a destra del grafico pressione per temperatura. Invece, l'algoritmo ha posizionato i punti il più vicino possibile a quegli angoli, come consentito dal tuo vincolo.
Successivamente, si conducono le 15 prove in ordine casuale, misurando ogni volta il livello di impurità risultante e quindi analizzando i risultati utilizzando un modello di regressione multipla con solo effetti principali. Si scopre che l'analisi visualizza tre fattori con valori p inferiori a 0,05, che indicano prove statistiche di un effetto su impurità, temperatura, fornitore e pH. Si conclude che gli altri fattori sono inattivi o hanno effetti trascurabili.
| Fattore | p-value |
| Temperatura | 0,00204 |
| Fornitore | 0,01744 |
| PH | 0,01750 |
| Tasso di alimentazione | 0,19999 |
| Catalizzatore | 0,24683 |
| Tempo di miscelazione | 0,49980 |
| Velocità di agitazione | 0,52453 |
| Pressione | 0,82430 |
| Dimensione delle particelle | 0,92482 |
Successivamente crei un grafico per comprendere la natura degli effetti che hai scoperto. Il grafico mostra che entrambi gli effetti della temperatura e del pH sono positivi, con l'effetto della temperatura che è maggiore lungo tutto il suo intervallo. Si osserva anche un chiaro pattern nell'effetto del Vendor, con Cheap che presenta un livello di impurità notevolmente più alto rispetto a Fast o Good. Si nota anche che i due punti centrali (visualizzati come circonferenze aperte) si trovano ben al di sotto dei grafici a linee che tracciano gli effetti della Temperatura e del pH. Ciò suggerisce una curvatura quadratica in almeno un effetto continuo, anche se con i punti centrali non è possibile identificare quale fattore sia responsabile.
Infine, consulti un test della mancante stima, che verifica se al modello manca un effetto, come la curvatura quadratica. Questo test richiede almeno una replica nel piano, e hai abilmente specificato che l’algoritmo deve includere repliche nel suo piano. Il valore p del test è inferiore a 0,05, quindi si conclude che al modello manca un effetto. Questo è coerente con la tua valutazione visiva della curvatura nel grafico. Decidi di andare avanti con i tre fattori attivi che hai identificato, ampliando il tuo piano con nuove esecuzioni per produrre un piano della superficie di risposta che ti consenta di stimare la curvatura quadratica sia per i fattori continui che per tutte le interazioni a due fattori tra i tre fattori.
mancata stima
| Origine | DF | Somma dei quadrati | Media quadratica | Rapporto F |
| Mancata stima | 1 | 39,73 | 39,73 | 94,11 |
| Errore puro | 3 | 1,27 | 0,42 | Prob > F |
| Errore totale | 4 | 41,00 | 0,0023* |