piani di screening

Cosa sono i piani di screening?

I piani di screening sono un tipo di esperimenti progettati che sono spesso condotti come un passo iniziale nell'identificare i fattori più influenti tra molte variabili potenziali che influenzano un processo o un risultato. Sono un metodo efficiente e rigoroso per determinare sistematicamente quali fattori devono essere inclusi negli esperimenti successivi, utilizzando un numero relativamente piccolo di esecuzioni sperimentali. Lo screening consiste nel separare "i pochi elementi vitali dai molti elementi banali".

Quando dovresti usare i piani di screening?

I disegni di screening possono essere utili quando una qualsiasi delle seguenti condizioni è vera:

Potrebbe non essere necessario valutare i fattori in ogni situazione. Ad esempio, i metodi di screening potrebbero non essere necessari in situazioni in cui si dispone di un numero limitato di fattori o si possono permettere tutte le esecuzioni di progettazione necessarie per adattare il modello più complesso che si possa immaginare.

Perché e come si utilizzano i piani di screening?

Il processo di sperimentazione in genere comporta una sequenza di esperimenti. Spesso, nelle fasi iniziali della sperimentazione, è possibile pensare a molti fattori che potrebbero influenzare il proprio processo. Il primo compito è restringere la lunga lista di effetti potenzialmente importanti (effetti principali e, in alcuni casi, effetti di interazione) ai pochi effetti più importanti. Quando ci sono molti fattori da considerare, i piani fattoriali completi potrebbero essere troppo dispendiosi in termini di tempo o denaro. Anche i piani fattoriali completi possono essere uno spreco, poiché in genere non si è interessati ad adattare un modello con tre fattori e interazioni maggiori (o almeno non tutti!). I piani di screening, tuttavia, possono aiutare a identificare gli effetti maggiori in meno esecuzioni.

L'efficacia dei piani di screening e dei metodi di analisi dipende da quattro principi fondamentali. Anche se questi principi non valgono in tutte le situazioni, nella pratica si sono rivelati abbastanza comuni da essere piuttosto utili.

Sparsità

Il principio della scarsità degli effetti afferma che, mentre potresti avere molti fattori candidati con molti più effetti potenziali, solo una piccola porzione di essi sarà realmente importante per qualsiasi risposta.

Due insiemi di circonferenze che rappresentano i fattori nel nostro piano: a sinistra, nove fattori candidati etichettati X1–X9; a destra, i fattori importanti evidenziati in arancione—X1, X3 e X8

Gerarchia

Il principio di gerarchia afferma che la probabilità che un effetto sia significativo diminuisce con l'aumentare dell'ordine del termine del modello. In altre parole, un termine del modello di ordine superiore, come un'interazione a tre fattori, è molto meno probabile che sia rilevante rispetto a un termine del modello di ordine inferiore, come un'interazione a due fattori, e un'interazione a due fattori è meno probabile che sia rilevante rispetto a un effetto principale.

Un diagramma che rappresenta l'importanza relativa di diversi effetti. A sinistra, circonferenze grandi etichettate

Ereditarietà

Il principio di ereditarietà afferma che la presenza di termini di ordine superiore è solitamente associata alla presenza di effetti di ordine inferiore degli stessi fattori. Quindi, ad esempio, se l'interazione tra X1 e X3 è importante, è più probabile che l'effetto principale di X1 o X3 sia anch'esso importante.

Grafico che confronta gli effetti significativi in un modello. Sulla sinistra ci sono due circonferenze

Proiezione

La proprietà di proiezione si riferisce a quanto bene un piano conserva proprietà statistiche desiderabili (come la stimabilità degli effetti e l'indipendenza delle stime) quando gli effetti non importanti vengono rimossi dal modello, e il piano viene "proiettato" in un piano di dimensionalità inferiore con meno fattori (gli effetti importanti). Un piano con buone proprietà di proiezione produrrà risultati affidabili quando si analizza questo filtro di fattori.

Il primo passo nella pianificazione di un esperimento di screening è identificare tutti i fattori associati al processo. I risultati includeranno i fattori di interesse – i fattori che puoi modificare durante l'esperimento e che ti aspetti influenzino le risposte – così come qualsiasi fattore che potrebbe introdurre variabilità casuale, o disturbo, nel processo. Idealmente, è possibile controllare questi fattori di disturbo durante l'esperimento o tenerne conto nel modello statistico. Si dovrebbe anche considerare la possibilità di effetti di ordine superiore, come le interazioni.

Nella pratica, tuttavia, potresti non riuscire a includere tutti i potenziali fattori e le loro interazioni nel tuo esperimento. Le decisioni relative al piano dipenderanno da diverse considerazioni, tra cui:

In alcuni casi, potrebbe essere necessario eseguire più di un esperimento per identificare gli effetti importanti. Ad esempio, forse l'esperimento iniziale non ha permesso di stimare le interazioni a due fattori, quindi è necessario eseguire ulteriori esperimenti per testarle.

Esistono molti metodi che puoi utilizzare per progettare un esperimento di screening. I piani "classici", come i piani fattoriali frazionali e il piano di Plackett-Burman, sono stati sviluppati nella prima parte del 20° secolo e, pur essendo ampiamente conosciuti, presentano dei limiti. I metodi moderni, come i piani personalizzati e i piani di screening definitivo, utilizzano un approccio algoritmico e offrono molti vantaggi. Indipendentemente dal metodo utilizzato, i piani di screening sono un primo passo per determinare come ottimizzare un processo.

Piani di screening: un esempio

Supponiamo che tu stia sviluppando un processo di produzione in cui le risposte di interesse sono resa e impurità. Ti è stato assegnato il compito di trovare le impostazioni nel tuo processo che massimizzino la resa e minimizzino l'impurità. Per prima cosa, devi comprendere cosa influisce sulle risposte e in che modo.

Tu e il tuo team individuate nove fattori che ritenete possano essere importanti nell'influenzare resa e impurità. Sette dei fattori sono continui e due sono categorici. In base all'esperienza a priori, tu e il tuo team scegliete range e livelli dei fattori che, se il fattore è veramente importante, dovrebbero produrre un cambiamento sufficientemente grande nelle risposte da poter essere rilevato dal vostro esperimento.

I fattori e i loro range o livelli sono:

Non ti aspetti che tutti e nove i fattori siano importanti (principio di scarsità degli effetti), ma a questo punto non sai quali saranno. Sospetti che ci possa essere almeno un'interazione a due fattori e possibilmente effetti quadratici, ma ti aspetti che siano meno importanti degli effetti principali (principio della gerarchia). Presumi anche che qualsiasi interazione presente coinvolgerà gli importanti effetti principali che identifichi dal tuo esperimento (principio di ereditarietà). Infine, sai che se riesci a eliminare gli effetti non rilevanti dal tuo modello, potresti stimare gli effetti di interazione che coinvolgono gli effetti principali significativi, anche se il piano originale non ne consentiva la stima (proprietà di proiezione).

Esistono molte possibili strategie di screening: esperimenti di piccole dimensioni che consentono di stimare solo gli effetti principali, esperimenti di medie dimensioni che consentono di stimare gli effetti principali e alcune interazioni a due fattori, oppure esperimenti di grandi dimensioni che consentono di stimare gli effetti principali e tutte le possibili interazioni a due fattori. La strategia che utilizzi si basa in gran parte sulle considerazioni descritte sopra. (Gli effetti quadratici vengono solitamente testati negli esperimenti di ottimizzazione una volta che sono stati identificati i fattori importanti.)

Per questo esempio, supponiamo che tu abbia un budget piuttosto limitato per il tuo esperimento di screening, quindi decidi di iniziare con un piano che consideri solo gli effetti principali per individuare i fattori importanti. Pur rendendoti conto che questa potrebbe essere una strategia rischiosa, soprattutto se sono presenti effetti di interazione più forti degli effetti principali, ti senti a tuo agio nell'affidarti ai principi di screening e hai stanziato un budget per ulteriori esperimenti nel caso in cui fosse necessario chiarire i risultati di questo.

Una volta completata la strategia e la pianificazione, progetti un esperimento con 22 prove. Quattro di queste sono punti centrali, esecuzioni dove tutti i fattori continui sono ai loro livelli medi.

Grafico che mostra il punto centrale

Ci sono diversi motivi per considerare l'inclusione dei punti centrali in un piano. I punti centrali possono fornire replicazione in un piano altrimenti non replicato, permettendoti di stimare l'errore puro e caricare i test statistici per i termini nel tuo modello. Potresti scegliere di distribuire le esecuzioni dei punti centrali in tutto il piano per monitorare se ci sono cambiamenti imprevisti nel tuo processo durante l'esperimento; ti aspetti che le risposte di tali esecuzioni siano simili tra loro perché sono repliche.

Nel contesto dei piani di screening, i punti centrali possono essere utilizzati per rilevare la presenza di curvatura nella risposta attraverso un test di mancata stima. Un test di mancata stima statisticamente significativo indica che il modello potrebbe avere uno o più termini quadratici mancanti. Poiché l'esperimento non era progettato per consentire la stima dei termini quadratici, bensì solo la loro rilevazione, un test di mancata stima significativo suggerisce la necessità di ulteriori esperimenti per comprendere la curvatura nella risposta.

Esegui l'esperimento e registri le risposte, Yield (resa) e Impurity (impurità), mostrati nella tabella sottostante.

Utilizzi la regressione lineare multipla per stimare un modello per ciascuna risposta. I fattori sono mostrati in ordine di importanza (basati su una misura chiamata log valenza) per ciascuna risposta nel grafico sottostante.

In base al tuo esperimento di screening, determini che per la resa, gli effetti maggiori sono la temperatura e il pH. Gli effetti maggiori per l'impurità sono la temperatura, il pH e il fornitore (Vendor).

Sulla base di questi risultati, i tuoi passi successivi potrebbero essere ridurre il modello (rimuovendo termini non importanti), stimare un nuovo modello con i termini importanti e le loro interazioni (se possibile) ed esaminare il test di mancata stima per vedere se vi è alcuna evidenza di curvatura in una delle risposte. Questi risultati possono guidare le decisioni relative agli esperimenti successivi, nel tentativo di comprendere e infine ottimizzare il processo.