Disegno di esperimenti

Cos'è il disegno di esperimenti?

Il disegno di esperimenti (DOE, Design of experiments) è un approccio sistematico utilizzato da scienziati e ingegneri per studiare gli effetti di diversi input (ad esempio, velocità, temperatura o fornitore) su un processo e gli output di quel processo (ad esempio, resa, impurità o costo). Il DOE è un sistema potente ed efficiente per comprendere sistemi complessi e prendere decisioni in modo affidabile e basate sui dati.

Quando usare il DOE?

In generale, un esperimento disegnato può essere utile quando si desidera:

  • Determinare se un fattore, o un gruppo di fattori, influenza una risposta di interesse.
  • Comprendere le potenziali relazioni tra fattori e risposte.
  • Ottimizzare una o più risposte identificando quali impostazioni dei fattori (ad esempio, una temperatura e un fornitore specifici) producono un risultato desiderato (ad esempio, la massima resa).

Perché non cambiare un fattore alla volta?

Anche se potrebbe sembrare più intuitivo o diretto eseguire un esperimento in cui si cambia solo un fattore alla volta, diamo un'occhiata a un semplice esempio per illustrare la potenza dell'utilizzo del DOE.

Nell'approccio con un fattore alla volta (OFAT, one-factor-at-a-time), si testa un singolo fattore modificando l'impostazione, o il livello, di quel fattore, mantenendo tutti gli altri fattori a un livello costante. Quindi si ripete questo processo per ciascun fattore nell'esperimento.

Esempio OFAT

Supponiamo, ad esempio, che desideri a massimizzare la resa di un processo chimico e sai che temperatura e pH sono fattori chiave della resa. Alle impostazioni attuali dei tuoi fattori (temperatura = 25°C e pH = 5,5), la resa è dell'83%.

Grafico che mostra una resa dell'83% per le impostazioni di temperatura = 25°C e pH = 5,5

Per determinare se puoi aumentare la resa, decidi di mantenere il pH all'impostazione corrente e variare la temperatura. Sai per esperienza precedente che a temperature inferiori a 15°C o superiori a 45°C il processo funziona male, quindi decidi di variare la temperatura in questo range con incrementi di 5°C e di registrare i risultati.

Grafico delle percentuali di resa con pH fisso a 5.5 e temperatura in aumento con incrementi di 5

Quando il pH è mantenuto costante a 5,5, scopri che il massimo rendimento dell'85% si verifica quando la temperatura è impostata a 30°C, il che rappresenta un piccolo miglioramento rispetto alle impostazioni attuali.

In seguito, decidi di mantenere la temperatura fissa a 30°C e di variare il pH. Sulla base dell'esperienza passata, decidi di variare il pH da 5 a 8 con incrementi di 0,5 e registrare i risultati.

Grafico delle percentuali di resa con temperatura fissa a 30 e pH in aumento con incrementi di 0,5

Dall'esito di questi 13 test in cui hai variato un fattore alla volta, concludi che la resa viene massimizzata all'86% quando la temperatura è impostata a 30°C e il pH è 6. Sembra inoltre che la resa diminuisca man mano che si sale o si scende rispetto a questi valori. In altre parole, sembra esserci curvatura nella relazione tra ciascun fattore e la risposta.

Grafico tridimensionale che mostra la relazione tra ciascun fattore e la risposta in base ai test OFAT

Ma puoi davvero avere la sicurezza che questo esperimento OFAT abbia catturato le vere relazioni tra temperatura, pH e resa? Dal momento che non hai variato la temperatura e il pH insieme in modo sistematico, non puoi indagare la possibilità di un'interazione tra questi fattori. Cioè, non puoi determinare se l'effetto della temperatura sulla resa cambia a seconda del livello di pH e viceversa. Se c'è effettivamente un'interazione, la forma della risposta, resa, potrebbe apparire molto diversa da quella che hai dedotto dopo il tuo esperimento OFAT.

Che tipo di esperimento sarebbe necessario per valutare se questi due fattori interagiscono tra loro e per comprendere come la risposta si comporta realmente nei range dei fattori (la regione sperimentale)? Potresti testare ogni possibile combinazione di temperatura e pH nei loro range, ma ciò richiederebbe molto tempo e sarebbe costoso. In questo esempio, dovresti condurre 49 test per coprire l'intera regione sperimentale, assumendo che i fattori vengano modificati con gli stessi incrementi.

Grafico che mostra i 49 test richiesti per affrontare ogni possibile combinazione di impostazioni dei fattori utilizzando l'approccio OFAT

Il DOE fornisce un modo migliore per scoprire in che modo la temperatura e il pH influiscono sulla resa e se interagiscono.  Diamo un'occhiata.

Utilizzo di un esperimento progettato

Per questo esempio a due fattori, definiamo la regione sperimentale come gli angoli di un quadrato: entrambi i fattori ai loro livelli bassi, entrambi i fattori ai loro livelli alti, e le combinazioni in cui un fattore è basso e l'altro è alto.

Grafico che mostra la regione sperimentale definita dagli angoli di un quadrato

Testare queste combinazioni di trattamenti consente di stimare gli effetti individuali di ciascun fattore sula resa, così come le loro possibili interazioni. Aggiungendo test con i fattori ai livelli intermedi è possibile stimare qualsiasi curvatura nella forma della risposta.

Grafico che include le impostazioni dei fattori agli estremi (angoli) e ai livelli intermedi

In tutto, ci sono nove combinazioni di trattamenti. La replica (ripetizione) di almeno una delle combinazioni di trattamenti, quando possibile, consente di testare la significatività statistica dei termini nel modello. In questo esempio, l'esperimento consiste di 12 test, o esecuzioni: nove combinazioni di trattamenti più tre repliche. Per garantire che i risultati non siano influenzati da fonti di variazione esterne all'esperimento, si eseguono le prove in ordine casuale e si registrano i risultati.

Tabella che registra 12 esecuzioni in ordine casuale e risultati corrispondenti

I risultati di questo esperimento indicano che la resa massima (91%) si ottiene quando la temperatura è di 45°C e il pH è di 8, il che rappresenta un miglioramento rispetto ai migliori risultati dell'esperimento OFAT (dove la resa massima era dell'86%). È possibile che ci sia una combinazione non testata di impostazioni per la temperatura e il pH all'interno della regione sperimentale che produrrebbe una resa ancora più elevata? Come risponderesti a quella domanda senza eseguire ulteriori test?

Quando si analizzano i dati, si costruisce un modello statistico che descrive la relazione tra temperatura, pH e resa. Questo è un modello interpolante, il che significa che puoi usarlo per fare previsioni a combinazioni non testate dei fattori entro la regione sperimentale. Il modello include termini per gli effetti individuali di temperatura e pH, le loro interazioni e i loro effetti quadratici, dove i βs sono i coefficienti stimati:

$$ previsto\:Resa = \beta_0 + \beta_1 Temp + \beta_2 pH + \beta_{12} Temp * pH + \beta_{11} Temp^2 + \beta_{22} pH^2 $$

In questa visualizzazione della risposta, la forma è diversa da quella indicata dai dati OFAT. Invece di diminuire dal centro della regione sperimentale, si può osservare che la superficie si alza e si torce con l'aumento della temperatura e del pH. La torsione suggerisce interazioni tra i due fattori: qualcosa che non è stato, e non poteva essere, rilevato dall'esperimento OFAT.

Grafico tridimensionale che mostra la relazione tra ciascun fattore e la risposta basata sui metodi di test DOE

È possibile utilizzare questo modello per fare previsioni sui valori futuri di resa e, in particolare, per trovare le impostazioni di temperatura e pH all'interno della regione sperimentale che si prevede massimizzino la resa. In questo esempio, il modello prevede che la resa sarà massimizzata al 92% quando la temperatura è impostata a 45°C e il pH è impostato a 7: una combinazione che non è stata testata direttamente.

Grafico che evidenzia le impostazioni ottimali previste dal modello DOE

Naturalmente, vorrai confermare questa previsione eseguendo alcuni altri test con le impostazioni dei fattori che prevedono la massima resa!

In questo esempio, l'esperimento OFAT iniziato con le impostazioni correnti del processo non ha trovato le impostazioni migliori per massimizzare la resa e non ha fornito i dati necessari per valutare se esiste un'interazione tra temperatura e pH. In effetti, il metodo OFAT non è riuscito a cogliere il comportamento reale del sistema.

L'unico modo per trovare quelle impostazioni con il metodo OFAT sarebbe stato testare ogni possibile combinazione di trattamenti all'interno della regione sperimentale. In questo scenario ciò significherebbe 49 test separati, e questo considerando che c'erano solo due fattori. Immagina quanti test richiederebbe questo approccio in una situazione più realistica in cui hai cinque, dieci o più fattori!

Nel nostro esempio precedente, l'esperimento progettato ha consentito di adattare un modello che includeva la possibile interazione tra temperatura e pH e di fare previsioni sull'intera regione sperimentale senza dover testare ogni possibile combinazione dei fattori. In questo modo, è stato possibile trovare le impostazioni migliori con molte meno esecuzioni rispetto a quelle necessarie per testare tutte le combinazioni (12 contro 49, ovvero circa il 25%). Questo era un semplice esempio con un numero molto limitato di fattori. I vantaggi dell'impiego del DOE aumentano con l'aumentare del numero di fattori.