Potenza statistica e test d’ipotesi

7 Novembre 2020 | Analisi dati

La potenza di un test statistico ti permette di controllare la probabilità di prendere decisioni errate, di valutare l’attendibilità di uno studio e di determinare quale è la numerosità campionaria necessaria per ottenere risultati statisticamente significativi. Scopri come in questo articolo.

confronto potenza statistica

Test d’ipotesi: come funzionano

In statistica, i test d’ipotesi si basano su un’ipotesi nulla e su un’ipotesi alternativa ed hanno come obiettivo quello di accettare l’ipotesi nulla quando è vera e di rifiutarla quando è falsa.

Tuttavia, questi test statistici si basano sulle probabilità e, come sempre quando si è nel mondo delle probabilità e non delle certezze, pertanto resta sempre un margine di errore.

Questa incertezza è dovuta al fatto che i test statistici si utilizzano quando i dati raccolti riguardano solo una parte della popolazione (il campione statistico). In questi casi, non potendo sapere di preciso cosa avviene per l’intera popolazione, l’unica cosa che si può fare è valutare l’efficacia del test basandosi su quanto è grande la probabilità di errore.

Errori di I e di II tipo

La probabilità di commettere un errore nel decidere se accettare o rifiutare l’ipotesi nulla può essere di due tipologie.

Errore di I tipo

E’ la probabilità di rifiutare l’ipotesi nulla quando in realtà è vera. In pratica, questo errore si verifica quando la procedura di verifica delle ipotesi ti porta a dire che i tuoi dati supportano l’ipotesi di ricerca (cioè l’ipotesi alternativa) quando nella realtà questa ipotesi di ricerca è falsa.

Errore di II tipo

E’ la probabilità di accettare l’ipotesi nulla quando in realtà è falsa. In pratica, questo errore si verifica quando la procedura di verifica delle ipotesi ti porta a dire che i risultati di uno studio non sono conclusivi (cioè che non si può rifiutare l’ipotesi nulla) quando in realtà l’ipotesi di ricerca (cioè l’ipotesi alternativa) è vera.

In generale, si vorrebbe che la probabilità di incorrere in un errore di I tipo fosse bassa. Detto in altre parole, quando l’ipotesi alternativa è falsa, non si vorrebbe ottenere un risultato statisticamente significativo. Il che corrisponde a dire che si vorrebbe che la probabilità di accettare l’ipotesi nulla quando è vera fosse alta. Queste due probabilità sono controllabili direttamente all’interno del test d’ipotesi attraverso l’impostazione del livello di significatività alpha.

Ma si vorrebbe anche che, quando l’ipotesi nulla è falsa, la probabilità di rifiutarla fosse elevata. Che, in altri termini, significa che si vorrebbe che la probabilità di errore di II tipo fosse bassa. Queste due probabilità sono controllabili attraverso l’impostazione della potenza del test.

Questa impostazione però non può essere fatta al momento della creazione del test ma deve essere tenuta in considerazione già al momento del disegno della ricerca attraverso l’impostazione della potenza statistica dello studio.

Potenza statistica: che cos’è in pratica

La potenza statistica è la probabilità che un test produrrà un risultato statisticamente significativo quando l’ipotesi alternativa è vera. In altre parole, la potenza dei un test è la sua probabilità di rifiutare l’ipotesi nulla quando l’ipotesi nulla è falsa ed è il complemento a uno della probabilità di errore di II tipo.

Come tutte le probabilità, anche la potenza statistica è un valore sempre compreso tra 0 ed 1. Più la potenza si avvicina a 0, più si dice che il test è poco potente. Più il valore si avvicina ad 1, più si dice che il test è potente.

Ad esempio, i test non parametrici sono meno potenti degli equivalenti test parametrici perché il loro valore di potenza è più basso. Questo è il motivo per cui, quando le ipotesi alla loro base sono verificate, è preferibile utilizzare i test parametrici. Tuttavia, quando le ipotesi non sono verificate, allora i test parametrici perdono di potenza e pertanto in questi casi si preferisce utilizzare i test non parametrici.

Potenza statistica: che valore impostare

In pratica, l’ideale sarebbe che la tua ricerca avesse una potenza alta (ad esempio 0,80 o 0,90) ed un livello di significatività basso (ad esempio 0,05 o 0,01).

Ad esempio, adottare un livello di significatività di 0,05 garantisce che un’ipotesi nulla vera venga rifiutata, in media, soltanto una volta su 20. Mentre un livello di significatività pari a 0,01 garantisce che, in media, venga rifiutata l’ipotesi nulla quando nella realtà è vera solo in 1 caso su 100.

La probabilità di rifiutare correttamente l’ipotesi nulla quando è vera l’ipotesi alternativa (ovvero la potenza del test) non è invece un numero costante ma varia in base ai valori del parametro che si sta testando. Esistono infatti tanti valori di potenza quanti sono i possibili valori che può assumere il parametro che si sta studiando quando non è vera l’ipotesi nulla.

Potenza statistica: esempio per un test sulla media

Per capire meglio, prendiamo come esempio un test statistico che ha l’obiettivo di valutare se una media sia diversa a 0. In questo caso l’ipotesi nulla sarà media=0 mentre l’ipotesi alternativa sarà media≠0.

La probabilità di rifiutare correttamente l’ipotesi nulla sarà molto bassa quando la media della popolazione è un valore molto vicino a zero. Quando invece la media della popolazione è un valore molto lontano da zero, la probabilità di rifiutare correttamente l’ipotesi nulla sarà più alta.

Potenza statistica: da cosa dipende

La potenza del test dipende da diversi fattori, come:

  • il livello di significatività alpha (ovvero l’errore di I tipo)
  • la numerosità campionaria
  • la dimensione dell’effetto

Power analysis in statistica: quando si usa

L’analisi della potenza (in inglese, power analysis) si utilizza all’inizio di un progetto di ricerca per determinare una corretta numerosità campionaria.

Ogni volta che si inizia a fare una ricerca è necessario infatti prendere diverse decisioni: una di queste è proprio l’ampiezza del campione. La numerosità del campione dipende dalla dimensione dell’effetto che si vuole analizzare e dal rischio di errore che si è disposti ad accettare.

Un effetto “grande” può infatti essere rilevato anche con un campione di piccole dimensioni, mentre un effetto “piccolo” necessita di un campione più numeroso.

Il rischio di prendere una decisione sbagliata basandosi sui risultati di un test statistico dipende invece dall’errore di I e di II tipo e quindi dalla potenza. All’aumentare della numerosità del campione aumenta infatti anche la potenza del test, a parità di livello di significatività e di dimensione dell’effetto e variabilità del fenomeno.

Tuttavia, campioni più numerosi richiedono associati a costi e tempi più lunghe per le ricerche. Pertanto, un buon test è sempre un compromesso tra fattibilità (determinata alla numerosità campionaria) ed efficacia (determinata dal livello di significatività e dalla potenza del test).

Calcolo potenza statistica a posteriori

Al termine di un’analisi statistica, si dovrebbe sapere su quale numerosità campionaria è stata condotta, con quale livello di significatività α e la dimensione dell’effetto. Se le analisi sono state svolte in modo corretto si conoscono insomma i fattori necessari per stimare la potenza del test utilizzato, cioè la probabilità di aver fatto la scelta giusta. Tuttavia, il calcolo della potenza statistica a posteriori è una scelta sempre più criticata in letteratura perché soggetta a diversi bias e pertanto non te la consiglio.

Come alternativa, puoi basarti sull’osservazione degli intervalli di confidenza che ti permettono di avere un riscontro immediato della dimensione dell’effetto osservato.

Potenza statistica: e adesso?

Se hai dubbi su come determinare una corretta potenza statistica e dimensione campionaria per il tuo studio, non esitare a richiedere una consulenza check-up: una soluzione veloce, economica ed efficace per chiarirti i dubbi e proseguire in modo corretto le tue analisi dati.

Paola Pozzolo

Paola Pozzolo

Sono Paola Pozzolo e mi occupo di consulenze e formazione statistica. Ti aiuto a trasformare i dati in informazioni utili ed affidabili per raggiungere i tuoi obiettivi di ricerca e prendere le decisioni che più valorizzeranno il tuo lavoro.