Ipotesi nulla: cosa significa?

23 Ottobre 2021 | Analisi dati

L’ipotesi nulla è l’ipotesi che deve essere rifiutata o meno in un test d’ipotesi. In questo articolo scoprirai perché è importante conoscerla, quando rifiutarla e cosa questo significa.

test ipotesi nulla

Che cos’è l’ipotesi nulla

L’ipotesi nulla è una delle due alternative, tra loro mutualmente esclusive, di un test d’ipotesi su una popolazione.

Il modo in cui gli statistici la trattano è simile a come i tribunali trattano, o almeno dovrebbero trattare, i sospettati. Puoi infatti pensare alle prove raccolte per formulare un giudizio su un imputato come ai dati del campione che saranno utilizzati per calcolare la statistica test che ti permetterà di formulare un giudizio su un’ipotesi statistica. Se nel tribunale è la giuria a deliberare un verdetto sull’innocenza o meno del sospettato, nel test d’ipotesi è la regola decisionale (ovvero il confronto tra p ed alpha, come vedremo) a deliberare a favore o contro l’ipotesi nulla.

Una persona è innocente fino a che non ci sono abbastanza prove a favore della sua colpevolezza. Allo stesso modo, si accetta l’ipotesi nulla finché non c’è abbastanza evidenza a favore dell’ipotesi alternativa. Nell’esempio del tribunale, l’ipotesi alternativa è che il sospettato sia colpevole.

Insomma, le due ipotesi (innocente o colpevole, nulla ed alternativa) non hanno lo stesso peso su una bilancia.

In base al principio di innocenza presunta, infatti, un giudice può condannare un imputato solo se si palesa colpevole al di là di ogni ragionevole dubbio. Ovvero, fissando una bassa probabilità di errore di I tipo. Allo stesso modo, in base al principio di non effetto, tu puoi rifiutare questa ipotesi solo quando si palesa essere falsa con almeno una probabilità pari ad 1-alpha (in genere, 95%).

La decisione che viene presa è infatti sempre soggetta ad errore, che in statistica sono denominati:

  • errore di I tipo (alpha): rifiuti l’ipotesi nulla quando è in realtà è vera. Ovvero, condanni una persona che in realtà è innocente
  • errore di II tipo (beta): non rifiuti l’ipotesi nulla quando in realtà è falsa. Equivale a giudicare innocente una persona che in realtà è colpevole, cioè al rischio che ti prendi di lasciare in libertà un criminale. La potenza del test (in genere 80% o 90%) equivale a 1-beta. Ovvero alla probabilità di giudicare colpevole una persona che effettivamente lo è.

A cosa corrisponde?

Da un punto di vista di simboli:

  • H0 indica l’ipotesi nulla
  • HA oppure H1 indica l’ipotesi alternativa

Il suo significato invece cambia a seconda della tecnica statistica utilizzata.

Confronto medie

In un test per il confronto tra le medie dei gruppi (come un t-test o un ANOVA), è che non ci sia differenza nella popolazione tra le medie dei gruppi. In altre parole, che la differenza tra le medie nella popolazione sia pari a 0. Ad esempio, ipotizziamo che tu voglia confrontare il peso medio di due gruppi indipendenti di pazienti (controllo e trattamento). In questo caso, l’ipotesi nulla sarà che non vi è differenza tra il peso medio registrato nei due gruppi.

Confronto proporzioni

Nel test per il confronto tra due proporzioni (come il test Z o il test del chi quadrato), è che nella popolazione non ci sia differenza tra le due proporzioni. In altre parole, che la differenza tra le due proporzioni nella popolazione sia pari a 0. Ad esempio, supponi che il tuo obiettivo sia confrontare la proporzione di studenti che hanno superato l’esame di statistica al primo appello in due diversi corsi di laurea. L’ipotesi nulla sarà che la proporzione è la stessa nei due gruppi.

Correlazione e regressione

In un test sulla correlazione lineare, così come in un modello di regressione lineare, è invece che non ci sia una relazione lineare tra le variabili. In altri termini, che il coefficiente di correlazione, così come quello di regressione, sia pari a 0. Ad esempio, immagina che la tua ipotesi di ricerca sia il verificare se c’è una relazione tra la quantità di carote mangiate ed il tempo impiegato per abbronzarsi. L’ipotesi nulla sarà che non c’è nessuna relazione tra queste due variabili.

Odds ratio

In un test sull’odds ratio, è invece che i due gruppi abbiano la stessa probabilità, ovvero che l’odds ratio sia pari a 1. Ad esempio, ipotizza che tu voglia capire se i laureati, rispetto ai diplomati, abbiano una probabilità maggiore di trovare lavoro entro 6 mesi dal termine degli studi. L’ipotesi nulla sarà che l’odds dei laureati è uguale all’odds dei diplomati, e quindi il rapporto tra odds sarà 1.

Normalità distributiva

In un test sulla normalità distributiva (ad esempio Shapiro-Wilk o Kolmogorov-Smirnov), corrisponde all’ipotesi che la distribuzione della variabile nella popolazione sia approssimabile ad una Normale.

Omogeneità varianze

Nel test sull’omogeneità delle varianze (ad esempio, Levene o Bartlett), è che i gruppi nella popolazione abbiano la stessa variabilità. In altre parole, che la differenza tra le loro varianze sia pari a 0.

Quando si rifiuta l’ipotesi nulla?

Per decidere se rifiutarla o meno, come prima cosa devi effettuare un test d’ipotesi sui dati che hai raccolto. Il test d’ipotesi è una procedura statistica che ti permette di trarre conclusioni su una popolazione partendo dai dati osservati in un campione. Nel ragionamento che è alla base dei test statistici ci si chiede, infatti, cosa succederebbe se ripetessimo molte volte il campionamento effettuato per ottenere i dati che sono stati raccolti per effettuare l’analisi statistica.

Tra i risultati di questo test, osserva quindi il valore del p-value. Il p-value è il valore di probabilità che ti aiuta a decidere se accettare o rifiutare proprio questa ipotesi nulla. Questa probabilità, infatti, ti permette di quantificare con quanta evidenza i dati raccolti non contraddicono l’ipotesi nulla:

  • l’ipotesi nulla si rifiuta quando il p-value è minore del livello di significatività prefissato (alpha). Per ricordarlo più facilmente, gli inglesi utilizzano questa frase “When the p-value is low, the null must go!”
  • non si rifiuta l’ipotesi nulla nel caso opposto. In altre parole, quando il p-value è maggiore del livello di significatività. “When the p-value is high, the null must fly!”

In altre parole, il p-value ti dice quanto è probabile osservare un effetto come quello presente nei dati campionati quando è vera l’ipotesi nulla.

Rifiutare l’ipotesi nulla: cosa significa in pratica?

  • L’ipotesi nulla è che i dati non forniscono abbastanza prove a favore dell’ipotesi che l’effetto (o relazione) osservato nel campione esista anche nella popolazione. In altre parole, il risultato trovato con i dati campionari non può essere generalizzato in quanto c’è un ragionevole dubbio che sia dovuto solo al caso.
  • L’ipotesi alternativa è che l’effetto osservato nel campione esiste con elevata probabilità anche nella popolazione.

Quando il campione contiene sufficiente evidenza di un effetto, puoi rifiutare l’ipotesi nulla e concludere che l’effetto è statisticamente significativo.

Ipotesi nulla: e adesso?

Hai già scaricato la guida gratuita a 10 tra i termini statistici più utilizzati? Ti aiuterà a fare chiarezza ed a comprendere meglio cosa significano in pratica alcune delle espressioni statistiche che più si utilizzano nel corso di un’analisi dati. Buona lettura!

Articoli correlati

Paola Pozzolo

Paola Pozzolo

Sono Paola Pozzolo e mi occupo di consulenze e formazione statistica. Ti aiuto a trasformare i dati in informazioni utili ed affidabili per raggiungere i tuoi obiettivi di ricerca e prendere le decisioni che più valorizzeranno il tuo lavoro.