P-value: come si calcola con un software statistico?

7 Marzo 2020 | Analisi dati

Il p-value è ovunque: lo trovi negli articoli scientifici, nelle tesi di laurea ed ovviamente anche negli esami di statistica. In questo articolo non ti annoierò con formule complicate e terminologia tecnica. Ti mostrerò, invece, tramite esempi pratici ed un linguaggio comprensibile, il metodo che in solo 4 passaggi ti permetterà di calcolare velocemente il p-value con un qualsiasi software statistico.

p-value: come calcolarlo in 4 passaggi

In statistica non esiste una funzione denominata p-value perché il calcolo di questa probabilità varia a seconda del tipo di test di verifica d’ipotesi che viene utilizzato.

Come prima cosa, per calcolare il p-value è necessario quindi scegliere il test statistico più adatto per i dati che si hanno a disposizione e per gli obiettivi che si vogliono raggiungere. Se non hai ancora chiari gli obiettivi del tuo progetto, ti consiglio di leggere prima questo articolo sull’analisi dati che ti aiuterà a definire con maggiore precisione il tipo di ricerca da effettuare.

Test d’ipotesi: come funziona

Per calcolare un p-value come prima cosa serve costruire un test d’ipotesi.

Il test d’ipotesi è una procedura statistica che ti permette di trarre conclusioni su una popolazione partendo dai dati osservati in un campione

Questo test valuta due ipotesi opposte tra loro riguardo la popolazione. Queste due ipotesi sono chiamate:

  • ipotesi nulla
  • ipotesi alternativa

Di solito, l’ipotesi nulla è rappresentata da un’affermazione del tipo “non si riscontra alcun effetto” oppure “non ci sono differenze” ed è l’ipotesi che si certa di confutare. Al contrario, l’ipotesi alternativa è rappresentata da un’affermazione del tipo “si riscontra un effetto” oppure “ci sono differenze”.

L’obiettivo del test d’ipotesi è cercare se ci sono abbastanza evidenze contro l’ipotesi nulla.

Nel ragionamento che è alla base dei test statistici ci si chiede cosa succederebbe se ripetessimo molte volte il campionamento effettuato per ottenere i dati che sono stati raccolti per effettuare l’analisi statistica.Si ipotizza quindi che la popolazione da cui è stato estratto il campione abbia una certa caratteristica (questa sarà l’ipotesi nulla) e si vede se i dati rappresentano una prova evidente contro questa ipotesi.

Il p-value è il valore di probabilità che ti aiuta a decidere se accettare o rifiutare proprio questa ipotesi nulla. Quando rifiuti l’ipotesi nulla, si dice che i risultati sono statisticamente significativi.

P-value: definizione

Spesso per spiegare il p-value viene utilizzata una terminologia complessa ma l’idea di base in realtà è molto semplice: se il risultato che hai osservato si verifica molto raramente se una certa ipotesi fosse vera allora è verosimile che quell’ipotesi in realtà sia falsa .

Per rendere più preciso il significato di “verosimile” è stato introdotto il concetto di p-value. P-value significa valore di probabilità e, come tutte le probabilità, è sempre compreso tra 0 ed 1.

Il p-value ti dice quanto è probabile osservare dei dati come quelli del campione che stai analizzando quando è vera l’ipotesi nulla.

P-value basso: cosa significa

Quando il p-value è basso (cioè vicino a 0) si dice che il risultato è statisticamente significativo. Una probabilità molto vicina a 0 indica che è molto improbabile osservare i dati del tuo campione quando è vera l’ipotesi nulla. Il valore del p-value ti dice esattamente quanto è improbabile.

Ecco due esempi pratici per capirci meglio. Ipotizziamo che hai effettuato un test statistico per confrontare il valore di due medie. Se ottieni:

  • p-value = 0,04 puoi affermare che: se la differenza tra le due medie è nulla nella popolazione, il 4% degli studi su campioni estratti da tale popolazione mostrerà una differenza tra le medie pari o superiore a quella osservata nel tuo campione.
  • p-value = 0,001 puoi affermare che: se la differenza tra le due medie è nulla nella popolazione, lo 0,1% degli studi su campioni estratti da tale popolazione mostrerà una differenza tra le medie pari o superiore a quella osservata nel tuo campione.

Come puoi notare, c’è una bella differenza tra le due affermazioni. Per questo motivo quando un p-value è molto basso ti consiglio sempre di riportarne il valore preciso e di non limitarti a dire che il risultato è statisticamente significativo.

P-value elevato: come si interpreta

Un p-value è tanto più elevato quanto più il suo valore si allontana da 0 e si avvicina ad 1.

Spesso, per aiutare gli studenti a decidere cosa è elevato e cosa no, in molti libri e corsi di statistica viene introdotta una soglia di accettazione, denominata alpha. Secondo questo approccio, se il p-value è minore di alpha, si rifiuta l’ipotesi nulla. Se il p-value è maggiore di alpha invece si dice che il risultato non è statisticamente significativo.

Tuttavia, alpha e p-value sono due concetti diversi che sarebbe meglio non confondere tra loro:

  • Alpha indica la probabilità di errore di I tipo, cioè la probabilità di rifiutare l’ipotesi nulla quando in realtà l’ipotesi nulla è vera
  • P-value indica la probabilità di osservare un valore come quello osservato nel campione o più estremo quando è vera l’ipotesi nulla

P-value pari ad 1: come si interpreta

Otterrai un p-value pari esattamente ad 1 quando la statistica su cui stai svolgendo il test (es. la media) coincide esattamente con l’ipotesi nulla. Ad esempio, se l’ipotesi nulla è che la media è pari a 30 e nel tuo campione hai ottenuto che la media è pari esattamente a 30, allora il p-value sarà pari ad 1. In questo caso, si dice che il risultato del test non è statisticamente significativo.

Test del Chi quadro per il confronto tra due proporzioni.

A 400 infermieri, 250 in servizio presso l’ospedale A e 150 in servizio presso l’ospedale B, è stato chiesto se fossero favorevoli o sfavorevoli alla creazione di un ambulatorio dedicato alle terapie complementari presso la propria struttura ospedaliera. Dall’analisi delle risposte è emerso che il 60% degli infermieri che lavorano nell’ospedale A ed il 53% degli infermieri che lavorano nell’ospedale B hanno espresso un parere favorevole alla creazione dell’ambulatorio.

 FavorevoliContrariTotale
Ospedale A150100250
Ospedale B8070150

Per ottenere il p-value e valutare se ci sia una differenza statisticamente significativa tra il 60% di infemrieri favorevoli nell’ospedale A ed il 53% di infermieri favorevoli nell’ospedale B puoi seguire questi 4 passaggi:

1 – Costruisci il sistema d’ipotesi

In questo esempio, l’ipotesi nulla sarà l’assenza di differenza tra le proporzioni di favorevoli nei due gruppi di infermieri (quelli che lavorano nell’ospedale A e quelli che lavorano nell’ospedale B). L’ipotesi alternativa sarà la presenza di differenza tra le proporzioni di infermieri favorevoli nei due gruppi.

2- Scegli il tipo di test da utilizzare

Per il confronto di due variabili qualitative, i test si basano sul confronto tra le frequenze osservate nella tabella e le frequenze “teoriche” chi si avrebbero se non ci fossero differenze tra i due gruppi. In questo esempio, il test prescelto è il test del Chi quadro.

3 – Effettua il test con un software statistico ed individua il valore del p-value

Con i dati dell’esempio, il risultato che si ottiene selezionando il Test del Chi quadro per tabelle di contingenza è:
Chi quadro=1,705; gdl=1; p-value=0,19

4 – Trai le conclusioni

Nel caso del confronto tra proporzioni, l’ipotesi nulla è l’assenza di differenza tra le proporzioni e p-value=0,19 significa che i dati sono consistenti con H0.

In altre parole, se H0 fosse vera, sarebbe abbastanza frequente (p=19%, quasi 1 su 5!) ottenere dati campionari come quelli osservati. Accettare l’ipotesi nulla significa quindi affermare che la differenza osservata tra le proporzioni di infermieri favorevoli nei due ospedali (150/250 e 80/150) non sia statisticamente significativa.

Non è quindi possibile affermare che gli infermieri che lavorano nell’ospedale A siano più favorevoli alla creazione dell’ambulatorio rispetto a quelli che lavorano nell’ospedale B. Questo non significa che la proporzione di infermieri favorevoli sia uguale tra i due ospedali, ma solo che non c’è evidenza che la differenza tra le proporzioni sia statisticamente significativa.

Test t di Student per il confronto tra due medie

In un campione di 80 individui, il numero medio di battiti a riposo dei maschi è risultato essere pari a 70 bpm, mentre nelle femmine è risultato essere pari a 75bpm.

Se la differenza osservata nel campione fosse casuale (ovvero, nella popolazione maschi e femmine avessero in realtà lo stesso numero medio di battiti cardiaci), quale sarebbe la probabilità che, estraendo un campione della stessa numerosità di quello analizzato, si verifichi una differenza tra le medie dei due gruppi?

Come nell’esempio precedente, per valutare la significatività statistica di questa differenza di 5 bpm (75bpm-70bpm) osservata nel campione è necessario seguire questi 4 passaggi:

1 – Costruisci il sistema d’ipotesi

In questo caso, l’ipotesi nulla sarà l’assenza di differenza tra le medie dei battiti cardiaci per i due gruppi (maschi e femmine), mentre l’ipotesi alternativa sarà la presenza di differenza tra le medie dei battiti cardiaci dei due gruppi.

2 – Scegli il tipo di test da utilizzare

In questo esempio, la variabilità dai gruppi era simile, la distribuzione dei dati era Normale e non erano presenti valori anomali (outliers). Quando si verificano queste condizioni, come test per il confronto tra due medie si può utilizzare il test parametrico t di Student per campioni indipendenti.

3 – Effettua il test con un software statistico ed individuare il valore del p-value

In questo esempio, selezionando sul software statistico il test t di Student tra i test parametrici per campioni indipendenti si ottiene un p-value pari a 0,003.

4- Trai le conclusioni

In questo caso, il p-value è molto vicino a 0. Questo significa che, se l’ipotesi nulla fosse vera (non c’è differenza tra il n. medio di battiti a riposo di maschi e femmine), sarebbe altamente improbabile (p=0,3%!) ottenere dati campionari come quelli osservati. E’ possibile allora rifiutare l’ipotesi nulla ed affermare che la differenza osservata tra il numero di battiti medi a riposo sia statisticamente significativa.

Ipotesi nulla ed alternativa: attenzione a non confonderle!

In un test di significatività, si presume che l’ipotesi nulla sia vera a meno che i dati non producano una forte evidenza contro questa ipotesi. Nei due esempi precedenti, l’ipotesi nulla era l’assenza di differenza tra i due gruppi, mentre l’ipotesi alternativa era la presenza di differenza tra i due gruppi rispetto alla variabile considerata (essere favorevole o contrario all’ambulatorio nel primo esempio, il n. di battiti a riposo nel secondo caso).

Nel caso dei test per il confronto tra varianze, l’ipotesi nulla è che le varianze siano omogenee mentre l’ipotesi alternativa è che ci sia differenza tra le varianze e quindi tra le variabilità dei gruppi.

Nel caso dei test di normalità, l’ipotesi nulla è che la variabile sia distribuita secondo una Normale, mentre l’ipotesi alternativa è che la variabile non abbia una distribuzione Normale.

Per una corretta interpretazione del p-value, non dimenticare quindi di verificare nella documentazione del software che stai utilizzando quali siano le ipotesi nulla ed alternativa del test che stai considerando.

Come riportare il p-value quando è significativo

Quando possibile, riporta sempre il p-value, piuttosto di limitarti a indicare genericamente che i risultati sono statisticamente significativi. Conoscere il valore del p-value è molto più informativo del conoscere semplicemente se il test è statisticamente significativo o meno al livello 0,05.

Come abbiamo visto, sia un p-value di 0,04 che un p-value di 0,001 sarebbero entrambi significativi in questo senso, ma il primo p-value fornisce rispetto al secondo p-value un’evidenza molto più forte riguardo al fatto che i risultati sono statisticamente significativi.

Inoltre, più il p-value è basso, più la probabilità che i risultati dello studio siano riproducibili è alta. In altre parole, se provi a rifare da capo una ricerca già pubblicato, estraendo un campione con le stesse caratteristiche di quello di partenza, la probabilità di arrivare alle stesse conclusioni sarà tanto più alta quanto più il p-value ottenuto nella ricerca di riferimento è basso.

E adesso?

In questo articolo abbiamo visto il metodo da seguire per calcolare velocemente il p-value per un qualsiasi test statistico.

Ricapitolando: come prima cosa costruisci il sistema d’ipotesi definendo prima l’ipotesi alternativa e poi di conseguenza l’ipotesi nulla. Poi scegli il tipo di test da utilizzare in base alle caratteristiche dei tuoi dati. Quindi esegui il test con un software statistico. Puoi farlo gratuitamente e senza scrivere codice ad esempio con R Commander. Infine, interpreta il risultato ottenuto e trai le conclusioni.

E se dovessi avere ancora dei dubbi sul tipo di test o di software da utilizzare, ricordati che c’è la consulenza statistica check-up (link) pensata appositamente per revisionare i tuoi dati e chiarirti le idee sui passaggi da fare per proseguire poi in autonomia le tue analisi.

Paola Pozzolo

Paola Pozzolo

Sono Paola Pozzolo e mi occupo di consulenze e formazione statistica. Ti aiuto a trasformare i dati in informazioni utili ed affidabili per raggiungere i tuoi obiettivi di ricerca e prendere le decisioni che più valorizzeranno il tuo lavoro.