Probabilità e odds non sono termini interscambiabili, anche se misurano concetti simili tra loro. In questo articolo troverai un esempio concreto di cosa li distingue, di come interpretarli in modo corretto ed anche di come passare da un indice all’altro.
Indice
Odds e probabilità: due scale diverse per lo stesso fenomeno
Sia gli odds che le probabilità sono due valori che si riferiscono alla frequenza con cui un determinato evento si verifica. Per farti capire meglio, puoi pensare a questi due termini come a delle scale diverse che misurano lo stesso fenomeno.
Ad esempio, per misurare la temperatura puoi utilizzare sia in gradi Celsius che in gradi Fahrenheit. Il valore espresso in una scala può essere convertito nell’altra tramite una formula, ma questo non significa che 32° Celsius equivalgono a 32° Fahrenheit.
In altre parole, se controllando velocemente le previsioni meteo prima di un viaggio, leggi che nella tua destinazione ci saranno 32° gradi, mettere in valigia solo t-shirt e bermuda potrebbe essere perfetto se i gradi erano espressi in scala Celsius, ma una pessima idea se erano espressi in scala Fahrenheit (32° Fahrenheit corrispondono infatti a 0° gradi Celsius).
Che cosa si intende per successo in statistica?
In generale, per poter misurare la probabilità che si verifichi un qualsiasi evento, hai bisogno di sapere due cose: quante volte quell’evento è successo e quante volte sarebbe potuto accadere.
In statistica, se l’evento si verifica si parla di “successo”, indipendentemente che sia o meno un buon risultato. Ad esempio, un successo potrebbe essere il conseguimento della laurea ma anche l’essere ricoverati in ospedale o addirittura la morte.
In modo del tutto complementare, se l’evento non si verifica, in statistica si parla invece di “insuccesso”. E, poiché ogni prova deve concludersi con un successo o un insuccesso, sommando il numero di successi e il numero di insuccessi otteniamo il numero totale di prove.
Definizione di odds e probabilità
A questo punto dovrebbe esserti più facile comprendere la differenza tra le due definizioni:
- La probabilità indica il numero di successi rispetto al numero totale di prove.
- L’odds indica invece il numero di successi rispetto al numero di insuccessi.
Ad esempio, immagina che il tuo obiettivo sia prevedere la probabilità che un pedone attraversi fuori dalle strisce pedonali in un determinato tratto di strada. In questo caso, potremmo considerare ogni pedone che attraversa la strada in quello specifico tratto in un anno come una prova. Ogni prova può avere solo due esiti:
- Il pedone attraversa fuori dalle strisce (successo)
- Il pedone attraversa sulle strisce (insuccesso).
In questo esempio, visto che l’obiettivo è prevedere la probabilità di attraversare fuori dalla strisce, questo sarà infatti l’evento di interesse. Ovvero quello che in statistica è definito successo.
Calcolo odds e probabilità: un esempio pratico
Al termine dell’anno, analizzando i dati forniti da alcune telecamere posizionate lungo la strada, risulta che in quel tratto in tutto hanno attraversato 10’000 pedoni, di cui 2’500 fuori dalle strisce (numero di successi)
La probabilità di successo (attraversamento fuori dalle strisce) è quindi: 2’500/10’000=0,25=25%
Per calcolare l’odds di successo, ci serve invece prima ricavare il numero di insuccessi.
Dal momento che abbiamo detto che ogni prova (passaggio d’auto all’incrocio) può avere solo due esiti, possiamo calcolare il numero di insuccessi come: 10’000-2’500=7’500. Questo numero corrisponde a quanti pedoni durante l’anno hanno attraversato sulle strisce nel tratto di strada monitorato.
A questo punto abbiamo tutto quello che ci serve per calcolare l’odds:
L’odds di successo (incidente) è: 2’500/7’500=0,33
Questo valore può essere interpretato come numero di successi per ogni insuccesso. In altre parole, l’odds=0,33 ci sta dicendo che per ogni 3 pedoni che attraversano sulle strisce, c’è ne è uno che attraversa fuori dalle strisce.
Se volessimo rappresentare graficamente questi valori, potremmo disegnare 4 omini stilizzati, ognuno dei quali rappresenta un gruppo di 2500 pedoni che hanno attraversato quel tratto di strada durante l’anno. Di questi, uno lo possiamo differenziare dagli altri colorandolo in giallo per indicare che ha attraversato fuori dalle strisce.
Che valori possono assumere odds e probabilità?
Queste due misure hanno due diversi range di riferimento:
- L’odds è un numero compreso tra 0 e più infinito.
- La probabilità è un numero compreso tra 0 e 1 (o, se espressa in percentuale, tra 0% e 100%).
Un odds di 1 indica che successo ed insuccesso hanno la stessa probabilità di accadere (ovvero corrisponde ad una probabilità del 50%).
Se l’odds è maggiore di 1, significa che è più probabile che si verifichi il successo rispetto all’insuccesso. Viceversa, se l’odds è minore di 1 significa che è più probabile che si verifichi l’insuccesso rispetto al successo (come nell’esempio qui sopra).
Che relazione c’è tra odds e probabilità?
Dire che l’odds è dato dal rapporto tra numero di successi e numero di insuccessi, equivale a dire che l’odds è dato dal rapporto tra la probabilità di successo e quella di insuccesso. Poiché abbiamo detto che:
- Probabilità di successo=numero di successi/numero totale di prove
- Probabilità di insuccesso=numero in insuccessi/numero totale di prove
queste due probabilità hanno lo stesso denominatore che quindi, per costruzione matematica, si elide nel momento in cui si fa il rapporto tra le due probabilità.
Riprendendo l’esempio di prima:
- La probabilità di successo è del 25%
- La probabilità di insuccesso è del 75% (ovvero il complemento al 100% della probabilità di successo).
L’odds si può quindi anche calcolare come: 25%/75%=0.33
A cosa servono gli odds?
La probabilità è sicuramente un concetto molto più intuitivo degli odds. Perché allora gli statistici complicano le cose riportando nei risultati delle analisi gli odds invece delle probabilità?
Uno dei motivi è che quando le probabilità si avvicinano molto ai valori estremi (cioè allo 0% oppure al 100%), è in realtà più facile coglierne le differenze confrontando gli odds rispetto alle probabilità.
Pensa, ad esempio, se l’evento definito come successo fosse l’incidente d’auto ad un determinato incrocio. Dire che la probabilità che un’auto faccia un incidente a quell’incrocio è di 0.0001 oppure di 0.000001 intuitivamente non rende bene l’idea della differenza.Ma se esprimi lo stesso dato in odds, risulta più immediato cogliere la differenza tra 1 a 9.999 e 1 a 999.999.
In secondo luogo, nella regressione logistica l’unico modo per esprimere l’effetto costante di un predittore continuo è con un odds ratio. E l’odds ratio non è nient’altro che il rapporto tra due odds.
E adesso?
La terminologia statistica è spesso la parte che crea più confusione tra chi si approccia all’analisi dati. Il traduttore statistichese-italiano è la guida in formato pdf che ho personalmente creato proprio per aiutarti a comprendere esattamente cosa significano e quando si utilizzano 10 delle espressioni statistiche più ricorrenti. Scaricala subito, è gratis!