Distribuzione di Bernoulli: quando si usa?

11 Settembre 2021 | Analisi dati

La distribuzione di Bernoulli è una distribuzione di probabilità che permette di studiare eventi che hanno solo due possibili esiti: successo o insuccesso. In questo articolo scoprirai quando si può utilizzare, a cosa serve e come calcolarne il valore atteso e la varianza.

distribuzione di probabilità statistica discreta di Bernoulli

Che cos’è una distribuzione di Bernoulli?

La distribuzione di Bernoulli è una distribuzione discreta di probabilità. Per poter capire come funziona, è pertanto necessario prima chiarirci su cosa si intende in statistica per probabilità, cosa si intende per distribuzione di probabilità e cosa si intende con quel “discreta”. Iniziamo?

Probabilità statistica

Con il termine probabilità, in statistica si intende:

  • Un numero sempre compreso tra 0 ed 1 (se espresso in percentuale, tra 0% e 100%)
  • Probabilità=0 corrisponde all’evento impossibile
  • Probabilità=1 corrisponde all’evento certo
  • Più il valore di probabilità si avvicina ad 1, più diventa plausibile che l’evento si verifichi
  • Più il valore di probabilità si avvicina a 0, più diventa raro che l’evento si verifichi
  • Un valore di probabilità pari a 0,5 indica che c’è la stessa probabilità che l’evento si verifichi e che non si verifichi. In altre parole, che la sua probabilità è pari esattamente al 50%. In questo caso, si parla anche di probabilità equa.

Distribuzione di probabilità

Una distribuzione di probabilità è l’insieme dei possibili risultati e delle corrispettive probabilità. In pratica, puoi pensarla come una distribuzione di frequenza, con la differenza che invece delle frequenze ci sono le probabilità.

Ad esempio, prima di lanciare una moneta non è possibile sapere se uscirà testa o croce. Però ci sono delle informazioni che conosci già prima di lanciarla:

  • L’insieme dei possibili risultati (testa o croce)
  • La probabilità associata a ciascun risultato (in questo caso, il 50% della probabilità sarà associato a testa, ed il restante 50% sarà associato a croce)

Capire a quale distribuzione di probabilità può essere associato un evento, permette di studiarlo.
Per la maggior parte delle distribuzioni di probabilità sono infatti disponibili delle formule matematiche che permettono di calcolare determinate probabilità di interesse. Per altre distribuzioni, per lo stesso scopo sono invece disponibili grafici o tabelle.

Questo è possibile perché una distribuzione di probabilità è definibile attraverso dei parametri che ne descrivono la media (detta anche valore atteso) e la varianza.

Distribuzione discreta di probabilità

La distribuzione di Bernoulli è caratterizzata da un unico evento che può avere solo due alternative: successo o fallimento. In termini tecnici, si parla di evento dicotomico. Per convenzione:

  • Il successo si indica con 1
  • L’insuccesso (detto anche fallimento) si indica con 0

Dal momento che ci sono solo un numero finito di possibili alternative, la distribuzione di Bernoulli è detta distribuzione discreta. La distribuzione Normale invece, ad esempio, è una distribuzione continua in quanto può assumere infiniti valori.

Esempi di eventi bernoulliani

Un primo esempio di evento che ha una distribuzione bernoulliana è il lancio di una moneta.

Altri esempi di eventi che hanno una distribuzione bernoulliana sono:

  • Il lancio di un dado, se ti interessa sapere se esce 4 o un numero diverso da 4
  • L’efficacia di un vaccino, se ti interessa sapere se sono presenti almeno tot anticorpi oppure no
  • Il manifestarsi di una malattia, se ti interessa sapere se il soggetto ha o non ha quella malattia
  • La difettosità di un pezzo, se ti interessa sapere se un pezzo è difettoso oppure no
  • La nascita di un bambino, se ti interessa sapere se è maschio o femmina
  • L’estrazione ad una lotteria, in cui il biglietto può essere vincente oppure no
  • L’entrata di un cliente in un negozio, se ti interessa sapere se farà acquisti oppure no
  • La posizione di un interruttore in un circuito, se ti interessa sapere se è chiuso (e quindi circola corrente) oppure aperto (e quindi non circola corrente)
  • La direzione da seguire, se ti interessa sapere se andare a destra oppure sinistra
  • L’invito ad uscire, se ti interessa sapere se la persona a cui l’hai chiesto risponderà “sì” oppure “no”.
  • L’offerta di cambiare operatore telefonico, che può essere accettata o rifiutata
  • Il voto ad un referendum, che può essere a favore o contro

Quando un evento è bernoulliano?

Per poter essere considerato un evento bernoulliano:

  • una delle due alternative si deve per forza verificare. In termini tecnici, si dice che le due alternative devono essere esaustive e tra loro complementari
  • le due alternative non possono verificarsi contemporaneamente. In gergo, si dice che le due alternative devono essere tra loro mutualmente esclusive

Il parametro p

Immagina di trovarti con un tuo amico al bar, e che entrambi vogliate offrire un caffè all’altro. Per decidere chi paga, optate per lanciare una moneta. Se esce testa decidi tu chi paga mentre se esce croce decide lui. In questo caso, per te “testa” corrisponderà al successo (e quindi ad 1), mentre “croce” all’insuccesso (e quindi a 0).

La probabilità di successo si indica con la lettera p

La probabilità di fallimento si indica con la lettera q, oppure semplicemente con 1-p

Se la moneta non è truccata, la probabilità che esca testa (ovvero la probabilità di successo) sarà pari a 0.5 e la probabilità che esca croce (probabilità di insuccesso) a 0.5

Nel caso del lancio del dado, sempre se non truccato, la probabilità che esca 4 è pari a 1/6 mentre la probabilità che esca un numero diverso da 6 è pari a 5/6. In altre parole, in questo esempio su 6 facce del dado, una sola (la faccia con il numero 4) è quella che corrisponde al successo mentre le altre 5 (le facce con i numeri 1,2,3,5,6) corrispondono all’insuccesso.

Infatti, poiché abbiamo detto che o si verifica p o si verifica q, allora p+q sarà sempre pari ad 1 (l’evento certo). Per tale motivo, per conoscere come si comporta tale distribuzione è sufficiente conoscere il valore di p. Il valore di q si può infatti ricavare come 1-p.

In altre parole, questa distribuzione ha un unico parametro, che è proprio p. Questo significa che per calcolare la media e la varianza di una distribuzione di Bernoulli, è sufficiente conoscere quale è la probabilità di successo.

Valore atteso di una distribuzione di Bernoulli

La media di una distribuzione di probabilità discreta è pari alla somma di tutti i possibili valori che può assumere la variabile, ognuno moltiplicato per la sua probabilità.

Nel caso di una distribuzione di Bernoulli, questo equivale alla somma di

valore 0 moltiplicato per la sua probabilità (1-p)
valore 1 moltiplicato per la sua probabilità p

Dal momento che un numero moltiplicato per 0 è sempre 0, il tutto si riduce a 1*p=p

Varianza di una distribuzione di Bernoulli

La varianza di una distribuzione di probabilità ne misura la sua variabilità. Quanto più è grande il valore che si ottiene, tanto maggiore è la dispersione della distribuzione.

Nel caso di distribuzione bernoulliana, è pari a p*(1-p)

Origini della distribuzione

La distribuzione di Bernoulli prende il nome da Jakob Bernoulli, il primo della più famosa dinastia di matematici svizzeri mai esistita.

Nel corso di sole tre generazioni, la famiglia Bernoulli ha infatti dato al mondo ben otto matematici di fama internazionale: Jakob e suo fratello minore Johann; un nipote di entrambi, Nicolaus I; i tre figli di Johann (Nicolaus II, Daniel e Johann II), e i due figli di quest’ultimo (Johann III e Jakob II).

Questo per dirti che il termine Bernoulli è associato a molte analisi diverse e pertanto se ti capita di leggere questo nome fai sempre attenzione a cosa si riferisca.

In particolare, Jacob Bernoulli fu il primo a capire che il calcolo delle probabilità poteva trascendere il mondo del gioco d’azzardo ed essere applicato a praticamente qualsiasi ambito. Non a caso, questa distribuzione si può applicare davvero a qualsiasi ambito, dalla medicina alla psicologia, dalle scienze sociali alle scienze motorie, dalla fisica all’economia.

Nello specifico, la presentazione della distribuzione di Bernoulli si trova nella prima parte del libro più importante da lui scritto e pubblicato nel 1703, Ars conjectandi (L’arte della congettura).

Distribuzione di Bernoulli: e adesso?

Troverai molti altri termini statistici spiegati in modo semplice e pratico in questa guida gratuita di statistica. Buona lettura!

Articoli correlati

Tabella di contingenza

Tabella di contingenza

Per tabella di contingenza si intende una tabella a doppia entrata che mette in relazione, calcolandone le frequenze congiunte, le modalità di due variabili.

leggi tutto
One sample t test

One sample t test

Scopri come utilizzare il one sample t test per confrontare la media di una variabile con un valore di riferimento.

leggi tutto
Paola Pozzolo

Paola Pozzolo

Sono Paola Pozzolo e mi occupo di consulenze e formazione statistica. Ti aiuto a trasformare i dati in informazioni utili ed affidabili per raggiungere i tuoi obiettivi di ricerca e prendere le decisioni che più valorizzeranno il tuo lavoro.