Formula statistica: come si interpreta?

14 Novembre 2020 | Analisi dati

Per poter interpretare in modo corretto una formula statistica, ti serve capire se è una formula definitoria o computazione e comprendere cosa significano tutti i simboli presenti al loro interno. In questo articolo troverai esempi pratici di come si utilizza il simbolo di sommatoria e di come si interpreta la varianza.

formule statistiche: come si interpretano

Introduzione

Una formula statistica è come una ricetta di cucina. Ce ne sono di molto semplici ma anche di molto complesse, ma quello che le accomuna è il metodo.

Nelle ricette di cucina, si parte sempre da un elenco ingredienti che vengono combinati tra loro in un preciso ordine per ottenere un determinato piatto. Allo stesso modo, in una formula statistica numeri e simboli sono combinati tra loro con un ordine preciso per ottenere un determinato risultato.

Per poter capire come funziona una formula statistica, ti consiglio pertanto come prima cosa di accertarti che tu sappia cosa rappresenta ogni simbolo contenuto al suo interno.

Vediamone un esempio con il simbolo che ricorre più frequentemente nelle formule statistiche: la sommatoria.

Simbolo di sommatoria Σ

La lettera greca sigma in maiuscolo, Σ, è il simbolo aritmetico che si utilizza per dire “somma di”. In pratica, quando incontri questo simbolo significa che la formula richiede di sommare tutti i numeri che seguono nella formula il simbolo Σ.

Esempio sommatoria

Supponiamo che ad un esame di statistica erano iscritti 5 studenti. I loro voti sono stati: 23, 30, 28, 21, 18.
La Σ (voti conseguiti all’esame di statistica) sarà data da 23+30+28+21+18=120

In statistica spesso i nomi delle variabili sono sostituiti con delle lettere maiuscole, e la più gettonata in statistica è la lettera X.

Quindi, se X=voti conseguiti all’esame di statistica, allora possiamo anche scrivere che Σ (X) = 23 + 30 + 28 +21+18 =120

Formula sommatoria

Per rendere più precisa la sommatoria, è possibile anche aggiungere un apice ed un pedice a questo simbolo. Il pedice ti dice da quale valore si parte, l’apice a quale valore si arriva.

Utilizzando questa notazione, la stessa formula di prima si può scrivere anche come:
esempio sommatoria

In pratica, nelle formule statistiche i valori contenuti nella variabile X sono spesso identificati come xi.

In questo esempio, la variabile X=voti conseguiti all’esame di statistica contiene 5 valori perché 5 sono gli studenti che hanno sostenuto tale esame. Pertanto, possiamo dire che il campione è composto da n=5 studenti.

Nelle formule statistiche, infatti spesso le variabili si identificano con lettere maiuscole (come la X) mentre i valori contenuti all’interno delle variabili sono identificati da lettere minuscole (come x).

Per poter distinguere i singoli valori, alle x viene poi aggiunto un pedice, che indica a quale unità si riferisce quello specifico valore.

Ad esempio, potremmo decidere che x1=23, x2=30, x3=28, x4=21 e x5=18.

La somma che avevamo scritto prima Σ (X) = 23 + 30 + 28 +21+18 =120 si potrebbe quindi anche riscrivere come Σ (X) = x1+ x2+ x3+ x4 + x5

In forma compatta, tale somma si può proprio scrivere come  esempio sommatoria

Una volta compreso cosa significano tutti i simboli, dovrai seguire attentamente quanto scritto nella formula per arrivare al risultato finale che, in alcuni casi, potrebbe essere un singolo numero, ed in altri invece un insieme di più numeri.

Formula computazionale o definitoria?

Nei libri di statistica e nei tutorial online, ti potrebbe capitare di trovare formule diverse per la stessa tipologia di analisi. Questo è ad esempio il caso della formula della varianza o dell’indice di correlazione lineare.

Questo è principalmente dovuto al fatto che in statistica esistono due tipologie di formule:

  • formula definitoria: equazione che permette di capire direttamente il ragionamento che sta dietro un determinato procedimento
  • formula computazionale: equazione equivalente alla formula definitoria che permette di abbreviare i calcoli da fare a mano per ottenere più velocemente il risultato della formula.

Tutte le formule statistiche sono sempre state proposte in prima istanza come formule definitorie. Tuttavia, dal momento che molte di queste equazioni sono state ideate prima dell’avvento dei software statistici (alcune risalgono addirittura a prima del Novecento), in passato i ricercatori hanno sviluppato diverse scorciatoie per semplificare i calcoli a mano o con una semplice calcolatrice. Sono così nate le formule computazionali.

Tuttavia, quando vuoi capire cosa significa una determinata formula, ti consiglio caldamente di non usare le formule computazionali ma di basarti sempre e solo sulle formule definitorie. Le formule computazioni infatti di solito rendono più difficile comprendere il significato di quello che si sta calcolando.

Formula statistica della varianza: esempio

La formula definitoria della varianza della popolazione è:

formula definitoria varianza popolazione

Osservando bene questa formula, cosa vedi?

  • c’è una differenza al quadrato: gli scarti al quadrato di ogni singola osservazione dalla media
  • c’è una sommatoria: gli scarti al quadrato sono tra loro sommati
  • c’è una divisione per n: la somma degli scarti al quadrato è divisa per il numero di osservazioni.

Mettendo insieme tutti i pezzi, possiamo quindi dire che la varianza è la media (perché prima sommo e poi divido per il loro numero) degli scarti al quadrato delle singole osservazioni dalla loro media. Questa è esattamente la definizione di varianza.

La formula computazionale della varianza della popolazione invece è:

formula computazionale varianza popolazione

Osservando questa formula, è invece più difficile dare una definizione “ragionata” di varianza:

  • c’è una sommatoria: i quadrati dei valori delle singole osservazioni sono tra loro sommati
  • c’è una divisione per n: la somma di questi valori al quadrato è divisa per il numero di osservazioni, ottenendo in pratica la media dei valori al quadrato
  • c’è una sottrazione con la media al quadrato: alla media ottenuta al passaggio precedente viene sottratto il quadrato della media della variabile.

Decisamente più complicato da questa formula computazionale riuscire a capire cos’è la varianza, non trovi?

Formula statistica: e adesso?

Trovi una spiegazione chiara di 10 delle espressioni più utilizzate in un’analisi dati in questa guida gratuita di statistica. Scaricala subito!

Articoli correlati

Tabella di contingenza

Tabella di contingenza

Per tabella di contingenza si intende una tabella a doppia entrata che mette in relazione, calcolandone le frequenze congiunte, le modalità di due variabili.

leggi tutto
Paola Pozzolo

Paola Pozzolo

Sono Paola Pozzolo e mi occupo di consulenze e formazione statistica. Ti aiuto a trasformare i dati in informazioni utili ed affidabili per raggiungere i tuoi obiettivi di ricerca e prendere le decisioni che più valorizzeranno il tuo lavoro.