Media statistica: quale usare?

25 Gennaio 2020 | Analisi dati

Quando si parla di media, la prima formula a cui si pensa è quella della media aritmetica. Ma non sempre questa media statistica è quella più adatta. Scopri in questo articolo la differenza tra media e mediana e quali sono tutti i tipi di media e quale scegliere in base al tipo di dati che hai a disposizione.

medie analitiche, medie lasche e medie troncate

Introduzione

Quando si inizia un’analisi dei dati, uno dei primi calcoli che si effettua sulle variabili quantitative è quello della media. Ma prima di procedere con il calcolo di una media aritmetica, semplice o ponderata che sia, chiediti sempre se questa tipologia di media è la più indicata per i tuoi dati.

Tipi di media statistica

In statistica, esistono tre tipologie di medie (analitiche, lasche e troncate). In questo articolo ti presenterò tutti i possibili tipi di media calcolabili, con esempi concreti di utilizzo così da fornirti una guida utile alla scelta di quella più idonea per le tue analisi.

Medie analitiche

Puoi utilizzare le medie analitiche solo per variabili quantitative (ad esempio, per calcolare l’età media o il numero medio di figli per donna). Non le puoi utilizzare invece per variabili qualitative (ad esempio, non è possibile calcolare la media dei titoli di studio o la media della nazionalità).

Media aritmetica

La media aritmetica fa parte delle medie analitiche (dette anche medie ferme o di potenza) e, nonostante sia la media statistica più utilizzata, non sempre è quella preferibile. E’ infatti un indice che in statistica è definito poco robusto, perchè risente di valori estremi molto grandi o molto piccoli.

Media geometrica

Per calcolare la media di tassi o delle percentuali di sconto si utilizza la media geometrica. In generale, si utilizza in presenza di valori elevati che acquisiscono un peso preponderante rispetto ai valori bassi e alzano drasticamente il valore della media aritmetica e quando i dati appaiono legati tra di loro da un fattore moltiplicativo. Ad esempio, questo tipo di media viene solitamente utilizzata per calcolare i tassi di interesse o i tassi di inflazione perché sono tassi di crescita e quindi sono moltiplicati per loro stessa natura.

La media geometrica non può però essere calcolata se tra i dati sono presenti degli zeri o dei numeri negativi. Infatti, la presenza di uno zero annulla il prodotto tra gli elementi ed azzera la media ed è impossibile calcolare la radice di ordine pari a un valore negativo.

Media armonica

Per calcolare la media dei tempi di reazione o di risposta (come nelle prove di tossicità oppure di sopravvivenza) si utilizza la media armonica. In generale, quando un fenomeno si dovrebbe prevedibilmente esaurire in un arco di tempo definito. Ad esempio, anche il calcolo della velocità media di un veicolo che percorre uguali distanze in tempi differenti si effettua utilizzando la media armonica.

A differenza delle altre tipologie di media, si può utilizzare anche in presenza di valori infiniti.

Media quadratica

Infine, la media quadratica evidenzia la presenza di valori estremi molto grandi o molto piccoli e rende ininfluente la presenza di valori con segni discordi (un po’ positivi e un po’ negativi). La formula della deviazione standard è un esempio di media quadratica, perché somma gli scarti al quadrato di ogni singola osservazione rispetto al valore medio. In generale, questa media si utilizza nel calcolo delle superfici.

La media di potenza: 4 medie in 1

Le medie analitiche sono dette anche medie di potenza perché il calcolo di queste quattro medie analitiche derivano da un’unica formula generica, quella appunto relativa alla media di potenza, in cui cambia solo il valore dell’esponente.

Calcolando queste quattro medie sugli stessi dati otterrai sempre che il valore della media quadratica (che ha esponente=2) è il più alto di tutti, a seguire il secondo valore più alto sarà quello delle media aritmetica (che ha esponente=1), quindi quello della media geometrica (che si dimostra ha esponente=0) ed infine quello della media armonica (che ha esponente=-1). Ricapitolando:

Media armonica ≤ Media geometrica ≤ Media aritmetica ≤ Media quadratica

Medie lasche e medie troncate

In statistica si utilizzano poi anche altre due tipologie di medie non analitiche: le medie lasche (come la mediana, la moda ed i quartili) e le medie troncate. La differenza principale è rappresentata dai dati utilizzati per il loro calcolo: le medie analitiche utilizzano tutti i numeri che si hanno a disposizione, mentre le medie lasche e le medie troncate ne utilizzano solo una parte. Sono quindi preferibili in caso di dati anomali, forte variabilità dei dati oppure distribuzioni non simmetriche.

Quale è la differenza tra media e mediana?

A questo punto dovrebbe esserti un po’ più chiara anche la differenza che c’è tra media aritmetica e mediana. La media aritmetica infatti è una media analitica, che si può calcolare solo su variabili quantitative e che risente di valori anomali. La mediana invece è una media lasca che si può calcolare sia per variabili quantitative che per variabili qualitative ordinali.

Proprio per le sue caratteristiche, è preferibile utilizzare la mediana quando:

  • la variabile contiene outliers
  • la distribuzione dei dati è fortemente asimmetrica
  • c’è molta variabilità tra le osservazioni

Quale media statistica calcolare?

Prima di procedere con le analisi dei dati, devi scegliere la tipologia di media che è più utile per il tuo scopo. Ad esempio, per calcolare la media dei voti degli esami universitari è corretto utilizzare la media aritmetica, che include tutti i voti. Al contrario, per valutare la prestazione dei tuffatori alle Olimpiadi si utilizza una media troncata. In altre parole, si esclude il voto più basso ed il voto più alto.

Non dimenticare che ogni analisi statistica è diversa e, pertanto, la scelta della media da utilizzare dovrebbe sempre essere basata sul tipo di variabile che si sta analizzando e sugli obiettivi che si vogliono raggiungere, come ti ho spiegato in questo articolo sull’analisi dei dati. Perciò non partire in quarta a calcolare una media aritmetica se, ad esempio, la variabile contiene dati anomali. Scegli invece una media statistica che ti fornisca un’informazione che non risenta delle osservazioni estreme, come la mediana o la media troncata.

E adesso?

Se ti interessa approfondire l’utilizzo delle medie ponderate, puoi leggere questo articolo su come si calcola la media aritmetica ponderata.

Se invece vorresti capire meglio la differenza tra media e mediana, come individuare gli outliers o, più in generale, quali sono i principali indici statistici che puoi utilizzare per riassumere una variabile quantitativa e di come interpretarli, puoi scaricare  questa guida gratuita.

Articoli correlati

Tabella di contingenza

Tabella di contingenza

Per tabella di contingenza si intende una tabella a doppia entrata che mette in relazione, calcolandone le frequenze congiunte, le modalità di due variabili.

leggi tutto
Paola Pozzolo

Paola Pozzolo

Sono Paola Pozzolo e mi occupo di consulenze e formazione statistica. Ti aiuto a trasformare i dati in informazioni utili ed affidabili per raggiungere i tuoi obiettivi di ricerca e prendere le decisioni che più valorizzeranno il tuo lavoro.