Tabella di contingenza

19 Novembre 2022 | Analisi dati

Per tabella di contingenza si intende una tabella a doppia entrata che mette in relazione, calcolandone le frequenze congiunte, le modalità di due variabili. In questo articolo troverai illustrati degli esempi di queste tabelle e ti mostrerà tutti i modi in cui è possibile leggerla, sia utilizzando le frequenza assolute che percentuali.

esempi tabella di contingenza

Struttura di una tabella di contingenza

Le quattro tabelle di contingenza qui sopra si riferiscono tutte agli stessi dati, ovvero ad un campione di 479 individui su cui si è voluta indagare la relazione tra il sesso e la fascia di età.

I nomi delle modalità della variabile Età sono riportati sulle righe, mentre i nomi delle modalità dell’altra variabile (il Sesso) sono riportati sulle colonne.

Se si supponesse una relazione di causa-effetto tra le due variabili, allora, per convenzione, la variabile indipendente (la causa) si metterebbe sulle righe e la variabile dipendente (l’effetto) si metterebbe sulle colonne.

Nelle celle interne della tabella sono riportate le frequenze delle unità statistiche relative ai diversi incroci tra le coppie di modalità.

Ogni tabella di contingenza può essere costruita in almeno 4 modi diversi: le frequenze congiunte al suo interno possono infatti essere assolute, percentuali sul totale di riga, percentuali sul totale di colonna oppure percentuali sul totale complessivo.

Per capirne meglio le differenze, ti invito a notare come varia il valore all’interno della cella evidenziata nelle 4 tabelle riportate.

Come leggere una tabella di contingenza

Frequenze assolute

Nel caso di frequenze assolute, i valori indicano il numero di unità statistiche che presentano entrambe le modalità indicate dall’incrocio di riga e di colonna in cui è posizionata la cella.

tabella frequenze assolute

Ad esempio, le frequenze assolute contenute dalla tabella A indicano che nel campione ci sono 89 femmine che hanno tra 40 e 49 anni.

Frequenze percentuali di colonna

Le percentuali sul totale di colonna, come suggerisce il nome stesso, sono delle percentuali che si leggono colonna per colonna.

In altri termini, le frequenze assolute sono divise per i totali di colonna ed il risultato che si ottiene è moltiplicato per 100. In questo modo, le percentuali risultanti permettono ad ogni colonna di avere somma pari al 100%.

percentuali di colonna

Guardando la tabella B, si può osservare che il 13% delle femmine ha meno di 30 anni, il 24% ha tra 30 e 39 anni, il 32% ha tra i 40 e i 49 anni, l’11% tra i 50 e i 59 anni ed il 20% 60 o più anni.

Frequenze percentuali di riga

Le percentuali sul totale di riga, come suggerisce il nome stesso, sono delle percentuali che si leggono riga per riga.

Per ottenerle, si parte sempre dalle frequenze assolute (i numeri contenuti nella tabella A) ma, invece di dividerle per i totali di colonna (come fatto per le percentuali di colonna), si dividono per i totali di riga.

Moltiplicando poi il risultato per 100, si ottengono delle percentuali costruite in modo che ogni riga sommi al 100%.

percentuali di riga

Dalla tabella C emerge che, sul totale dei rispondenti, il 42% sono maschi ed il 58% sono femmine. Tuttavia, solo il 19% delle persone che appartengono alla fascia di età tra i 40 e i 49 anni sono maschi, mentre il restante 81% è costituito da femmine.

Frequenze percentuali sul totale

Le percentuali sul totale complessivo si calcolano dividendo ogni frequenza assoluta per la numerosità totale del campione e poi moltiplicando per cento.

percentuali sul totale

Guardando la tabella D, si può dire che il 19% del campione è costituito da femmine che hanno un’età compresa tra i 40 ed i 49 anni.

Quale rappresentazione scegliere?

Sia con Excel (utilizzando le tabelle pivot) che con i principali software di statistica il passaggio da un tipo di frequenza all’altro è molto veloce e pertanto può essere utile in fase esplorativa costruire più di un tipo di tabella e poi decidere successivamente quale riportare nel report finale.

La relazione è statisticamente significativa?

Se il tuo obiettivo è valutare se sia presente una relazione statisticamente significativa tra le due variabili qualitative, dopo aver costruito la tabella di contingenza dovrai confrontare le frequenze osservate con quelle attese (dette anche frequenze teoriche), calcolando il test del chi quadrato o similari (come il test esatto di Fisher).

E adesso?

Il confronto tra due variabili qualitative è solo una delle tecniche utilizzabili per valutare la relazione tra due variabili. Se vuoi scoprire quali sono le altre, segui le linee guida per scegliere il metodo di analisi più adatto per valutare la relazione statistica tra due variabili della stessa tipologia.

 

Articoli correlati

Paola Pozzolo

Paola Pozzolo

Sono Paola Pozzolo e mi occupo di consulenze e formazione statistica. Ti aiuto a trasformare i dati in informazioni utili ed affidabili per raggiungere i tuoi obiettivi di ricerca e prendere le decisioni che più valorizzeranno il tuo lavoro.