Istogramma di frequenza o densità spiegato semplice

30 Maggio 2020 | Analisi dati

Che differenza c’è tra un istogramma ed un grafico a barre? E tra densità e frequenza? Quando puoi utilizzare questo grafico e che informazioni ti può fornire? Questo articolo ti aiuterà con esempi pratici a chiarirti le idee su come sfruttare al meglio uno dei grafici statistici più utilizzati per l’analisi dei dati.

esempio istogramma

Cos’è un istogramma: significato ed esempi

Uno dei grafici più conosciuti ed utilizzati in statistica è l’istogramma. Intorno a questo grafico c’è però ancora molta confusione. C’è chi lo scambia con in grafico a barre, chi lo costruisce nel modo sbagliato e chi non ne sfrutta tutte le potenzialità. Questo articolo ti aiuterà a fare chiarezza, così da capire una volta per tutte che cos’è e come si usa in modo corretto questo grafico.

Con il termine istogramma” si intende un grafico cartesiano utilizzato per descrivere la distribuzione in classi di una variabile quantitativa con molti valori diversi tra loro.

Ad esempio, puoi utilizzare un istogramma per illustrare la distribuzione dell’età (in anni compiuti), del peso (in kg) o della frequenza cardiaca (in mmHg). Gli istogrammi vengono anche utilizzati nella fotografia digitale e nel fotoritocco per analizzare la luminosità di un’immagine.

A cosa serve un’istogramma in pratica?

La costruzione di un grafico statistico non è mai un lavoro fine a se stesso, ma ha l’obiettivo di aiutarti ad interpretare i dati.

Nello specifico, l’istogramma ti aiuta ad esplorare i dati, a capire dove si trova il punto centrale di una variabile e quanta variabilità c’è nei dati. Ti aiuta poi a capire se ci sono dei valori anomali e se i dati sono approssimativamente simmetrici o chiaramente asimmetrici.

Distribuzione unimodale o multimodale?

L’istogramma ti permette anche di capire se una distribuzione è unimodale o multimodale. In altre parole, se ha un solo picco (unimodale) oppure se ha più di un picco (multimodale). In alcuni casi, una distribuzione multimodale può indicare che nel campione sono presenti delle sottopopolazioni che hanno delle caratteristiche diverse tra loro rispetto alla variabile che si sta analizzando.

Ad esempio, ipotizziamo che tu abbia rilevato l’altezza (in cm) di un campione di atleti. Nel campione l’altezza media risulta essere pari a 174 cm con una deviazione standard di 13,2 cm. Qui sotto trovi il relativo istogramma.

istogramma densità esempio

Noti qualcosa di strano? Sembra esserci un picco molto ampio nella parte centrale della distribuzione. Quante mode ci sono? Una o due?

Per capire meglio come sono distribuiti i dati, ho diviso i dati in due gruppi e, per ognuno di essi, ho creato un istogramma. Nel primo istogramma, quello con le barre in rosa, ho riportato solo i dati che si riferiscono alle donne. Nel secondo istogramma, quello con le barre azzurre, ho riportato solo i dati che si riferiscono agli uomini.

esempio istogrammi per gruppi

Il motivo di quel picco centrale molto ampio adesso appare molto più chiaro. La prima moda si riferiva alle donne ed il secondo picco agli uomini. Ovvero stavamo mischiando due sottopopolazioni (donne e uomini) che hanno un’altezza diversa.

L’istogramma ci ha aiutato a capire che il genere è una variabile essenziale da tenere in considerazione nel momento i cui vogliamo fare degli studi sull’altezza di questo campione.

Per situazioni di questo tipo, in cui ci sono solo due gruppi, l’istogramma è perfetto per studiare la forma della distribuzione. Se invece hai molti gruppi, allora ti consiglio di utilizzare il boxplot che, pur essendo meno dettagliato, ti permette un confronto più immediato tra i gruppi.

L’istogramma può anche aiutarti a capire quale è la funzione di probabilità distributiva che meglio si adatta ai dati . Se questo è il tuo obiettivo, ti consiglio però di basare la tua scelta non solo su questo grafico, che a volte può essere fuorviante, ma anche di utilizzare i grafici delle probabilità ed i test delle distribuzioni.

Come è fatto un istogramma?

L’istogramma è composto da un’insieme di rettangoli tra loro adiacenti. Le basi di questi rettangoli sono tutte allineate su un asse orizzontale detto anche “asse delle ascisse”.

Il numero dei rettangoli corrisponde al numero di classi in cui è stata suddivisa la variabile. La larghezza della base dei rettangoli dipende dall’ampiezza di tali classi e, complessivamente, tutte le basi dei rettangoli affiancate devono coprire l’intera gamma dei valori della variabile.

L’altezza di ogni rettangolo invece può indicare la frequenza oppure la densità dei casi presenti in ogni classe.

La frequenza indica quante unità statistiche sono presenti all’interno della classe.

La densità invece data dal rapporto tra la frequenza (assoluta o relativa) e l’ampiezza della classe. Tale rapporto è interpretabile come il grado di addensamento delle frequenze nel corrispondente intervallo di valori. Negli istogrammi di densità infatti l’altezza dei rettangoli indica la densità della classe, mentre la frequenza è rappresentata dall’area del rettangolo.

Istogramma di frequenza o istogramma di densità?

Se le classi hanno tutte la stessa ampiezza, allora è equivalente riportare la densità o la frequenza sull’asse verticale.

Quando invece le classi non sono tutti uguali sarebbe un errore disegnare l’altezza di ogni rettangolo in base alla frequenza. Infatti, un intervallo di valori più ampio tenderà a contenere un numero maggiore di frequenze di quelle contenuta in un intervallo di valori più stretto. Perciò in questa situazione è necessario calcolare sempre la densità di frequenza.

Negli istogrammi di densità, l’altezza dei rettangoli indica la densità della classe, mentre la frequenza è rappresentata dall’area del rettangolo.

Quanti dati servono per fare un istogramma?

Ti consiglio di scegliere come grafico l’istogramma quando il tuo campione è composto da almeno una ventina di unità statistiche. Se ne hai meno, la distribuzione dei dati sarà poco accurata e sarà più difficile sfruttare le potenzialità di questa rappresentazione grafica.

Istogramma: come si fa in pratica a costruirlo?

Per costruire un istogramma, la variabile quantitativa deve prima essere suddivisa in classi. Questa operazione, così come tutto il resto della procedura di costruzione dell’istogramma, può essere fatta sia a mano sia in automatico sfruttando le funzioni preimpostate dei software per l’analisi dati.

Come fare un’istogramma su Excel

Per realizzare un istogramma su Excel devi prima selezionare la colonna in cui sono elencati i dati della variabile che ti interessa analizzare e poi cliccare prima su Inserisci e poi su Inserisci grafico statistico. A questo punto seleziona Istogramma ed in automatico Excel creerà il grafico.

Per modificarlo, puoi utilizzare le schede Progettazione e Formato che compaiono nel menù in alto a destra cliccando sull’istogramma appena creato.

Tuttavia, questa procedura va bene solo se le classi hanno la stessa ampiezza. Infatti Excel sull’asse verticale riporta le frequenze assolute.

Se invece vuoi che le classi di valori abbiano ampiezza diversa, la procedura diventa più complessa e la suddivisione in classi deve essere svolta manualmente. Nulla di particolarmente complicato ma, se vuoi ottimizzare i tempi soprattutto se hai diversi istogrammi da creare, quando le classi di valori hanno ampiezza diversa ti consiglio di passare ad un software statistico come SPSS o R Commander. Questi software infatti permettono di velocizzare di molto tutta la procedura perché ti basterà con un click modificare l’opzione da frequenza a densità per poter ottenere il grafico desiderato.

Quante barre usare per l’istogramma?

Non esiste nessun criterio assoluto di scelta del numero di classi per un istogramma. Aumentare o diminuire il numero di barre può però influire sull’analisi dei dati. Anche se i dati non cambiano, il loro aspetto può cambiare. È importante scegliere un numero appropriato di classi per i dati in modo da non interpretare erroneamente gli andamenti. Troppi pochi rettangoli produrranno un grafico a “grattacielo” con tutti i valori in pochi rettangoli molto alti che possono nascondere degli schemi importanti. D’altra parte, un numero eccessivo di classi genera un grafico piatto, in cui tutte le classi hanno una frequenza molto bassa e può far sì che fluttuazioni piccole ma previste nei dati diventino importanti e non si riesca più a cogliere l’andamento generale della distribuzione.

La scelta del numero di classi che viene fatta in automatico dai software statistici di solito è buona, ma è comunque sempre possibile modificarla.

Qual è la differenza tra un grafico a barre ed un istogramma?

Entrambi sono costituiti da una serie di barre rettangolari la cui dimensione è proporzionale al numero di soggetti che presentano la stessa modalità o classe di valori della variabile oggetto di studio.

L’istogramma si utilizza per variabili quantitative continue e pertanto, proprio per dare l’idea di continuità, le barre sono tra loro adiacenti. Il grafico a barre si utilizza invece per variabili discrete o qualitative e pertanto ci sarà uno spazio vuoto tra le barre.

Inoltre, nell’istogramma l’asse orizzontale ha una unità di misura (quella della variabile) e la base dei rettangoli corrisponde all’ampiezza delle classi della variabile. Nel grafico a barre invece l’ampiezza delle basi dei rettangoli non ha un significato numerico.

Istogramma: e adesso?

Trovi tante altre definizioni utili ed esempi pratici che ti aiuteranno a migliorare le tue analisi dei dati in questa guida gratuita di statistica. Buona lettura!

Articoli correlati

Paola Pozzolo

Paola Pozzolo

Sono Paola Pozzolo e mi occupo di consulenze e formazione statistica. Ti aiuto a trasformare i dati in informazioni utili ed affidabili per raggiungere i tuoi obiettivi di ricerca e prendere le decisioni che più valorizzeranno il tuo lavoro.