Variabili statistiche: quale scala di misura scegliere?

25 Aprile 2020 | Disegno di ricerca

Questo articolo ti aiuterà a chiarirti le idee su quali sono le scale di misura e le tipologie di variabili che si usano in statistica. Così potrai poi scegliere velocemente e senza errori il tipo di analisi più appropriato per i tuoi dati.

scale di misura delle variabili statistiche qualitative e quantitative

Ogni ricerca ha come obiettivo quello di misurare concetti più o meno astratti come la frequenza cardiaca o la salute. Come ti ho già raccontato in questo articolo sull’analisi dei dati, per poter realizzare un’indagine statistica ed analizzare questi concetti devi prima renderli misurabili. Il risultato delle misurazioni in statistica è racchiuso nei valori delle variabili.

Ad esempio, puoi rendere misurabile il concetto di salute chiedendo alle persone di esprimere una valutazione su quanto si sentano bene in questo momento, su una scala da 1 a 7. Così come per misurare la frequenza cardiaca puoi utilizzare un cardiofrequenzimetro.

Variabile statistica: che cos’è?

Il termine “variabile” indica una qualsiasi caratteristica che “varia” tra le unità statistiche che stai analizzando. Se ad esempio, nella tua popolazione includi solo persone maggiorenni che risiedono nel comune di Torino, allora nella tua analisi il comune di residenza non sarà una variabile ma una costante perché avrà lo stesso valore per tutte le persone oggetto di studio. L’età invece sarà una variabile perché se includi nelle tue analisi tutte persone maggiorenni, potresti avere sia persone che hanno 20 anni sia persone che ne hanno 30, 40 e così via. L’età quindi varia tra le unità statistiche e pertanto è una variabile.

Per capire poi il perché una variabile varia è necessario analizzare altre variabili. Ad esempio, si potrebbe analizzare la quantità di calorie assunte in una giornata per capire come questa variabile sia legata alla pressione arteriosa.

Scala di misura: dati qualitativi e quantitativi

Nella fase di progettazione di un’indagine statistica, è importante definire la scala di misura di tutte le variabili che utilizzerai nelle tue analisi.

La scala di misura è determinata dai valori della variabile. Per il genere, ad esempio, la scala di misura è costituita da due modalità: maschio e femmina. Per il numero di visite mediche effettuate in un anno, i valori saranno i numeri 0,1,2,3,…

A seconda della scala di misura scelta, cambierà la classificazione della variabile e di conseguenza il metodo di analisi. Infatti, i metodi per analizzare una variabile numerica come l’età in anni compiuti sono diversi da quelli per trattare una variabile che ha come modalità solo si/no come il fatto di praticare o non praticare un determinato sport. Ad esempio, la media si può calcolare solo per variabili numeriche come l’età e non per una variabile che ha come modalità solo si/no.

Variabili qualitative: come devono essere le modalità?

Una variabile è qualitativa quando i suoi valori non sono numeri ma modalità. Ad esempio, lo stato civile (single, coniugato, divorziato, vedovo) è una variabile costituita da quattro modalità. Anche il genere è una variabile qualitativa perché è costituita da due modalità: maschio e femmina.

Queste modalità, dette anche categorie, devono essere esaustive e mutualmente esclusive.

Categorie mutualmente esclusive

Ad esempio, per la variabile “colore di capelli”, non va bene inserire come modalità sia “capelli castani” che “capelli scuri”. I capelli scuri infatti possono essere anche castani. In questo caso quindi le due categorie non sono mutualmente esclusive perché sono tra loro sovrapponibili.

Ti consiglio di fare molta attenzione a questo aspetto soprattutto nei questionari con domande in cui è prevista un’unica possibilità di risposta. Ad esempio, se chiedi la professione e tra le risposte c’è “studente”, “dipendente” e “libero professionista”, potrebbe capitare che un individuo lavori sia come dipendente che come libero professionista. Oppure che una persona studi e lavori allo stesso tempo. Anche in questo caso quindi le categorie non sono tra loro mutualmente esaustive.

Categorie esaustive

Le modalità di una variabile devono tenere conto di tutte le possibilità. Per questo in alcuni casi si utilizza la categoria “Altro”. Ad esempio, se la variabile è una domanda del tipo “dove andrai in vacanza quest’anno?” le possibili risposte non possono essere solo “mare” e “montagna”. C’è chi infatti potrebbe decidere di trascorre le vacanze in una città d’arte, oppure in campagna, o persino nel deserto.

Tipi di variabili qualitative

Le variabili qualitative si possono poi ancora suddividere in dicotomiche, nominali e ordinali.

Variabili dicotomiche

Le variabili dicotomiche sono il tipo di misurazione più semplice. Comprendono infatti quelle variabili che hanno solo due modalità. Ad esempio, è dicotomica la variabile genere che ha come modalità solo maschio e femmina. Oppure l’utilizzo di un determinato social media (utilizzo/non utilizzo di Facebook). O ancora la presenza o assenza di una determinata malattia che ha come possibili risposte solo si/no.

Variabili su scala nominale

Le variabili nominali possono invece essere costituite da più di due modalità che non hanno un ordine logico. Ad esempio, il tipo di sport praticato (pallavolo, calcio, tennis,…). Oppure lo stato civile (single, coniugato, divorziato, vedovo). O ancora il mezzo di trasporto utilizzato per raggiungere il luogo di lavoro (auto o moto, mezzo pubblico, bicicletta, a piedi, altro.). Per queste variabili non è infatti possibile dire che una modalità è più grande o più piccola di un’altra.

Variabili su scala ordinale

Le variabili ordinali sono costituite da tre o più modalità che hanno un ordine predefinito. Ad esempio, il più alto titolo di studio conseguito da una persona è una variabile qualitativa ordinale perché esiste un ordinamento logico tra le modalità: licenza elementare o media, diploma di scuola superiore, laurea, titolo superiore alla laurea. Non può essere invece considerata una variabile quantitativa in quanto la differenza ad esempio tra diploma e laurea non la stessa che c’è tra laurea e titolo superiore alla laurea.

Variabili quantitative

Una variabile è quantitativa quando è di tipo numerico e questi numeri non sono solo codifiche ma valori reali che si differenziano tra loro in termini di grandezza numerica. Per le variabili misurate su questa scala si possono effettuare confronti tra osservazioni considerando quanto un’unità statistica è più grande o più piccola di un’altra.

Ad esempio, l’età in anni compiuti è una variabile quantitativa perché una persona che ha 60 anni ha il doppio di anni di una persona che ha 30 anni. Il genere, anche se codificato come 0=maschio ed 1=femmina, non è invece una variabile quantitativa perché questi numeri sono solo codifiche e non rappresentano una grandezza numerica.

Anche le variabili quantitative possono essere suddivise ma questa distinzione è meno importante ai fini delle analisi statistiche di base. Giusto per conoscenza, sappi che per le variabili quantitative esistono due diversi tipi di suddivisione. La prima distinzione è tra scala ad intervalli (ad esempio, le grandezze fisiche come l’altezza misurata in centimetri) e a rapporti (ad esempio, la temperatura misurata in gradi Celsius o Fahrenheit). L’altra distinzione è tra valori discreti (ad esempio, il numero di visite mediche effettuate in un anno) e continui (ad esempio, la concentrazione di colesterolo nel sangue in mmol/l).

Ci sono poi delle variabili che sulla carta sono quantitative ma in realtà per specifici studi devono essere trattate come qualitative. Ad esempio, il tempo quando le informazioni sono state ottenute sempre a 3 mesi oppure a 6 mesi. Oppure la dose di somministrazione di un farmaco quando può essere pari solo ad alcuni valori (es. 50 ml oppure 80 ml). O ancora la distanza percorsa da un atleta se i valori possibili sono solo 100m, 400m oppure 800m. In questi casi spesso è consigliabile trattare questi valori come categorici.

Scala Likert: qualitativa o quantitativa?

Ci sono anche alcune variabili particolari, come quelle espresse su scale Likert, che sono una via di mezzo tra la scala ordinale e quella quantitativa.

Ad esempio, se chiedi ad una persona quanto è soddisfatta di un corso e la risposta deve essere espressa su una scala composta da sette valori che vanno da “per nulla soddisfatto” a “del tutto soddisfatto”. Questa variabile è qualitativa ordinale perché è composta da sette modalità che possono essere ordinate dalla più negativa (“per nulla soddisfatto”) alla più positiva (“del tutto soddisfatto”).

Tuttavia, spesso si assegna un valore numerico alle diverse modalità (1,2,3,4,5,6,7) e questa variabile è considerata come quantitativa.

Questo è il motivo per cui leggendo un articolo scientifico potrebbe capirti di leggere che per questa tipologia di variabili sono state adottate tecniche di analisi proprie delle variabili quantitative, come il calcolo della media e della deviazione standard.

Tieni comunque sempre presente che trattare una variabile qualitativa ordinale come quantitativa richiede una certa attenzione nell’assegnazione dei numeri alle diverse modalità. Per questo motivo, sarebbe sempre opportuno verificare se, con una scelta differente dei punteggi assegnati alle modalità, si hanno cambiamenti sostanziali nell’interpretazione dei risultati delle analisi.

Ad esempio, il titolo di studio non può essere considerato una variabile quantitativa ma solo qualitativa ordinale perché le modalità non sono equamente distanziate tra loro. Per capirci, non si può affermare che la distanza tra licenza media e diploma di scuola superiore sia la stessa che c’è tra diploma di scuola superiore e laurea.

Scala di misura: quale scegliere?

La scelta della scala di misura ha un impatto notevole sulle analisi statistiche che si possono effettuare.

Puoi immaginare la classificazione delle scale di misura come un imbuto. Nella parte più larga dell’imbuto ci sono le variabili quantitative che sono quelle che contengono il livello di informazione maggiore. A metà dell’imbuto ci sono le variabili qualitative ordinali, che contengono un po’ meno informazione rispetto a quelle quantitative ma un po’ più di informazione rispetto alle variabili qualitative nominali. Queste ultime sono nella parte più stretta dell’imbuto perché sono quelle che contengono il dettaglio di informazione minore.

Ad esempio, l’età in anni compiuti è una variabile quantitativa che ci permette di sapere esattamente quanti anni hanno le persone che fanno parte dell’indagine. Ma se invece degli anni compiuti i dati sono raccolti solo per fasce di età (0-6 anni, 7-17 anni, 18-30 anni,…) allora l’età diventa una variabile qualitativa ordinale. Ma potrebbe interessarti anche solo sapere se una persona è maggiorenne o minorenne e allora l’età potrebbe diventare una variabile qualitativa dicotomica con solo due modalità: minorenne e maggiorenne.

Come passare da una scala di misura ad un’altra

In generale ricordati quindi che una variabile è una caratteristica della popolazione misurabile che può anche essere codificata e trasformata. Ad esempio, una variabile quantitativa può essere sempre ricodificata in una variabile qualitativa mentre il viceversa non è possibile. Poi infatti trasformare una variabile qualitativa ordinale in una variabile qualitativa nominale o dicotomica, ma non in una variabile quantitativa.

Ad esempio, la pressione sanguigna può essere trasformata in una variabile qualitativa utilizzando dei cut-off, ovvero dei valori soglia. Ad esempio, per la pressione sistolica se utilizzi come cut-off 90 mmHg e 140 mmHg otterrai una variabile qualitativa ordinale con 3 modalità: minore di 90 mmHg, tra 90 e 139 mmHg e da 140 mmHg in su. Se invece ti interessa solo stabilire se un paziente è normoteso, allora ti basterà ricodificarla in una variabile dicotomica con modalità normoteso e non normoteso.

Io ti consiglio di partire sempre dal maggior livello di dettaglio possibile. Nel caso dell’età ad esempio chiedendo gli anni compiuti così da avere una variabile quantitativa. Potrai poi sempre in fase di analisi ricodificare la variabile per trasformarla in qualitativa ordinale o nominale. Se invece chiedi solo la fascia di età, non sarà poi possibile risalire agli anni compiuti e pertanto per le successive analisi dovrai considerare questa variabile solo come qualitativa e non come quantitativa.

E adesso?

Metti alla prova le tue conoscenze con questo quiz sui tipi di variabili statistiche! Se lo completi, c’è anche una sorpresa per te!

Paola Pozzolo

Paola Pozzolo

Sono Paola Pozzolo e mi occupo di consulenze e formazione statistica. Ti aiuto a trasformare i dati in informazioni utili ed affidabili per raggiungere i tuoi obiettivi di ricerca e prendere le decisioni che più valorizzeranno il tuo lavoro.