Per valutare la bontà di un test di screening o diagnostico, è possibili utilizzare una serie di indici quali sensibilità, specificità, accuratezza, valore predittivo positivo e negativo. In questo articolo vedremo come calcolarli e interpretarne i risultati.
Indice
Test e outcome clinico: come relazionarli?
Nello studio delle scienze sanitarie, uno degli usi più comuni della probabilità è legato alla valutazione dei test di screening e dei criteri diagnostici, attraverso indici quali la sensibilità e la specificità.
Una buona quota della ricerca medica è infatti finalizzata al trovare dei test che riescano a predire con accuratezza la presenza attuale o lo sviluppo futuro di un determinato outcome (spesso rappresentato da una malattia). In altre parole, dobbiamo considerare che i test per loro stessa natura non sono infallibili, ovvero possono portare a dei falsi positivi ed a dei falsi negativi. Ci si affida ai test infatti per produrre delle stime accurate ma non delle certezze assolute, che non potranno essere mai raggiunte lavorando su campioni di dati.
Quando si confronta il risultato di un test di screening con il gold standard (ovvero quello che in base allo stato dell’arte si utilizza per definire se un individuo ha oppure non ha un determinato outcome) oppure con l’accertamento di una malattia, è possibile calcolare delle misure di accuratezza basate sulla seguente tabella:
In pratica, quando si incrociano i risultati di un test che ha come risultato positivo/negativo ed una malattia che può essere classificata come presente/assente, ogni individuo sottoposto al test si può trovare in una delle seguenti quattro casistiche:
- VERO POSITIVO (VP): è risultato positivo al test ed effettivamente ha la malattia
- VERO NEGATIVO (VN): è risultato negativo al test ed effettivamente NON ha la malattia
- FALSO POSITIVO (FP): è risultato positivo al test ma NON ha la malattia
- FALSO NEGATIVO (FN): è risultato negativo al test ma in realtà ha la malattia
Specificità e sensibilità di un test
Per poter valutare l’utilità dei risultati di un test è consigliabile ricorrere al calcolo innanzitutto dei due seguenti indici, entrambi espressi da un numero compreso tra 0 ed 1.
Sensibilità (Se)
La sensibilità è la probabilità di ottenere una classificazione positiva, dato che la malattia è davvero presente. Questo indice ti permette di rispondere alla domanda “dato un individuo con la malattia, qual è la probabilità che il test risultati positivo?”. Questo indice è quello che puoi trovare sull’asse verticale dei grafici rappresentanti le curve ROC.
Specificità (Sp)
La specificità è la probabilità di ottenere una classificazione negativa, dato che la malattia è davvero assente. Questo indice ti permette di rispondere alla domanda “dato un individuo NON ha la malattia, qual è la probabilità che il test risultati negativo?”
Il complemento ad 1 della specificità è poi considerato come un’ulteriore indice:
1-Specificità
E’ la probabilità di ottenere una classificazione positiva quando l’outcome in realtà è negativo. Questo indice ti permette di rispondere alla domanda “dato un individuo senza malattia, qual è la probabilità che il test risultati positivo?”. Questa probabilità è semplicemente il complemento ad 1 della probabilità associata alla specificità del test. In altre parole, se la specificità dei un test è di 0,700, 1-specificità sarà di 1-0,700=0,300. Tuttavia, questo indice è molto importante in quanto viene utilizzato come asse orizzontale per la costruzione delle curve ROC.
Valore predittivo positivo e valore predittivo negativo
Altre due misure che permettono di rispondere a domande di ricerca basate invece sul totale dei risultati al test, sono:
Valore predittivo positivo (VPP)
Il valore predittivo positivo rappresenta la probabilità che un individuo sia malato dato che è risultato positivo al test. Questo indice ti permette di rispondere alla domanda “dato che il test è risultato positivo, qual è la probabilità che l’individuo sia davvero malato?”. Questo valore è influenzato relativamente poco da sensibilità e specificità mentre risente molto di più della prevalenza della malattia nella popolazione testata. In altre parole, quando la prevalenza è bassa, il VPP sarà di conseguenza molto basso anche in presenza di valori prossimi ad 1 di specificità e sensibilità.
Valore predittivo negativo (VPN)
Il valore predittivo negativo a probabilità che un soggetto non abbia la malattia dato che è risultato negativo al test. Questo indice ti permette di rispondere alla domanda “dato che il test è risultato negativo, qual è la probabilità che l’individuo NON abbia davvero la malattia?”
Accuratezza (ACC)
L’ accuratezza indica la proporzione di osservazioni che sono state correttamente classificate come veri positivi o veri negativi. Questo indice ti permette di rispondere alla domanda “qual è la probabilità che un test sia corretto?”
E adesso?
La terminologia statistica è spesso la parte che crea più confusione tra chi si approccia all’analisi dati. Il traduttore statistichese-italiano è la guida in formato pdf che ho personalmente creato proprio per aiutarti a comprendere esattamente cosa significano e quando si utilizzano 10 delle espressioni statistiche più ricorrenti. Scaricala subito, è gratis!