“Biostatistica. Quello che avreste voluto sapere” è uno dei testi di statistica più completi tra quelli in circolazione. Disponibile sia in formato cartaceo che pdf, al suo interno troverai spiegati test parametrici e non parametrici, ANOVA, regressioni, analisi fattoriale, analisi della sopravvivenza, misure dei cambiamenti e di impatto, effect-size, calcolo della numerosità campionaria e tanto altro. Inoltre, troverai indicazioni su come effettuare le analisi con SPSS o Stata e tanti esercizi pratici (tutti con soluzioni).
In questo articolo troverai la recensione della seconda edizione italiana, derivata dalla quarta pubblicata in lingua inglese, di “Biostatistica. Quello che avreste voluto sapere..”. Il libro è stato pubblicato nel 2015 dalla Casa Editrice Ambrosiana e lo puoi trovare su tutte le principali piattaforme online.
Indice
Per chi è questo libro
Questo manuale è stato scritto non solo per studenti e ricercatori di area medica e biomedica ma anche per tutti coloro che sono interessati a capire come leggere, pubblicare un articolo scientifico e capire se le analisi fatte da altri siano corrette ed affidabili.
Una delle peculiarità di questo manuale è che è stato scritto da un fisico canadese (Geoffrey Norman) ed uno psicologo newyorkese (David Streiner). Entrambi convertiti alla statistica ed all’epidemiologia e dotati di uno spiccato senso dell’umorismo. Questo strana combinazione di autori ha dato vita ad un manuale completo e dettagliato, ma per nulla noioso e criptico. Non a caso il sottotitolo è “quello che avreste voluto sapere..”
E’ infatti indirizzato soprattutto a chi è sempre stato convinto di essere stato negato per la statistica.
Proprio per questo l’approccio è focalizzato più sul ragionamento ed al suo interno non troverai gergo tecnico, algebra, dimostrazioni e formule fini a se stesse. E non solo per gli argomenti classici di un testo di base ma anche per procedure più approfondite come quelle dell’ANOVA a più dimensioni, per misure ripetute e la MANOVA, la statistica non parametrica, le misure di associazione per ranghi, l’analisi fattoriale, la path analysis, le misure di impatto epidemiologico e tante altre che di solito sono escluse dagli altri libri di testo di statistica biomedica. Inoltre, per ognuna delle tecniche spiegate troverai le indicazioni su quali misure utilizzare per valutare l’effect size e su come scegliere un campione di dimensioni adeguate.
Distribuzione Normale
Prima di passare a vedere la struttura del libro, ti condivido una curiosità sull’immagine riportata in copertina, ove troverai riportato il famoso “Studio sulle Proporzioni dell’Uomo al modo di Vitruvio” di Leonardo da Vinci. Questo disegno non solo si basa su principi geometrici ma le gambe seguono perfettamente il comportamento di una curva Normale.
La media (indicata dalla linea verticale arancione) è infatti posta esattamente a metà tra i due talloni e la prima deviazione standard (indicata dalla linea orizzontale blu) cade esattamente sulle rotule. Il centro dei due piedi, nei punti in cui toccano l’arco della circonferenza, coincide invece con due deviazioni standard.
Insomma, già solo la copertina è un ottimo spunto per ripassare le caratteristiche di questa distribuzione.
Biostatistica: struttura del libro
Questo manuale è suddiviso in 5 sezioni e 30 capitoli per un totale di 245 pagine.
Tutti i capitoli iniziano con un esempio e terminano con indicazioni su:
- Le misure da utilizzare per valutare l’entità dell’effetto (effect size)
- come presentare i risultati delle analisi effettuate
- come calcolare la numerosità del campione
- i comandi per analizzare i dati con SPSS o Stata
- esercizi pratici (con soluzioni disponibili al fondo del manuale)
Al fondo del libro troverai poi anche la bibliografia e le letture consigliate, un “dizionario senza vergogna” dei termini statistici, l’appendice e l’indice analitico.
Natura dei dati e della statistica
1 – Le basi
Questo capitolo ti può tornare utile per ripassare le differenze tra le diverse scale di misura delle variabili statistiche.
2 – Esaminare i dati
Consigli pratici su quali grafici scegliere per rappresentare in modo accurato ed efficace i tuoi dati
3 – Descrivere i dati con i numeri
Qui troverai spiegati tutti i principali indici riassuntivi numerici: indici di tendenza centrale (moda, media, mediana), di dispersione (deviazione standard, varianza, range assoluto ed interquartile, coefficiente di variazione) e di forma (asimmetria e curtosi).
4 – La distribuzione normale
Quasi impossibile condurre un’intera conversazione con uno statistico senza che ad un certo punto venga citata la curva a campana (detta anche gaussiana o normale). Questo capitolo ti spiega di cosa si tratta, perché è utile conoscerla e quando e come usarla.
5 – La probabilità
Questo capitolo contiene il kit di sopravvivenza per capire ed affrontare la probabilità in situazioni pratiche, come ad esempio quando torna utile conoscere la relazione tra la distribuzione binomiale e di quella normale.
6 – Elementi di statistica inferenziale
In questo capitolo sono stati messi insieme i due approcci storici alla logica dell’inferenza statistica: il calcolo dei valori esatti di p proposti da Fisher e l’approccio decisionale secondo Neyman e Pearson.
Analisi della varianza
7 – Confrontare due gruppi
Qui troverai spiegato come utilizzare il test t per confrontare le medie di due gruppi (casi e controlli, farmaco e placebo, maschi e femmine,..)
8 – Più di due gruppi
Nel caso i gruppi fossero più di due, per confrontarne le medie dovrai utilizzare l’ANOVA ad una via, che in questo capitolo è spiegata un passo alla volta, partendo dalle somme dei quadrati ed arrivando ai test post hoc.
9 – ANOVA fattoriale
Quando le variabili suddivise in gruppi sono più di una, allora l’approccio corretto è quello dell’ANOVA a più vie, che tiene conto anche dell’interazione tra i fattori.
10 – Due osservazioni ripetute
Il t test per dati appaiati e le sue alternative.
11 – ANOVA per misure ripetute
Puoi utilizzare questa tipologia di analisi quando vuoi valutare la differenza tra misure quantitative che sono ripetute per più di due volte.
12 – ANOVA multivariata (MANOVA)
Questa tecnica ti permette di analizzare contemporaneamente le medie di due o più variabili dipendenti rispetto a dei gruppi.
Regressione e correlazione
13 – Regressione semplice e correlazione
Quando il tuo obiettivo è valutare la relazione tra due variabili entrambe quantitative.
14 – Regressione multipla
Se hai una sola variabile dipendente e più variabili indipendenti, allora l’approccio corretto è quello della regressione multipla
15 – Regressione logistica e di Poisson
Quando la variabile dipendente è dicotomica, allora si utilizza la regressione logistica binaria. Se invece i dati sono conteggi di eventi indipendenti avvenuti in un determinato periodo di tempo ed il loro numero è piccolo rispetto alla popolazione, allora il metodo più adatto potrebbe essere la regressione di Poisson
16 – Problemi avanzati di regressione e ANOVA
Regressioni polinomiali, altre analisi di regressione non lineare e metodi ANCOVA, che permettono di combinare variabili continue e di raggruppamento in un’unica equazione di regressione.
17 – Misurare i cambiamenti nel tempo
Per valutare il cambiamento di una variabile nel tempo, spesso i t-test e le ANOVA per dati appaiati non sono ottimali. In queste situazioni sono da preferire le ANCOVA, che utilizzano le misure pre-trattamento (baseline) come covariata.
18 – Analisi di dati longitudinali: modelli lineari gerarchici
Questi modelli sono perfetti quando i soggetti si “perdono” al follow-up in modo diverso nei gruppi di studio e quando l’effetto di una variabile (ad esempio, l’esperienza dei medici) influenza solo alcuni soggetti nel campione.
19 – Componenti principali e analisi fattoriale
L’analisi delle componenti principali e l’analisi fattoriale esplorativa e confermativa sono tecniche statistiche che si utilizzano quando l’obiettivo è esaminare la struttura delle relazioni tra variabili.
20 – Path analysis e modelli di equazioni strutturali
La path analysis è un’estensione della regressione multipla che permette di studiare la relazione tra più variabili dipendenti ed indipendenti. I modelli ad equazione strutturali si spingono ancora oltre, consentendo di analizzare anche variabili latenti, come ad esempio avviene nell’analisi fattoriale confermativa.
Statistica non parametrica
21 – Test di significatività per frequenze di dati categorici
Qui troverai spiegato come usare il test del chi-quadrato e le sue alternative. Ad esempio, il test esatto di Fisher in caso di campioni piccoli, il chi-quadrato di McNemar per dati appaiati, il chi-quadrato di Mantel- Haenszel in caso di due fattori, e le analisi log-lineari nel caso di molti fattori.
22 – Misure di associazione per dati categorici
Questo capitolo ti aiuterà a districarti tra coefficiente phi, coefficiente di contingenza, Q di Yule, V di Cramer, kappa di Cohen, concordanza parziale e kappa pesato e coefficiente di correlazione intraclasse.
23 – Test di significatività per dati trasformati in ranghi
I dati per i quali possono essere espressi dei valori di rango (dati ordinali e numerici) devono essere trattati in modo diverso dai dati categorici. Ad esempio, utilizzando il test di Mann-Whitney ed il test di Kruskal-Wallis per gruppi indipendenti ed il test dei ranghi con segno di Wilcoxon ed il test di Friedman per dati appaiati.
24 – Misure di associazione per i ranghi
Qui troverai tutte le principali alternative all’indice di correlazione di Pearson: Rho di Spearman, correlazione punto-biseriale, Tau e W di Kendall, Gamma.
25 – Analisi della sopravvivenza
Questa tecnica permette di gestire situazioni in cui i soggetti entrano in uno studio clinico in tempi diversi e sono seguiti per periodi di durata diversa. Consente inoltre di confrontare due o più gruppi e di esaminare l’influenza delle diverse covariate.
26 – Misure di impatto
In questo capitolo, si parla di incidenza, prevalenza, rischio, tassi di mortalità e letalità, e del Number Needed to Treat.
Epilogo
27 – Studi di equivalenza e non inferiorità
Se l’obiettivo del tuo studio non è dimostrare una differenza tra i gruppi, ma provare che due trattamenti si equivalgono, questo è il capitolo che fa per te.
28 – Problemi, stranezze e altri capricci della scienza
Consigli pratici per scoprire valori anomali tra i dati, capire come comportarsi con i dati mancanti e cosa fare se i dati non seguono una distribuzione normale.
29 – Mettiamo tutto insieme
Capitolo breve ma ricco di schemi riassuntivi che ti aiuteranno a scegliere il test più appropriato e di formule semplificate per il calcolo della numerosità campionaria. Inoltre troverai indicazioni su come riportare in modo corretto i risultati di un’analisi statistica.
30 – Primi passi con SPSS
In breve, le basi dell’uso di SPSS: come inserire i dati, importare file esistenti e trasformare i dati.
Biostatistica: e adesso?
Ti è piaciuta questa recensione? Allora ti consiglio dare un’occhiata anche agli libri che ho già recensito: li ho raggruppati tutti insieme per te in questa pagina dedicata ai libri di statistica. Buona lettura!