Biostatistica essenziale: una guida non matematica

17 Dicembre 2022 | Formazione

Stai cercando di capire il perché si fa una certa analisi statistica piuttosto che un’altra? Oppure il cosa significa nel concreto un certo indice o una certa probabilità? Allora questo manuale è perfetto per te. Perché è proprio una guida al ragionamento statistico che sta dietro le formule ed i termini tecnici. Al suo interno troverai, infatti, molti consigli pratici su come comprendere i principali risultati statistici di un’elaborazione dati ed evitare errori concettuali nella loro interpretazione. Perfetto se ti occupi di biostatistica, ma adatto anche per altri settori.

Biostatistica essenziale

Chi è l’autore?

L’autore del libro è Harvey Motulsky. Dopo aver conseguito la laurea in Medicina, Harvey si è focalizzato sulla ricerca clinica, insegnando anche biostatistica agli studenti di medicina e scienze biomediche dell’Università della California per oltre un decennio. Stanco di creare grafici a mano, e stufo di non trovare un software che gli permettesse di farlo in modo intuitivo ma professionale, Harvey ha infatti deciso di crearselo da sé. Anche se questo nome potrebbe suonarti poco familiare, probabilmente hai già sentito parlare di lui. Harvey è infatti il fondatore e CEO di Graphpad, uno dei software più utilizzati per le analisi cliniche.

Perché questo libro?

Il testo originale e completo su cui si basa questo libro è Intuitive Biostatistics. Scritto dallo stesso autore ampliando il programma dei corsi che teneva all’università, questo manuale è diventato uno dei più diffusi in ambito accademico per l’insegnamento della statistica. Il mix di esperienza universitaria, ricerca clinica e gestione software, gli ha permesso di confrontarsi con le problematiche concrete di molti studenti e ricercatori e di comprendere su quali sono i concetti statistici che tendono ad essere confusi o fraintesi più spesso. E proprio questo è il “segreto” che rende il suo libro diverso da tutti gli altri.

I punti di forza

Intuitive Biostatistics è però attualmente disponibile solo in inglese ed è un vero e proprio tomo costituito da 48 capitoli e 608 pagine. Non esattamente una guida snella da tenere sempre a portata di mano come riferimento. Ed è proprio partendo da quest’ultima esigenza che è nato Biostatistica essenziale: una versione più breve ed economica che riassume i punti chiave da conoscere per poter interpretare correttamente i risultati di uno studio e comprendere le differenze tra le varie tecniche di analisi.

I punti di debolezza

Tuttavia, il termine “essenziale” è preso molto alla lettera dall’autore. In diversi punti infatti si viene genericamente rimandati ad altri testi per approfondire, ma senza fornire alcuni riferimento bibliografico. Questo è il motivo principale per cui ti consiglio di considerare questo libro come un bignami da affiancare ad un manuale più completo, e non come unica fonte su cui formarti.

Quale è la struttura del libro?

Il manuale è composto da 238 pagine ed è suddiviso in 26 capitoli. Non aspettarti però il classico libro di statistica che entra a fatica nello zaino. Uno dei punti di forza della guida è infatti il suo formato: un A5 comodissimo da tenere sempre a portata di mano.

1. Statistica e probabilità non sono concetti intuitivi

Questo capitolo introduttivo ti aiuterà a comprendere perché alcuni concetti statistici ti risultano così ostici. Nella vita quotidiana, il nostro cervello è allenato a prendere decisioni in tempi rapidi, basandosi su quanto conosce e sulla ricerca di tendenze. Questo approccio fa però sì che non ci aspettiamo che la variabilità dipenda dalla dimensione del campione, i confronti multipli ci ingannano, tendiamo a ignorare possibili spiegazioni alternative e che desidereremmo conclusioni univoche invece della probabilità che restituisce in output un’elaborazione statistica.

2. La probabilità è un concetto complesso

Partendo da un ripasso degli elementi base e dalla loro terminologia, qui troverai spiegato come evitare gli errori più comuni che si fanno nell’interpretare la probabilità sia come previsione di frequenza sul lungo periodo che come forza della convinzione personale (ovvero, la probabilità Bayesana).

3. Dal campione alla popolazione

Consigli pratici su come estrarre un campione da una popolazione e fino a che punto è possibile generalizzare i risultati di uno studio campionario.

4. Gli intervalli di confidenza

Partendo da due esempi concreti, questo capitolo spiega cosa significa veramente “confidenza al 95%” e come gli intervalli vadano interpretati a seconda del loro contesto.

5. Tipi di variabili

Qui troverai indicazioni su come distinguere le diverse tipologie di variabili utilizzate in statistica: continue, ordinali e nominali

6. Rappresentazione grafica della variabilità

Come visualizzare la dispersione e della distribuzione dei dati, facendo attenzione ai dati preprocessati.

7. Quantificare la variabilità

Una panoramica delle principali tecniche statistiche utilizzabili come indici di variabilità: range assoluto ed interquartile, percentili, deviazione standard e coefficiente di variazione

8. La distribuzione gaussiana

Qui troverai spiegato da dove deriva la distribuzione gaussiana e perché è così utilizzata in statistica ma, soprattutto, il significato della deviazione standard in una distribuzione gaussiana

9. La distribuzione log-normale e la media geometrica

Se la distribuzione Normale si basa sul concetto di media aritmetica, la distribuzione log-normale richiama invece la media geometrica. Questo capitolo ti spiega proprio quando i dati sono log-normali.

10. L’intervallo di confidenza per la media

Come interpretare l’intervallo di confidenza per la media, quali valori lo determinano e quali sono i presupposti per poterlo utilizzare, che cos’è l’errore standard della media

11. Le barre di errore

Come interpretare le diverse tipologie di barre di errore e quale utilizzare.

12. Confronto tra gruppi attraverso gli intervalli di confidenza

Alcuni esempi di intervalli di confidenza utilizzati per confrontare i gruppi e la spiegazione degli errori più frequenti.

13. Confronto tra gruppi attraverso il p-value

Quattro cose che devi sapere sul p-value e la regola che lo collega all’intervallo di confidenza.

14. I test di significatività statistica e i test di ipotesi

Come testare un’ipotesi attraverso la statistica e cosa si intende con espressioni come “estremamente significativo” oppure “al limite della significatività”.

15. Interpretare un risultato che è (o non è) statisticamente significativo

Cinque possibili motivi per cui si è ottenuto un risultato “non statisticamente significativo” e come evitare errori più frequenti.

16. Quanto sono comuni gli errori di tipo I

Cos’è un errore di tipo I, con quale frequenza si verifica, e come la probabilità a priori influenza il false discovery rate

17. I confronti multipli

Perché i confronti multipli sono un problema e come affrontarli nel modo corretto.

18. La potenza statistica e la dimensione del campione

Perché determinare la dimensione di un campione nel corso di uno studio, e non prima di iniziarlo, porta a risultati fuorvianti.

19. Test statistici di uso comune

Un breve (a mio parere, troppo) ripasso dei principali test per confrontare una variabile continua tra due o più gruppi, una variabile binaria tra due gruppi, delle curve di sopravvivenza e di quando usare correlazione e regressione

20. I test di normalità

Quali sono i problemi connessi all’uso dei test di normalità e le alternative al presupposto della distribuzione gaussiana

21. Gli outlier

Da dove derivano gli outlier e cinque domande da porsi prima di effettuare un test per gli outlier

22. La correlazione

I presupposti della correlazione e del relativo coefficiente.

23. La regressione lineare semplice

A cosa serve la regressione lineare ed a quali risultati può portare

24. Regressione non lineare, regressione multipla e regressione logistica

Una breve introduzione (come per il capitolo 19, a mio parere fin troppo generale) ai modelli di regressione alternativi a quello lineare semplice.

25. Errori da evitare

Non riconoscere eventuali bias di pubblicazione, verificare ipotesi suggerite dai dati e non formulate prima 201, vedere una causalità ogni volta che i dati indicano una correlazione, sopravvalutare gli studi che analizzano variabili proxy oppure i risultati di uno studio osservazionale e farsi ingannare dalla “regressione verso la media” sono tutti esempi di errori che potrai trovare spiegati in questo capitolo finale

E adesso?

Ti è piaciuta questa recensione? Allora ti consiglio dare un’occhiata anche agli libri di statistica che ho già recensito: li ho raggruppati tutti insieme per te in questa pagina dedicata ai libri di statistica. Buona lettura!

*Contiene link affiliati

Articoli correlati

Paola Pozzolo

Paola Pozzolo

Sono Paola Pozzolo e mi occupo di consulenze e formazione statistica. Ti aiuto a trasformare i dati in informazioni utili ed affidabili per raggiungere i tuoi obiettivi di ricerca e prendere le decisioni che più valorizzeranno il tuo lavoro.