Imparare R: da dove iniziare?

22 Maggio 2021 | Software e strumenti

Vuoi imparare il linguaggio di R per poterne sfruttare in autonomia le sue potenzialità o comunicare al meglio con un professionista per l’esecuzione dei calcoli più complessi ma non sai da che parte iniziare? In questo articolo ti aiuterò a fare un po’ di chiarezza su questo software così da trovare l’approccio migliore per te.

libreria R Commander

Che cos’è R?

R è un software gratuito sviluppato appositamente per le analisi statistiche. Le sue potenzialità sono davvero enormi e la sua flessibilità è praticamente infinita. Tuttavia, per chi vi approccia per la prima volta, o anche ci riprova per la seconda o la terza volta a distanza di tempo, capire come orientarsi può risultare davvero difficile e generare più qualche malditesta.

Se anche tu ti trovi in questa situazione, o semplicemente questo software ti incuriosisce e vorresti saperne di più, o stai cercando un approccio pratico a questo software, sei nel posto giusto. In questo articolo ti svelerò infatti tutti i suggerimenti che nel tempo più si sono rivelati efficaci per i miei studenti e clienti nell’approccio a tale mondo.

Perché R è proprio un mondo, in gergo tecnico, un ambiente di lavoro, che ha un linguaggio, una grammatica e delle regole tutte sue. Ed entrare in questo mondo può rivelarsi estremamente interessante ma anche molto sfidante.

Imparare R: quando ha senso farlo?

Prima di avventurarti in questo mondo, ti consiglio di prenderti un momento per valutare se R è davvero la soluzione giusta per te. La curva di apprendimento di R è infatti molto più ripida all’inizia rispetto a quella dei software ad interfaccia grafica e pertanto ha senso approcciarti a tale software solo se hai abbastanza tempo da dedicarci.

Se hai una scadenza a breve, se il tuo obiettivo è fare le “classiche” analisi dei dati, ma anche se tu e l’inglese non andate per nulla d’accordo, R forse non è il software che in questo momento fa al caso tuo.

Un’alternativa ad R per le analisi di base: Excel

Se hai poche variabili da analizzare, una numerosità campionaria che non supera il milione di unità statistiche e devi fare analisi di base (descrittive, ANOVA, regressione lineare), potrebbe essere sufficiente Excel (sfruttando magari le tabelle pivot e lo Strumento Analisi Dati per velocizzare le analisi).

Altre alternative ad R: SPSS, jamovi e jasp

Se poi il numero di variabili da analizzare è più elevato e/o devi effettuare analisi già un po’ più complesse (ad esempio, analisi fattoriali, regressioni logistiche o l’analisi dei cluster) allora potresti valutare software come SPSS (a pagamento ma con versioni davvero a buon prezzo per gli studenti) oppure jamovi (gratuito).

Jamovi poi potrebbe essere un buon software intermedio anche se finora hai lavorato su SPSS ma hai deciso di passare ad R. Questo software nasce infatti come alternativa gratuita a SPSS, di cui riprende molto l’impostazione nell’interfaccia grafica. Tuttavia, il codice che ci sta dietro è scritto in R. Questo fa sì che ad esempio alcuni moduli con analisi aggiuntive disponibili su jamovi hanno gli stessi nomi e producono risultati molto simili a quelli che si otterrebbero con i corrispettivi pacchetti su R.

Se poi il tuo obiettivo sono invece le analisi bayesiane, allora invece di jamovi ti consiglio di dare un’occhiata a jasp.

Il pacchetto R Commander

R potrebbe invece essere proprio la soluzione giusta per te se:

  • devi lavorare con dataset di grandi dimensioni
  • devi svolgere analisi che richiedono un’elevata personalizzazione
  • ti servono grafici esteticamente più belli di quelli disponibili su SPSS o jamovi
  • vuoi utilizzare una funzione non disponibile tramite interfaccia grafica

Se però hai tempo limitato da dedicare allo studio o temi di incartarti alla prima riga di codice, c’è ancora una soluzione “intermedia” che puoi valutare.

R è infatti un ambiente di lavoro che nella sua versione base presenta una finestra di dialogo abbastanza “ostile” in cui bisogna scrivere codice. Tuttavia, dispone anche di pacchetti aggiuntivi che possono essere scaricati gratuitamente dal CRAN (un archivio online contenente materiale aggiuntivo su R). Alcuni di questi pacchetti sono stati pensati proprio per rendere più “confortevole” l’ambiente di R. Tra i vari disponibili, il mio preferito è R Commander.

Questo pacchetto (il cui nome tecnico è Rcmdr) installa infatti una vera e propria interfaccia grafica.

Questa soluzione ti permette di dialogare con R in maniera relativamente simile a come forse fai già con Excel, SPSS o jamovi. Il vantaggio di R Commander, infatti, non è solo quello di rendere le analisi “classiche” più intuitive. Ma anche di introdurti in modo più “soft” al codice di R. Inoltre, questa interfaccia grafica è disponibile anche in italiano.

Tutto quello che fai tramite interfaccia grafica viene infatti trascritto in automatico da R in codice che viene visualizzato nella finestra della sintassi. Questo codice è modificabile. Questo significa che, invece di dover iniziare subito a scrivere codice, puoi partire osservando cosa succede agendo su singoli parametri. Ad esempio, cambiando l’opzione del colore di un grafico, o scegliendo tra un metodo ed un altro.

R studio

Infine, se le tue analisi non rientrano tra quelle standard o scrivere codice non ti spaventa, allora ti consiglio come prima cosa di installare R Studio. E’ un’altra interfaccia grafica di R, molto più minimale di R Commander. Tuttavia, ti permetterà di scrivere codice più velocemente di R grazie all’auto-completamento delle funzioni ed alla sintassi evidenziata con colori diversi.

R Studio è sostanzialmente una versione (disponibile solo in inglese) più elaborata della console di R. La sua interfaccia rende infatti più semplice sia l’importazione dei dati sia la loro gestione ed analisi rispetto alla console classica di R. Se hai scelto quest’ultima strada, il libro che ti consiglio per iniziare è R in Action di Robert I. Kabacoff.

Imparare R: e adesso?

Ricapitolando, se tra i vari software R ti sembra il più adatto per le tue esigenze, le due strade che ti consiglio di intraprendere per iniziare ad orientarti in questo mondo sono R Commander per un approccio più soft ed R Studio per un approccio più rapido.

Nel secondo caso troverai tantissimi tutorial gratuiti online, che ti possono guidare passo passo nello svolgimento delle varie analisi dati. Nel primo caso invece il materiale online, soprattutto in italiano, è molto più limitato e proprio per questo tra le mie proposte di formazione troverai proprio un corso individuale su R Commander. Dagli un’occhiata!

Articoli correlati

Paola Pozzolo

Paola Pozzolo

Sono Paola Pozzolo e mi occupo di consulenze e formazione statistica. Ti aiuto a trasformare i dati in informazioni utili ed affidabili per raggiungere i tuoi obiettivi di ricerca e prendere le decisioni che più valorizzeranno il tuo lavoro.