Home > Doc > R: un ambiente opensource > Introduzione a R

R: un ambiente opensource per l'analisi statistica dei dati

Introduzione a R

Esiste in circolazione una gamma assai vasta di software specializzati nell'analisi statistica dei dati, basta ricordare SAS, SPSS, STATA, STATGRAPHICS PLUS, SHAZAM, S PLUS, MINITAB, GAUSS, etc., solo per citarne alcuni che sono in commercio. Sono prodotti che costituiscono senz'altro un fondamentale ed insostituibile ausilio per il lavoro dello statistico, tuttavia molti di questi programmi sono anche alquanto costosi ed è consentito l'uso su licenza da parte del produttore.

Da alcuni anni a questa parte, soprattutto in ambito universitario (ma non solo) si sta sempre più diffondendo un nuovo package che merita di sicuro una debita trattazione e l'interessamento da parte degli statistici e di coloro che fanno analisi dei dati e che costituisce anche una valida alternativa ai software sopraccitati. Ci stiamo riferendo al software R. Probabilmente qualcuno forse lo conosce già e lo adopera, altri ne avranno solo sentito parlare, per altri ancora è una novità assoluta. R è un ambiente statistico scaricabile gratuitamente da Internet sul sito di The R Project for Statistical Computing il cui indirizzo Internet è http://www.r-project.org[1].

Esso è il frutto del lavoro collettivo svolto da un gruppo, sempre più folto, di ricercatori in campo statistico ed informatico a livello mondiale. R più che un software statistico può essere definito come un ambiente, costituito da una varietà di strumenti, orientato alla gestione, all'analisi dei dati e alla produzione di grafici, basato sul linguaggio S creato da AT&T Bell Laboratories, ambiente dal quale è nato un altro software commerciale più noto, S-Plus, prodotto prima da MathSoft e ora da Insightful.

R, a differenza di quest'ultimo è un GNU-Software[2], ossia è disponibile gratuitamente sotto i vincoli della GPL (General Public License)[3]: chiunque può accedere al codice sorgente e modificarlo, migliorarlo, integrarlo e mettere a disposizione della comunità scientifica il proprio lavoro nella logica e nella filosofia del software opensource. La versione iniziale di R venne sviluppata nel 1996 per il sistema operativo MacOS da Ross Ihaka e Robert Gentelman del dipartimento di Statistica dell'Università di Auckland in Nuova Zelanda[4].

Successivamente altri ricercatori iniziarono ad aggiungersi e a fornire il loro contributo alla scrittura del codice sorgente e al miglioramento dell'applicazione, sviluppata in seguito anche per l'ambiente UNIX. Nel 1997 è nato l'R Development Core Team, gruppo formato da statistici di tutto il mondo che si occupano dello sviluppo e della distribuzione del programma e, ancora più recentemente, nel 2003 è stata costituita dagli stessi membri dell'R Develpoment Core Team la R Foundation for Statistical Computing.

Si tratta di una organizzazione non profit che lavora per il pubblico interesse allo scopo di promuovere lo sviluppo (attuale e futuro) e la diffusione del software, di fornire un punto di riferimento per persone, istituzioni ed imprese che desiderano sostenere il progetto e interagire con la community che ruota intorno ad R, di gestire e tutelare il copyright di R e della relativa documentazione. Quest'anno dal 20 al 22 maggio si è svolta a Vienna la prima conferenza dedicata agli utilizzatori di R [5]


1 Attualmente del software R è disponibile la versione 2.0.1 rilasciata il 15/11/04

2 Per un approfondimento del progetto GNU si consulti il sito Internet http://www.gnu.org

4 Ross Ihaka and Robert Gentleman, R: A language for data analysis and graphics. Journal of Computational and Graphical Statistics, 5(3):299-314, 1996

5 Per informazioni sulla conferenza si veda l'URL: http://www.ci.tuwien.ac.at/Conferences/useR-2004/

Successivo: Che cos'è R

Sommario: Index