Home > Doc > R: un ambiente opensource > R e la statistica ambientale

R: un ambiente opensource per l'analisi statistica dei dati

R e la statistica ambientale

In questo paragrafo si vogliono presentare brevemente alcuni packages di R di particolare interesse per la statistica ambientale. Si può consultare la seguente URL: http://agec221.agecon.uiuc.edu/csiss/Rgeo/ relativa ai progetti di analisi di dati spaziali con R per avere maggiori e più dettagliate informazioni.
Per quanto riguarda le applicazioni della geostatistica si possono considerare:

geoR: fornisce una serie di funzioni per l’analisi di dati geostatistici[16]
geoRglm: modelli spaziali lineari generalizzati[17]
gstat: modelli geostatistici univariati e multivariati, previsioni e simulazioni[18]
GRASS: interfaccia tra GRASS 5.0 geographical information system ed il software R
spatial: funzioni per kriging e point pattern analysis
spatstat: spatial Point Pattern analysis, stima del modello e simulazione[19]
splancs: Spatial and Space-Time Point Pattern Analysis[20]
sgeostat: un object-oriented framework per i modelli geostatistici
vardiag: un package per la diagnostica dei variogrammi

Relativamente alla problematica dei valori estremi è molto valido il package evd nel quale sono disponibili una serie di funzioni relative alle seguenti distribuzioni :

Distribuzione del minimo e del massimo
Distribuzione di Frechet
Generalized Extreme Value Distribution
Generalized Pareto Distribution
Distribuzione di Gumbel
Distribuzione di statistiche ordinali

con stima di massima verosimiglianza dei parametri;

Per l’utilizzo del metodo CART (Classification and Regression Tree) e degli alberi di regressione generalizzati
nello studio dei fenomeni ambientali possono essere utili i packages:

tree: Classification and regression trees
rpart: Recursive partitioning and regression trees

Si riportano di seguito alcuni comandi del software R che fanno riferimento ad alcuni argomenti trattati dal prof. Lamberto Soliani nelle dispense per il corso di “Statistica univariata e bivariata parametrica e non-parametrica nelle discipline ambientali e biologiche”. Se non è indicato espressamente i comandi fanno parte del package
stats. Per richiamare l’help on line digitare: ? nomecomando.

Tabelle di contingenza

table(): tabella di contingenza

Rappresentazioni grafiche di distribuzioni univariate

plot(): diagramma di dispersione
boxplot(): box-and-whisker plot
hist(): istogramma

Le misure di tendenza centrale

mean(): media aritmetica
median(): mediana
quantile(): quantili
summary(): vari indicatori di una distribuzione
fivenum(): Tukey Five-Number Summaries

Misure di dispersione o variabilità

sd(): standard deviation
var(): varianza

Misure di asimmetria e curtosi

kurtosis(): indice di curtosi (package e1071 oppure package fBasics)
skewness(): indice di simmetria (package e1071 oppure package fBasics)

Le seguenti funzioni sono definite dall’utente:

Misure di asimmetria

gamma1<-function(x) {
m=mean(x)
n=length(x)
s=sqrt(var(x))
m3=sum((x-m)^3)/n
g1=m3/(s^3)
return(g1)

}

skewness2<-function(x){
m=mean(x)
me=median(x)
s=sqrt(var(x))
sk=(m-me)/s
return(sk)
}
bowley<-function(x){
q<-as.vector(quantile(x,prob=c(.25,.50,.75)))
b=(q[3]+q[1]-2*q[2])/(q[3]-q[2])
return(b)
}
b3<-function(x){
m=mean(x)
me=median(x)
n=length(x)

d=sum(abs(x-me))/n
b=(m-me)/d
return(b)
}
Misure di curtosi
gamma2<- function(x) {
m<-mean(x)
s<-var(x)^2
y<-(x-m)^4
m4<-sum(y)
n<-length(x)
g<-(m4/(s*n))-3
return(g)}

Distribuzioni di probabilità discrete e continue

Beta: The Beta Distribution
Binomial: The Binomial Distribution
Cauchy: The Cauchy Distribution
Chisquare: The (non-central) Chi-Squared Distribution
Exponential: The Exponential Distribution
FDist: The F Distribution
GammaDist: The Gamma Distribution
Geometric: The Geometric Distribution
Hypergeometric: The Hypergeometric Distribution
Logistic: The Logistic Distribution
Lognormal: The Log Normal Distribution
Multinomial: The Multinomial Distribution
NegBinomial: The Negative Binomial Distribution

Normal: The Normal Distribution
Poisson: The Poisson Distribution
SignRank: Distribution of the Wilcoxon Signed Rank Statistic
TDist: The Student t Distribution
Tukey: The Studentized Range Distribution
Uniform: The Uniform Distribution
Weibull: The Weibull Distribution
Wilcoxon: Distribution of the Wilcoxon Rank Sum Statistic

Test statistici parametrici e non parametrici

ansari.test(): Ansari-Bradley Test
bartlett.test(): Bartlett Test for Homogeneity of Variances
binom.test(): Exact Binomial Test
chisq.test(): Pearson's Chi-squared Test for Count Data
cor.test(): Test for Association/Correlation Between Paired Samples
fisher.test(): Fisher's Exact Test for Count Data
friedman.test(): Friedman Rank Sum Test
kruskal.test(): Kruskal-Wallis Rank Sum Test
ks.test(): Kolmogorov-Smirnov Tests
levene.test(): Levene Test (package car)
mantelhaen.test(): Cochran-Mantel-Haenszel Chi-Squared Test for Count Data
mcnemar.test(): McNemar's Chi-squared Test for Count Data
mood.test(): Mood Two-Sample Test of Scale
oneway.test(): Test for Equal Means in a One-Way Layout
pairwise.prop.test(): Pairwise comparisons of proportions
pairwise.t.test(): Pairwise t tests
pairwise.wilcox.test(): Pairwise Wilcoxon rank sum tests
power.anova.test(): Power calculations for balanced one-way analysis of variance tests
power.prop.test(): Power calculations two sample test for of proportions power.t.test(): Power calculations for one and two sample t
prop.test(): Test for Equal or Given Proportions
quade.test(): Quade Test
t.test(): Student's t-Test
var.test(): F Test to Compare Two Variances
wilcox.test(): Wilcoxon Rank Sum and Signed Rank Tests

Analisi della varianza

aov():Fit an Analysis of Variance Model
power.anova.test(): Power calculations for balanced one-way analysis of variance tests
TukeyHSD() : Compute Tukey Honest Significant Differences
contrasts() : Get and Set Contrast Matrices

Test di normalità

ad.test(): Anderson-Darling test for normality (package nortest)
cvm.test(): Cramer-von Mises test for normality (package nortest)
lillie.test(): Lilliefors (Kolmogorov-Smirnov) test for normality (package nortest)
pearson.test(): Pearson chi-square test for normality (package nortest)
sf.test(): Shapiro-Francia test for normality (package nortest)
shapiro.test(): Shapiro-Wilk Normality Test
jarque.bera.test() : Jarque-Bera Test for Normality (package tseries)
qqnorm(): normal QQ plot

Regressione lineare semplice e multipla

lm(): Fitting Linear Models
coef(): Extract Model Coefficients
fitted():Extract Model Fitted Values
predict():Model Predictions
anova(): ANOVA tables lm.influence(): Regression Diagnostics
confint() : Confidence Intervals for Model Parameters
bptest(): Breusch-Pagan Test
dwtest(): Durbin-Watson Test

Correlazione

cor(): coefficiente/matrice di correlazione
cor.test(): Test for Association/Correlation Between Paired Samples


16 Si veda l’articolo: Paulo J. Ribeiro, Jr. and Peter J. Diggle. geoR: A package for geostatistical analysis. R News, 1(2):15-18, June 2001

17 Si veda l’articolo: Ole F. Christensen and Paulo J. Ribeiro. georglm: A package for generalised linear spatial models. R News, 2(2):26-28, June 2002.

19 Si veda il sito: http://www.maths.uwa.edu.au/~adrian/spatstat.html

20 Si veda il sito: http://www.maths.lancs.ac.uk/~rowlings/Splancs/

Vito Ricci

Successivo: Conclusioni e Bibliografia

Sommario: Index