Pagina 1 di 1

La metodica di bootstrap

Inviato: mer 6 nov 2013, 13:55
da DanieleU
Non dirò mai abbastanza di quanto si debba diffidare delle misure campionarie.
Quando misuriamo delle spore, (ma il ragionamento vale per qualsiasi altra misura) dobbiamo sempre essere coscienti che compiamo degli errori di campionamento.
Questi errori sono inevitabili, benchè noi possiamo adottare tutte le cautele del caso.
Gli errori dipendono da molti fattori; inclusa la variabilità intrinseca presente in ogni basidioma

Di seguito riporto il grafico relativo alle lunghezze sporali di B. luridus. Si tratta di un campione con n=39 misure.
Come si può vedere dall'istogramma, la distribuzione è fortemente asimmetrica e leptocurtica ( le unità statistiche si addensano molto intorno alla media).
Tale distribuzione è ben lungi da quella normale.
Noi sappiamo, per avere attentamente studiato la popolazione di B. luridus che la sua distribuzione delle misure sporali è normale.
La differenza va perciò atribuita proprio agli errori di campionamento.
Ma, se non sono noti i valori "veri" della popolazione, come facciamo a capire, partendo dal campione, se la popolazione sia normale o se il campione difetti di rappresentatività per via degli errori?
Ci viene in soccorso la tecnica di bootstrap.
Il bootstrap è una metodica di ricampionamento. In pratica il campione che abbiamo a disposizione viene considerato come se fosse l'intera popolazione e, al suo interno, vengono ricombinate, in modo del tutto casuale, n seriazioni; in modo tale da distribuire l'errore su un numero sufficientemente grande di pseudo-campioni.
Di solito il ricampionamento si fa ricostruendo 1.000-2.000 e anche piu' seriazioni casuali ( sempre ricomponendo le unità statistiche dello stesso campione)
In questo modo, se la popolazione è normale, attesi i criteri di casualità ripetitività e indipendenza, dovremmo ottenere un istogramma di frequenze normale o approssimativamente normale.
Infatti è quello che riscontriamo.

Re: La metodica di bootstrap

Inviato: mer 6 nov 2013, 14:02
da DanieleU
Ora impartiamo al programma le istruzioni per calcolare il bootstrap ( utilizzo R, libreria "boot") .
> library(boot)
> luri<-(luridusG$lunghezza)
> mean(luri)
[1] 13.24216
> sd(luri)
[1] 0.5653604
> m<-NULL
> for(i in 1:2000) {x<-sample(luri, replace=TRUE);m<-c(m,mean(x))}
> mean(m)
[1] 13.24336
> sd(m)
[1] 0.08825697

Si noti come, dopo bootstrap, la media rimanga sostanzialmente invariata mentre è sensibilmente corretta la deviazione standard ( che è poi quella che disegna la curva di distribuzione)
ora assegnando il comando:
> hist(m)
otteniamo l'istogramma dopo bootstrap.
La curva è pressochè normale.
Dunque la stima della popolazione di B. luridus, al netto degli errori di campionamento, restituisce la funzione di distribuzione qui rappresentata dall'istogramma.
Ed è quanto volevasi dimostrare.

Re: La metodica di bootstrap

Inviato: mer 6 nov 2013, 14:04
da DanieleU
Di seguito la misura dei parametri dai quali siamo partiti col campione originale