La metodica di bootstrap

Metodologie di studio e discussioni varie
Rispondi
DanieleU
Novizio
Messaggi: 541
Iscritto il: lun 3 mag 2010, 11:22
Cognome: Uboldi
Nome: Daniele
Provenienza: Milano

La metodica di bootstrap

Messaggio da DanieleU »

Non dirò mai abbastanza di quanto si debba diffidare delle misure campionarie.
Quando misuriamo delle spore, (ma il ragionamento vale per qualsiasi altra misura) dobbiamo sempre essere coscienti che compiamo degli errori di campionamento.
Questi errori sono inevitabili, benchè noi possiamo adottare tutte le cautele del caso.
Gli errori dipendono da molti fattori; inclusa la variabilità intrinseca presente in ogni basidioma

Di seguito riporto il grafico relativo alle lunghezze sporali di B. luridus. Si tratta di un campione con n=39 misure.
Come si può vedere dall'istogramma, la distribuzione è fortemente asimmetrica e leptocurtica ( le unità statistiche si addensano molto intorno alla media).
Tale distribuzione è ben lungi da quella normale.
Noi sappiamo, per avere attentamente studiato la popolazione di B. luridus che la sua distribuzione delle misure sporali è normale.
La differenza va perciò atribuita proprio agli errori di campionamento.
Ma, se non sono noti i valori "veri" della popolazione, come facciamo a capire, partendo dal campione, se la popolazione sia normale o se il campione difetti di rappresentatività per via degli errori?
Ci viene in soccorso la tecnica di bootstrap.
Il bootstrap è una metodica di ricampionamento. In pratica il campione che abbiamo a disposizione viene considerato come se fosse l'intera popolazione e, al suo interno, vengono ricombinate, in modo del tutto casuale, n seriazioni; in modo tale da distribuire l'errore su un numero sufficientemente grande di pseudo-campioni.
Di solito il ricampionamento si fa ricostruendo 1.000-2.000 e anche piu' seriazioni casuali ( sempre ricomponendo le unità statistiche dello stesso campione)
In questo modo, se la popolazione è normale, attesi i criteri di casualità ripetitività e indipendenza, dovremmo ottenere un istogramma di frequenze normale o approssimativamente normale.
Infatti è quello che riscontriamo.
Allegati
hist_luridusG.png
hist_luridusG.png (13.25 KiB) Visto 5825 volte
DanieleU
Novizio
Messaggi: 541
Iscritto il: lun 3 mag 2010, 11:22
Cognome: Uboldi
Nome: Daniele
Provenienza: Milano

Re: La metodica di bootstrap

Messaggio da DanieleU »

Ora impartiamo al programma le istruzioni per calcolare il bootstrap ( utilizzo R, libreria "boot") .
> library(boot)
> luri<-(luridusG$lunghezza)
> mean(luri)
[1] 13.24216
> sd(luri)
[1] 0.5653604
> m<-NULL
> for(i in 1:2000) {x<-sample(luri, replace=TRUE);m<-c(m,mean(x))}
> mean(m)
[1] 13.24336
> sd(m)
[1] 0.08825697

Si noti come, dopo bootstrap, la media rimanga sostanzialmente invariata mentre è sensibilmente corretta la deviazione standard ( che è poi quella che disegna la curva di distribuzione)
ora assegnando il comando:
> hist(m)
otteniamo l'istogramma dopo bootstrap.
La curva è pressochè normale.
Dunque la stima della popolazione di B. luridus, al netto degli errori di campionamento, restituisce la funzione di distribuzione qui rappresentata dall'istogramma.
Ed è quanto volevasi dimostrare.
Allegati
hist_boot_luridusG.png
hist_boot_luridusG.png (15.16 KiB) Visto 5824 volte
DanieleU
Novizio
Messaggi: 541
Iscritto il: lun 3 mag 2010, 11:22
Cognome: Uboldi
Nome: Daniele
Provenienza: Milano

Re: La metodica di bootstrap

Messaggio da DanieleU »

Di seguito la misura dei parametri dai quali siamo partiti col campione originale
Allegati
summary_luridusG.png
summary_luridusG.png (17.26 KiB) Visto 5824 volte
Rispondi