La metodica di bootstrap
Inviato: mer 6 nov 2013, 13:55
Non dirò mai abbastanza di quanto si debba diffidare delle misure campionarie.
Quando misuriamo delle spore, (ma il ragionamento vale per qualsiasi altra misura) dobbiamo sempre essere coscienti che compiamo degli errori di campionamento.
Questi errori sono inevitabili, benchè noi possiamo adottare tutte le cautele del caso.
Gli errori dipendono da molti fattori; inclusa la variabilità intrinseca presente in ogni basidioma
Di seguito riporto il grafico relativo alle lunghezze sporali di B. luridus. Si tratta di un campione con n=39 misure.
Come si può vedere dall'istogramma, la distribuzione è fortemente asimmetrica e leptocurtica ( le unità statistiche si addensano molto intorno alla media).
Tale distribuzione è ben lungi da quella normale.
Noi sappiamo, per avere attentamente studiato la popolazione di B. luridus che la sua distribuzione delle misure sporali è normale.
La differenza va perciò atribuita proprio agli errori di campionamento.
Ma, se non sono noti i valori "veri" della popolazione, come facciamo a capire, partendo dal campione, se la popolazione sia normale o se il campione difetti di rappresentatività per via degli errori?
Ci viene in soccorso la tecnica di bootstrap.
Il bootstrap è una metodica di ricampionamento. In pratica il campione che abbiamo a disposizione viene considerato come se fosse l'intera popolazione e, al suo interno, vengono ricombinate, in modo del tutto casuale, n seriazioni; in modo tale da distribuire l'errore su un numero sufficientemente grande di pseudo-campioni.
Di solito il ricampionamento si fa ricostruendo 1.000-2.000 e anche piu' seriazioni casuali ( sempre ricomponendo le unità statistiche dello stesso campione)
In questo modo, se la popolazione è normale, attesi i criteri di casualità ripetitività e indipendenza, dovremmo ottenere un istogramma di frequenze normale o approssimativamente normale.
Infatti è quello che riscontriamo.
Quando misuriamo delle spore, (ma il ragionamento vale per qualsiasi altra misura) dobbiamo sempre essere coscienti che compiamo degli errori di campionamento.
Questi errori sono inevitabili, benchè noi possiamo adottare tutte le cautele del caso.
Gli errori dipendono da molti fattori; inclusa la variabilità intrinseca presente in ogni basidioma
Di seguito riporto il grafico relativo alle lunghezze sporali di B. luridus. Si tratta di un campione con n=39 misure.
Come si può vedere dall'istogramma, la distribuzione è fortemente asimmetrica e leptocurtica ( le unità statistiche si addensano molto intorno alla media).
Tale distribuzione è ben lungi da quella normale.
Noi sappiamo, per avere attentamente studiato la popolazione di B. luridus che la sua distribuzione delle misure sporali è normale.
La differenza va perciò atribuita proprio agli errori di campionamento.
Ma, se non sono noti i valori "veri" della popolazione, come facciamo a capire, partendo dal campione, se la popolazione sia normale o se il campione difetti di rappresentatività per via degli errori?
Ci viene in soccorso la tecnica di bootstrap.
Il bootstrap è una metodica di ricampionamento. In pratica il campione che abbiamo a disposizione viene considerato come se fosse l'intera popolazione e, al suo interno, vengono ricombinate, in modo del tutto casuale, n seriazioni; in modo tale da distribuire l'errore su un numero sufficientemente grande di pseudo-campioni.
Di solito il ricampionamento si fa ricostruendo 1.000-2.000 e anche piu' seriazioni casuali ( sempre ricomponendo le unità statistiche dello stesso campione)
In questo modo, se la popolazione è normale, attesi i criteri di casualità ripetitività e indipendenza, dovremmo ottenere un istogramma di frequenze normale o approssimativamente normale.
Infatti è quello che riscontriamo.