Sommario:
Per fare stime su una popolazione, gli statistici usano un campione casuale rappresentativo della popolazione. Ad esempio, se pesassi 50 donne americane casuali, potresti stimare il peso di tutte le donne americane in base al loro peso medio. L'errore di campionamento si verifica quando i risultati del campione si discostano dal valore della popolazione reale. Cioè, se le tue 50 donne producessero un peso medio di 135 sterline quando la media reale era di 150 libbre, allora il tuo errore di campionamento è -15 (il minimo osservato effettivo), significa che hai sottostimato il vero valore di 15 punti. Poiché il valore reale è raramente noto, gli statistici usano altre stime come l'errore standard e gli intervalli di confidenza per stimare l'errore di campionamento.
Passo
Calcola la percentuale che stai misurando. Ad esempio, se vuoi sapere quale percentuale di studenti in una determinata scuola fuma sigarette, quindi prendi un campione casuale (diciamo n, la nostra dimensione del campione, è uguale a 30), falli compilare un sondaggio anonimo e calcola la percentuale di studenti che dicono di fumare. Per l'illustrazione, diciamo che sei studenti hanno detto che fumano. Quindi la percentuale che fuma = (# chi fuma) / (numero totale di studenti misurati) x 100% = 6/30 x 100% = 20%.
Passo
Calcola l'errore standard. Poiché non conosciamo la percentuale effettiva di studenti che fumano, possiamo solo approssimare l'errore di campionamento calcolando l'errore standard. Nelle statistiche, usiamo proporzione, p, invece di percentuali per i calcoli, quindi convertiamo il 20% in proporzione. Dividendo il 20% del 100%, ottieni p = 0.20. Errore standard (SE) per campioni di grandi dimensioni = sqrt p x (1 - p) / n, dove sqrt x significa prendere la radice quadrata di x. In questo esempio, otteniamo SE = sqrt 0,2 x (0,8) / 30 = sqrt 0,00533 …? 0,073.
Passo
Crea un intervallo di confidenza. Limite inferiore: proporzione stimata - 1,96 x SE = 0,2 - 1,96 (0,073) = 0,0569 Limite superiore: proporzione stimata + 1,96 x SE = 0,2 + 1,96 (0,073) = 0,343 Si direbbe quindi che siamo sicuri al 95% della proporzione effettiva di fumatori è tra 0,0569 e 0,343, o come percentuale, il 5,69% o il 34,3% degli studenti fuma. Questa ampia diffusione indica la possibilità di un errore di campionamento piuttosto ampio.
Passo
Misura tutti per calcolare l'esatto errore di campionamento. Fai completare a tutti gli studenti della scuola il sondaggio anonimo e calcola la percentuale di studenti che hanno dichiarato di fumare. Diciamo che sono stati 120 studenti su 800 a dire che hanno fumato, quindi la nostra percentuale è 120/800 x 100% = 15%. Pertanto, il nostro "errore di campionamento" = (stimato) - (effettivo) = 20 - 15 = 5. Più vicino a zero, migliore è la stima e minore è il nostro errore di campionamento. In una situazione del mondo reale, tuttavia, non è probabile che tu conosca il valore effettivo e dovrai fare affidamento sul SE e sull'intervallo di confidenza per l'interpretazione.