Calcolatore di dimensioni del campione
Trovare il volume del campione
Il calcolatore calcola il numero minimo di campioni necessari per soddisfare i vincoli statistici richiesti.
Scopri il margine di errore
Questa calcolatrice fornisce un intervallo di errore o un intervallo di confidenza per l'osservazione o l'indagine.
In statistica, le informazioni sulla popolazione vengono spesso dedotte studiando un numero limitato di individui nella popolazione, cioè la popolazione è campionata e si presume che le caratteristiche del campione rappresentino l'intera popolazione. Per quanto segue, supponendo che tali gruppi di individui esistano, di PLe persone sono diverse dagli altri. 1 - P in qualche modo; per esempio, di P Probabilmente la percentuale di persone con i capelli marroni, mentre il resto 1 - P Nero, oro, rosso e così via. Pertanto, è necessario stimare di P Nella folla, il campione di N Gli individui possono essere prelevati dalla popolazione, la proporzione del campione, Pish diSono stati calcolati individualmente per un campione di capelli marroni. Sfortunatamente, a meno che non venga eseguito un sondaggio di campionamento di tutta la popolazione, le stime Pish di Probabilmente non corrisponde al valore reale. di Pdal momento che Pish di È influenzato dal rumore di campionamento, cioè dipende dall'individuo specifico che viene campionato. Tuttavia, le statistiche di campionamento possono essere utilizzate per calcolare il cosiddetto intervallo di confidenza, che è un'indicazione di quanto si avvicina una stima. Pish di è il valore reale. di P.
Statistiche di campioni casuali
l'incertezza in un dato campione casuale (cioè una stima della proporzione prevista, Pish diÈ un'ottima approssimazione delle proporzioni reali, ma non è perfetta di PSi può riassumere in questa stima Pish di Distribuzione media normale di P e le differenze Fosforo / azoto. Per sapere perché le stime del campione sono distribuite normalmente, studiare Teoria dei limiti centrali. Come definito di seguito, il livello di confidenza, l'intervallo di confidenza e la dimensione del campione vengono calcolati in relazione alla distribuzione del campione. In breve, l'intervallo di confidenza fornisce un valore approssimativo di di P Tra questi si stima Pish di “Probabilmente” sì. Il grado di confidenza dà quanto è "probabile" questo & ndash Ad esempio, un livello di confidenza del 95% indica una stima attesa Pish di L'intervallo di confidenza è pari al 95% di un campione casuale. L'intervallo di confidenza dipende dalla dimensione del campione. di N (La varianza della distribuzione del campione è inversa di NCiò significa che le stime sono più vicine alle proporzioni reali, perché di N aumento); Pertanto, è anche possibile impostare un tasso di errore accettabile nella stima, chiamato limite di errore, di &ε;e risolvere che l'intervallo di confidenza selezionato è inferiore alla dimensione del campione desiderata. e.; Un metodo di calcolo chiamato "calcolo del volume del campione"
credibilità
Il livello di confidenza è una misura della certezza che il campione riflette accuratamente la popolazione studiata all'interno dell'intervallo di confidenza selezionato. I livelli di confidenza più comunemente utilizzati sono 90%, 95% e 99% e, a seconda del livello di confidenza selezionato, ogni livello di confidenza ha un punteggio z corrispondente (che può essere trovato utilizzando una formula o una tabella ampiamente disponibile, come mostrato di seguito). Si noti che l'uso del punteggio z presuppone che la distribuzione del campione sia distribuita normalmente, come descritto in "Statistiche per campioni casuali" sopra. Supponendo che un esperimento o un sondaggio si ripeta più volte, il livello di confidenza rappresenta essenzialmente la percentuale di tempo in cui l'intervallo di risultati del test ripetuto contiene risultati reali.
credibilità | punteggio z () |
di 0,70 | di 1.04 |
di 0,75 | di 1,15 |
di 0,80 | di 1,28 |
di 0,85 | di 1.44 |
di 0,92 | di 1,75 |
di 0,95 | di 1,96 |
di 0,96 | di 2.05 |
di 0,98 | di 2.33 |
di 0,99 | di 2,58 |
di 0,999 | di 3.29 |
0,9999 | di 3,89 |
0,99999 | 4.42 di |
Intervallo di fiducia
In statistica, un intervallo di confidenza è un intervallo stimato di valori possibili per i parametri della popolazione, ad esempio 40 ^ 2 o 40 ^ 5%. Prendendo come esempio il livello di confidenza comunemente usato del 95%, se la stessa popolazione viene campionata più volte e ogni volta viene eseguita una stima dell'intervallo, in circa il 95% dei casi il parametro della popolazione reale sarà incluso nell'intervallo. Si noti che la probabilità del 95% si riferisce alla stima dell'affidabilità del processo, non a un intervallo di tempo specifico. Una volta calcolato l'intervallo, contiene o non contiene i parametri della popolazione di interesse. Alcuni fattori che influenzano l'ampiezza dell'intervallo di confidenza includono la dimensione del campione, il livello di confidenza e la variabilità all'interno del campione.
A seconda di fattori come se la deviazione standard è nota o se il campione è piccolo (n), sono disponibili diverse formule per calcolare l'intervallo di confidenza.<30) are involved, among others. The calculator provided on this page calculates the confidence interval for a proportion and uses the following equations:
dov'è?
di Z è la frazione z. Pish di La percentuale della popolazione di N e “No” Dimensione del campione ordinario è il numero della popolazione |
In statistica, una totalità è un insieme di eventi o elementi correlati a un dato problema o esperimento. Può riferirsi a un insieme di oggetti esistenti, sistemi o addirittura a un insieme di oggetti immaginari. Tuttavia, più comunemente, la popolazione è usata per riferirsi a un gruppo di persone, sia che si tratti del numero di dipendenti di una società, del numero di persone in una certa fascia di età in una determinata area geografica o del numero di studenti in una biblioteca universitaria in un dato momento.
È importante notare che quando si considera una popolazione limitata, è necessario modificare l'equazione, come mostrato sopra. questo. (n-n) (n-1) I termini nell'equazione della totalità finita sono chiamati fattori di correzione della totalità finita e sono necessari perché non si può presumere che tutti gli individui nel campione siano indipendenti. Ad esempio, se 10 persone nella popolazione dello studio erano in una stanza di età compresa tra 1 e 100 anni e una di loro aveva 100 anni, la prossima persona avrebbe probabilmente un'età più giovane. Il fattore di correzione globale limitato tiene conto di tali fattori. Di seguito è riportato un esempio di calcolo dell'intervallo di confidenza di una popolazione illimitata.
Esempio Frasi: Supponiamo che l'azienda Q abbia 120 dipendenti, 85 dei quali bevono caffè ogni giorno, e cercare l'intervallo di confidenza del 99% per la percentuale reale di caffè che l'azienda Q beve ogni giorno.
Calcolo del volume del campione
La dimensione del campione è un concetto statistico che comporta la determinazione del numero di osservazioni o ripetizioni che devono essere incluse in un campione statistico (il numero di ripetizioni delle condizioni sperimentali utilizzate per stimare la variabilità dei fenomeni). Questo è un aspetto importante di qualsiasi ricerca empirica che richiede l'inferenza sulla totalità in base al campione. In sostanza, la dimensione del campione viene utilizzata per rappresentare una frazione della popolazione selezionata in un dato sondaggio o esperimento. Per eseguire questo calcolo, impostare la gamma di errore, di &ε;Oppure la distanza massima necessaria per la deviazione della stima del campione dal valore reale. Per fare questo, utilizzare la formula dell'intervallo di confidenza sopra, ma impostare l'elemento a destra del simbolo su un valore uguale all'intervallo di errore e risolvere la formula finale per la dimensione del campione. di N. La formula per il calcolo del volume del campione è la seguente.
dov'è?
di Z è la frazione z. di &ε; Larghezza di errore. ordinario è il numero della popolazione Pish di La percentuale della popolazione |
Ad esempio: determinare la dimensione del campione necessaria per stimare la percentuale di persone che si considerano vegetariane entro un livello di confidenza del 95% e un margine di errore del 5% per lo shopping in un supermercato negli Stati Uniti. Supponiamo che la percentuale di popolazione sia 0,5 e che la popolazione sia illimitata. Ricordate questo. di Z Il livello di confidenza per il 95% è 1.96. Si prega di consultare la tabella fornita nella sezione Confidenza di Z Una serie di punteggi di confidenza.
Pertanto, per i casi di cui sopra, è necessaria una dimensione del campione di almeno 385 persone. Nell'esempio sopra, alcuni studi stimano che circa il 6% degli americani si considerano vegetariani, quindi non è un'ipotesi 0.5 Pish diVerrà utilizzato 0.06. Se si sa che 40 delle 500 persone che entrano in un supermercato un giorno sono vegetariani, Pish di Quindi è 0.08.