樣本量計算器
找出樣本量
該計算器計算滿足所需統計約束的最小必要樣本數。
找出誤差幅度
這個計算器給出觀察或調查的誤差范圍或置信區間。
在統計學中,通常通過研究人口中有限數量的個體來推斷人口信息,即人口是抽樣的,并假設樣本的特征代表整個人口。對于下文,假設存在這樣的個體群體, p的人與其他人是不同的 1-p 以某種方式;例如, p 可能是棕色頭發的人的比例,而其余的 1-p 有黑色、金色、紅色等。因此,要估計 p 在人群中,樣本 n 可以從人群中抽取個體,樣本比例, p̂,針對棕色頭發的樣本個人進行計算。不幸的是,除非對全部人口進行抽樣調查,否則估計 p̂ 很可能不等于真正的價值 p,因為 p̂ 受到采樣噪聲的影響,即它取決于被采樣的特定個體。然而,抽樣統計可以用來計算所謂的置信區間,它是估計值接近程度的指示 p̂ 是真實值 p。
隨機樣本的統計
給定隨機樣本中的不確定性(即預期比例估計值, p̂是真實比例的一個很好的近似值,但并不完美 p)可以概括為這樣的估計 p̂ 正態平均分布 p 和方差 磷/氮。有關樣本估計值呈正態分布的原因,請研究 中心極限定理。如下文所定義的,置信水平、置信區間和樣本大小都是相對于該采樣分布計算的。簡而言之,置信區間給出了一個大約為 p 其中估計 p̂ “很可能”是。置信度給出了這種“可能性”有多大& ndash例如,95%的置信水平指示預期估計 p̂ 在于95%隨機樣本的置信區間。置信區間取決于樣本大小, n (樣本分布的方差與成反比 n,這意味著估計值更接近真實比例,因為 n 增加);因此,也可以設置估計中可接受的誤差率,稱為誤差容限, &ε;,并求解所選置信區間小于所需的樣本大小 e;一種稱為“樣本量計算”的計算方法
可信度
置信水平是對樣本在選定置信區間內準確反映被研究人群程度的確定性的度量。最常用的置信水平為90%、95%和99%,根據所選的置信水平,每個置信水平都有其相應的z得分(可使用公式或廣泛可用的表格找到,如下所示)。請注意,使用z得分假設采樣分布呈正態分布,如上文“隨機樣本的統計數據”中所述。假設一個實驗或調查重復多次,置信水平實質上表示重復測試的結果區間包含真實結果的時間百分比。
可信度 | z得分() |
0.70 | 1.04 |
0.75 | 1.15 |
0.80 | 1.28 |
0.85 | 1.44 |
0.92 | 1.75 |
0.95 | 1.96 |
0.96 | 2.05 |
0.98 | 2.33 |
0.99 | 2.58 |
0.999 | 3.29 |
0.9999 | 3.89 |
0.99999 | 4.42 |
置信區間
在統計學中,置信區間是總體參數可能值的估計范圍,例如40 ^ 2或40 ^ 5%。以常用的95%置信水平為例,如果對同一總體進行多次采樣,并在每次進行區間估計,在大約95%的情況下,真實總體參數將包含在區間內。請注意,95%的概率是指估計過程的可靠性,而不是指特定的時間間隔。一旦計算出區間,它將包含或不包含感興趣的總體參數。影響置信區間寬度的一些因素包括:樣本大小、置信水平和樣本內的變異性。
根據標準偏差是否已知或較小樣本(n)等因素,有不同的公式可用于計算置信區間<30) are involved, among others. The calculator provided on this page calculates the confidence interval for a proportion and uses the following equations:
在哪里
z 是z分數 p̂ 是人口比例 n 和 “不” 樣本大小 普通 是人口數量 |
在統計學中,總體是一組與給定問題或實驗相關的事件或元素。它可以指一組現有的對象、系統,甚至是一組假想的對象。然而,最常見的是,人口用來指一群人,無論他們是一家公司的員工人數,某個地理區域的某個年齡組的人數,還是任何給定時間大學圖書館的學生人數。
需要注意的是,當考慮有限的人群時,需要對等式進行調整,如上所示。這 (N-N)/(N-1) 有限總體方程中的項被稱為有限總體校正因子,它是必要的,因為不能假設樣本中的所有個體都是獨立的。例如,如果研究人群中有10個人在一個房間里,年齡從1歲到100歲不等,其中一個人的年齡為100歲,那么下一個人的年齡很可能更小。有限總體校正因子考慮了諸如此類的因素。下面是一個計算無限人群置信區間的例子。
例句:假設Q公司有120名員工,其中85人每天都喝咖啡,求Q公司每天喝咖啡的真實比例的99%置信區間。
樣本量計算
樣本量是一個統計學概念,涉及確定統計樣本中應包含的觀察或重復次數(用于估計現象可變性的實驗條件的重復次數)。這是任何實證研究的一個重要方面,需要根據樣本對總體做出推斷。從本質上講,樣本量用于代表任何給定調查或實驗中選擇的部分人群。要執行此計算,請設置誤差范圍, &ε;或者樣本估計值偏離真實值所需的最大距離。為此,使用上面的置信區間公式,但將符號右側的項設置為等于誤差幅度,并求解樣本大小的最終公式。 n。計算樣本量的公式如下所示。
在哪里
z 是z分數 &ε; 是誤差幅度 普通 是人口數量 p̂ 是人口比例 |
例如:確定必要的樣本量,以估計在美國超市購物的95%置信水平和5%誤差范圍內認為自己是素食者的人的比例。假設人口比例為0.5,人口數量無限制。記住這一點 z 對于95%的置信水平是1.96。請參考置信度部分提供的表格 z 一系列置信度的分數。
因此,對于上述案例,至少需要385人的樣本量。在上面的例子中,一些研究估計大約有6%的美國人認為自己是素食主義者,所以不是假設0.5 p̂,將使用0.06。如果已知某天進入某家超市的500人中有40人是素食者, p̂ 那么就是0.08。