Calculateur d'échantillon
Trouver le volume de l'échantillon
La calculatrice calcule le nombre minimum d'échantillons nécessaires pour satisfaire aux contraintes statistiques souhaitées.
Trouver la marge d'erreur
Cette calculatrice donne une marge d’erreur ou un intervalle de confiance pour une observation ou une enquête.
En statistique, les informations démographiques sont généralement déduites en étudiant un nombre limité d'individus dans une population, c'est-à-dire que la population est un échantillon et en supposant que les caractéristiques de l'échantillon représentent l'ensemble de la population. Pour ce qui suit, en supposant l'existence d'un tel groupe d'individus, à PLes gens sont différents des autres. 1 à p d’une certaine manière ; Par exemple, à P Proportion de personnes aux cheveux bruns peut-être, alors que le reste 1 à p Noir, or, rouge, etc. Il faut donc estimer à P Dans la foule, l'échantillon à n Les individus peuvent être prélevés à partir de la population, la proportion de l'échantillon, Pki àCalculé individuellement pour un échantillon de cheveux bruns. Malheureusement, à moins d'une enquête par échantillon sur l'ensemble de la population, les estimations Pki à Peut-être pas la vraie valeur. à PParce que Pki à Sous l'influence du bruit d'échantillonnage, c'est-à-dire qu'il dépend de l'individu spécifique échantillonné. Cependant, les statistiques d'échantillonnage peuvent être utilisées pour calculer ce qu'on appelle un intervalle de confiance, qui est une indication de la proximité de l'estimation. Pki à valeur réelle. à P.
Statistiques de l'échantillon aléatoire
Incertitude dans un échantillon aléatoire donné (c'est-à-dire une estimation de la proportion attendue, Pki àest une bonne approximation des proportions réelles, mais pas parfaite à POn peut résumer cette estimation. Pki à Distribution normale moyenne à P et les variations Phosphore / azote. Pour savoir pourquoi les estimations de l'échantillon sont normalement distribuées, recherchez Le principe de limitation du centre. Le niveau de confiance, l'intervalle de confiance et la taille de l'échantillon sont tous calculés par rapport à cette distribution d'échantillonnage, telle que définie ci-dessous. En bref, l'intervalle de confiance donne une valeur d'environ à P Parmi eux, on estime Pki à « Probablement » oui. Les niveaux de confiance donnent à quel point cette "probabilité" & ndash Par exemple, un niveau de confiance de 95% indique une estimation attendue Pki à Un intervalle de confiance de 95 % d'échantillons aléatoires. L’intervalle de confiance dépend de la taille de l’échantillon. à n (La variance de la distribution de l'échantillon est inversement proportionnelle à nCela signifie que les estimations sont plus proches des proportions réelles, car à n augmentation); Par conséquent, il est également possible de définir un taux d'erreur acceptable dans l'estimation, appelé limite d'erreur, &ε;et résoudre l'intervalle de confiance sélectionné est inférieur à la taille de l'échantillon souhaité. et à; Une méthode de calcul appelée « calcul de l’échantillon »
crédibilité
Le niveau de confiance est une mesure de la certitude que l'échantillon reflète avec précision la population étudiée dans l'intervalle de confiance choisi. Les niveaux de confiance les plus couramment utilisés sont 90 %, 95 % et 99 %, et selon le niveau de confiance sélectionné, chaque niveau de confiance a un score z correspondant (peut être trouvé à l'aide d'une formule ou d'un tableau largement disponible, comme indiqué ci-dessous). Notez que l'utilisation du score z suppose que la distribution d'échantillonnage est normalement distribuée, comme décrit ci-dessus dans « Statistiques d'échantillons aléatoires ». En supposant qu'une expérience ou une enquête se répète plusieurs fois, le niveau de confiance représente essentiellement le pourcentage de temps pendant lequel l'intervalle de résultat d'un test répété contient un résultat réel.
crédibilité | score z () |
à 0,70 | Le 1.04 |
à 0,75 | 1 à 15 |
à 0,80 | 1,28 |
à 0,85 | à 1.44 |
0,92 | à 1,75 |
à 0,95 | 1,96 |
0,96 | Le 2.05 |
0,98 | à 2.33 |
0,99 | à 2,58 |
0,999 | 3.29 à |
0,9999 | 3,89 |
0,99999 | 4.42 à |
Intervalle de confiance
En statistique, un intervalle de confiance est une fourchette estimée de valeurs possibles pour un paramètre de la population, par exemple 40 ^ 2 ou 40 ^ 5%. Prenons l'exemple d'un niveau de confiance de 95 % communément utilisé, si la même population est échantillonnée plusieurs fois et que l'estimation de l'intervalle est effectuée à chaque fois, le véritable paramètre de la population sera inclus dans l'intervalle dans environ 95 % des cas. Notez que la probabilité de 95% se réfère à l'estimation de la fiabilité du processus et non à un intervalle de temps spécifique. Une fois que l'intervalle est calculé, il contiendra ou ne contiendra pas les paramètres de la population d'intérêt. Certains facteurs qui influent sur la largeur de l'intervalle de confiance incluent la taille de l'échantillon, le niveau de confiance et la variabilité au sein de l'échantillon.
Selon des facteurs tels que si l'écart type est connu ou si l'échantillon est plus petit (n), différentes formules peuvent être utilisées pour calculer l'intervalle de confiance.<30) are involved, among others. The calculator provided on this page calculates the confidence interval for a proportion and uses the following equations:
Où est
à Z est la fraction z. Pki à proportion de la population. à n et « Non » Taille de l'échantillon ordinaire. est le nombre de la population |
En statistique, une population est un ensemble d'événements ou d'éléments liés à un problème ou une expérience donnée. Il peut se référer à un ensemble d'objets, de systèmes ou même à un ensemble d'objets imaginaire. Cependant, le plus souvent, la population est utilisée pour désigner un groupe de personnes, qu'il s'agisse du nombre d'employés d'une entreprise, du nombre de personnes dans un groupe d'âge donné dans une région géographique ou du nombre d'étudiants dans une bibliothèque universitaire à un moment donné.
Il est important de noter que les équations doivent être ajustées lors de la prise en compte d'une population limitée, comme indiqué ci-dessus. Voilà (n-n) / (n-1) Un élément dans l'équation de la totalité finie est appelé un facteur de correction de la totalité finie, et il est nécessaire car il est impossible de supposer que tous les individus dans l'échantillon sont indépendants. Par exemple, si 10 personnes dans la population de l'étude étaient dans une pièce de 1 à 100 ans et que l'une d'entre elles avait 100 ans, la prochaine personne serait probablement plus jeune. Le facteur de correction global limité prend en compte des facteurs tels que ceux-ci. Voici un exemple de calcul de l'intervalle de confiance d'une population infinie.
Phrases d'exemple: Supposons que la société Q a 120 employés, dont 85 boivent du café tous les jours, et demandez l'intervalle de confiance de 99% pour le pourcentage réel de la société Q boit du café tous les jours.
Calcul de l'échantillon
La taille de l'échantillon est un concept statistique impliquant la détermination du nombre d'observations ou de répétitions (le nombre de répétitions des conditions expérimentales utilisées pour estimer la variabilité des phénomènes) qui doivent être incluses dans un échantillon statistique. C'est un aspect important de toute recherche empirique qui nécessite des inférences sur la totalité à partir d'échantillons. Essentiellement, la taille de l'échantillon est utilisée pour représenter une fraction de la population sélectionnée dans une enquête ou une expérience donnée. Pour effectuer ce calcul, définissez la marge d'erreur, &ε;Ou la distance maximale requise pour que l'estimation de l'échantillon s'écarte de la valeur réelle. Pour ce faire, utilisez la formule de l'intervalle de confiance ci-dessus, mais définissez l'élément à droite du symbole sur une marge d'erreur égale et résolvez la formule finale pour la taille de l'échantillon. à n. La formule pour calculer la taille de l'échantillon est la suivante.
Où est
à Z est la fraction z. &ε; La marge d'erreur. ordinaire. est le nombre de la population Pki à proportion de la population. |
Par exemple: déterminer la taille de l'échantillon nécessaire pour estimer le pourcentage de personnes qui se considèrent comme végétariennes dans une marge d'erreur de 5% pour un niveau de confiance de 95% lors d'un achat dans un supermarché aux États-Unis. En supposant que le ratio de population est de 0,5, le nombre de personnes est illimité. Rappelez-vous cela. à Z Le niveau de confiance pour 95 % est de 1.96. Veuillez consulter le tableau fourni dans la section Confiance à Z Une série de points de confiance.
Par conséquent, pour les cas ci-dessus, une taille d'échantillon d'au moins 385 personnes est nécessaire. Dans l’exemple ci-dessus, certaines études estiment qu’environ 6% des Américains se considèrent comme végétariens, donc ce n’est pas une hypothèse. Pki àOn utilise 0,06. Si vous savez que 40 des 500 personnes qui entrent un jour dans un supermarché sont végétariens, Pki à C'est 0,08.