Qu’est-ce que la distribution d’échantillonnage?

Une distribution d’échantillonnage est une distribution de probabilité d’une statistique obtenue à partir d’un grand nombre d’échantillons tirés d’une population spécifique. La distribution d’échantillonnage d’une population donnée est la distribution des fréquences d’une gamme de résultats différents qui pourraient éventuellement se produire pour une statistique d’une population.

Comprendre la distribution d’échantillonnage

Beaucoup de données tirées et utilisées par les universitaires, les statisticiens, les chercheurs, les spécialistes du marketing, les analystes, etc. sont en fait des échantillons, pas des populations. Un échantillon est un sous-ensemble d’une population. Par exemple, un chercheur en médecine qui voulait comparer le poids moyen de tous les bébés nés en Amérique du Nord de 1995 à 2005 à ceux nés en Amérique du Sud au cours de la même période ne peut pas, dans un délai raisonnable, tirer les données pour l’ensemble de la population de plus d’un million d’accouchements survenus au cours de la période de dix ans. Il n’utilisera à la place que le poids de, disons, 100 bébés dans chaque continent pour tirer une conclusion. Le poids de 200 bébés utilisés est l’échantillon et le poids moyen calculé est la moyenne de l’échantillon.

Supposons maintenant qu’au lieu de prendre un seul échantillon de 100 poids nouveau-nés de chaque continent, le chercheur médical prélève des échantillons aléatoires répétés de la population générale et calcule la moyenne de l’échantillon pour chaque groupe d’échantillons. Ainsi, pour l’Amérique du Nord, il extrait les données de 100 poids de nouveau-nés enregistrés aux États-Unis, au Canada et au Mexique comme suit: quatre 100 échantillons provenant d’hôpitaux sélectionnés aux États-Unis, cinq 70 échantillons du Canada et trois 150 enregistrements du Mexique, pour un total de 1200 poids de nouveau-nés regroupés en 12 ensembles. Il recueille également un échantillon de données de 100 poids de naissance de chacun des 12 pays d’Amérique du Sud.

Chaque échantillon a sa propre moyenne d’échantillon et la distribution des moyennes d’échantillon est connue sous le nom de distribution d’échantillon.

Le poids moyen calculé pour chaque échantillon est la distribution d’échantillonnage de la moyenne. Non seulement la moyenne peut être calculée à partir d’un échantillon. D’autres statistiques, telles que l’écart type, la variance, la proportion et la plage, peuvent être calculées à partir de données d’échantillonnage. L’écart type et la variance mesurent la variabilité de la distribution d’échantillonnage.

Le nombre de les observations dans une population, le nombre d’observations dans un échantillon et la procédure utilisée pour tirer les ensembles d’échantillons déterminent la variabilité d’une distribution d’échantillonnage. L’écart type d’une distribution d’échantillonnage est appelé l’erreur type. Alors que la moyenne d’une distribution d’échantillonnage est égale à la moyenne de la population, l’erreur type dépend de l’écart type de la population, de la taille de la population et de la taille de l’échantillon.

Savoir à quel point la moyenne de chacun des ensembles d’échantillons est éloignée les uns des autres et de la moyenne de la population donner une indication de la proximité de la moyenne de l’échantillon avec la moyenne de la population. L’erreur standard de la distribution d’échantillonnage diminue à mesure que la taille de l’échantillon augmente.

Considérations particulières

Une population ou un échantillon de nombres aura une distribution normale. Cependant, comme une distribution d’échantillonnage comprend plusieurs séries d’observations, elle n’aura pas nécessairement une forme courbe en cloche.

Suivant notre exemple, le poids moyen de la population de bébés en Amérique du Nord et en Amérique du Sud a une distribution normale car certains bébés auront un poids insuffisant (ci-dessous moyenne) ou en surpoids (au-dessus de la moyenne), la plupart des bébés se situant entre les deux (autour de la moyenne). Si le poids moyen des nouveau-nés en Amérique du Nord est de sept livres, le poids moyen de l’échantillon dans chacun des 12 ensembles d’observations d’échantillon enregistrées pour l’Amérique du Nord sera également proche de sept livres.

Cependant, si vous représentez graphiquement chacune des moyennes calculée dans chacun des 1 200 groupes d’échantillons, la forme résultante peut entraîner une distribution uniforme, mais il est difficile de prédire avec certitude quelle sera la forme réelle. Plus le chercheur utilise d’échantillons parmi la population de plus d’un million de chiffres de poids, plus le graphique commencera à former une distribution normale.

  • Une distribution d’échantillonnage est une distribution de probabilité d’une statistique obtenue par un grand nombre d’échantillons prélevés sur une population spécifique.
  • La distribution d’échantillonnage d’une population donnée est la distribution de fréquences d’une gamme de résultats différents qui pourraient éventuellement se produire pour une statistique d’une population.
  • UNE beaucoup de données tirées et utilisées par des académiciens, statist icians, les chercheurs, les spécialistes du marketing et les analystes sont en fait des échantillons, pas des populations.