Échantillonnage

DéfinitionÉchantillon

Un échantillon de taille \(n\) est obtenu dans une population en prélevant au hasard, successivement et avec remise, \(n\) éléments d'une population.

Exemple

Prélever des pièces dans une production de manière identique et indépendante, noter à chaque fois si la pièce présente un défaut ou non et la remettre dans la production est une démarche d'échantillonnage.

Remarque

Souvent, il n'y a pas de remise lors du prélèvement. Mais lorsque l'effectif est très grand par rapport au nombre d'éléments prélevés, on considère néanmoins que l'échantillon est constitué avec remise.

DéfinitionIntervalle de fluctuation

L'intervalle de fluctuation au seuil de 95% de la fréquence correspondant à la réalisation, sur un échantillon aléatoire de taille \(n\), d'une variable aléatoire \(X\) suivant une loi binomiale est \(I=\left[ \dfrac{a}{n};\dfrac{b}{n} \right]\)

  • \(a\) est le plus petit entier tel que \(P\left(X\leq a\right)> 0,025\)

  • \(b\) est le plus petit entier tel que \(P\left(X\leq b\right)\geq 0,025\)

Exemple

On s'intéresse à la proportion de faces marquées "1" obtenues quand on lance un dé tétraédrique bien équilibré (dont les faces sont numérotées 1, 2, 3, 4).

La variable aléatoire \(X\), égale au nombre de faces marquées "1" obtenues quand on lance 100 fois ce dé, suit une loi binomiale \(\mathcal B\left(100; 0{,}25\right)\). En effet, la probabilité d'avoir une face marquée "1" est \(\dfrac14\).

On détermine une table des valeurs \(P\left(X\leq k\right)\) avec la calculatrice.

On peut alors trouver les entiers \(a\) et \(b\), où \(a\) est le plus petit entier tel que \(P\left(X\leq a\right)>0{,}025\), et \(b\) le plus petit entier tel que \(P\left(X\leq b\right) \geq0{,}975\).

On trouve \(a=17\) et \(b=34\).

Ainsi \(P(17\leq X\leq 34)\geq 0,95\) et \(P(0,17\leq f\leq 0,34)\geq 0,95\)\(f\) est la fréquence au sein de l'échantillon des "1" obtenus.

Méthode

Prise de décision sur un échantillon

L'intervalle de fluctuation à 95% est un intervalle qui contient au moins 95% des fréquences observées dans les échantillons de taille \(n\). Ceci signifie qu'il y a un risque de 5% pour cette fréquence de ne pas se trouver dans cet intervalle.