Intervalle de fluctuation

Intervalle de fluctuation
Page d'aide sur l'homonymie Ne pas confondre avec la notion d'intervalle de confiance.

En mathématiques, un intervalle de fluctuation permet de détecter un écart important par rapport à la valeur théorique pour une grandeur établie sur un échantillon. C'est un intervalle dans lequel la grandeur observée est censée se trouver avec une forte probabilité (souvent de l'ordre de 95 %).

Le fait d'obtenir une valeur en dehors de cet intervalle s'interprète alors en mettant en cause la représentativité de l'échantillon ou la valeur théorique. À l'inverse, le fait que la moyenne soit comprise dans l'intervalle n'est pas une garantie de la validité de l'échantillon ou du modèle.

Lorsque la grandeur observée est une proportion d'individus satisfaisant certains critères dans l'échantillon, l'intervalle de fluctuation est déterminé par la loi binomiale. Si la taille de l'échantillon est suffisamment importante[1], cette loi est approchée par la loi normale en vertu du théorème central limite. Il en découle une formulation explicite de l'intervalle de fluctuation au seuil de 95 %, pour un échantillon de taille n censé satisfaire certaines propriétés avec une proportion p :

I = \left[p-1,96 \sqrt{\frac{p(1-p)}{n}}\ ;\ p+1,96\sqrt{\frac{p(1-p)}{n}}\,\right].

Si la probabilité p varie entre 0,2 et 0,8, cet intervalle est parfois approché par un intervalle à la formulation plus simple :

I = \left[p-\frac{1}{\sqrt{n}}\ ; \ p+\frac{1}{\sqrt{n}}\right].

Sommaire

Étude d'une proportion

Pile ou face

Simulation du lancer d'une pièce à pile ou face avec les premières valeurs[2] de random(2) de Free Pascal.
Nombre de lancers 20 100 1000 10000
Nombre de 1 12 55 496 4990
Proportion 60 % 55 % 49,6 % 49,9 %

Une pièce de monnaie est dite équilibrée si elle tombe sur pile ou face avec la même probabilité de 0,5. Cela signifie, en vertu de la loi des grands nombres, que sur un grand nombre de lancers, le côté pile apparaitra à peu près aussi souvent que le côté face. Il est d'ailleurs possible de simuler un grand nombre de lancers à l'aide d'un générateur de nombres pseudo-aléatoire pour obtenir des fréquences d'apparition de plus en plus précises.

Cependant, si la proportion se rapproche de 0,5 avec le nombre de lancers, elle est très rarement égale à 0,5. La probabilité d'obtenir autant de fois chaque côté décroit même avec le nombre (pair) de lancers[3]. Par exemple, sur dix lancers, il y a moins d'une chance sur 4 d'obtenir exactement 5 fois chaque côté.

Loi de probabilité du nombre de sorties de chaque côté d'une pièce équilibrée sur 10 lancers.
0 1 2 3 4 5 6 7 8 9 10
Probabilité exacte 11024 101024 451024 1201024 2101024 2521024 2101024 1201024 451024 101024 11024
Valeur approchée 0,1 % 0,9 % 4,4 % 11,7 % 20,5 % 24,6 % 20,5 % 11,7 % 4,4 % 0,9 % 0,1 %

Les numérateurs des fractions affichées sont les coefficients binomiaux de rang 10.

Ce tableau montre que tous les nombres de sorties sont possibles, mais qu'il y a environ 98 % de chances d'obtenir au moins deux fois pile et deux fois face sur dix lancers.

Un intervalle de fluctuation peut donc être défini dans ce cas par [2 ; 8] pour le nombre de sorties de chaque côté, ce qui revient à donner un intervalle de fluctuation de 0,2 à 0,8 pour la fréquence d'apparition de chaque côté. Une pièce tombant au moins 9 fois du même côté au cours de dix lancers sera donc suspecte, même ce résultat n'est pas complètement impossible avec une pièce équilibrée.

Cas général

La même méthode peut être utilisée pour tester une probabilité différente de 0,5. En répétant une même expérience aléatoire ayant une certaine probabilité p de réussite, le nombre S de réussites suit une loi binomiale dont les paramètres sont le nombre d'expériences n et la probabilité p :

\mathrm{P}(S=k) = \binom{n}{k}\, p^k\, (1-p)^{n-k}.

L'intervalle de confiance se calcule en éliminant les valeurs extrêmes de S qui représentent moins de 2,5 % de chaque côté. Cela revient à définir les entiers a et b les plus petits possibles tels que

\mathrm{P}(S\le a) > 0,025
\mathrm{P}(S\le b) \ge 0,975.

Il est possible que l'une ou l'autre de ces valeurs corresponde à une valeur extrême (c'est-à-dire 0 ou n), notamment si le paramètre p est proche de 0 ou de 1.

L'intervalle de confiance pour la fréquence de réussite s'écrit alors :

I = \left[\frac{a}{n} ; \frac{b}{n}\right].

Approximation à l'aide de la loi normale

Le théorème central limite stipule que la différence entre la fréquence observée et la fréquence théorique, multipliée par la racine carrée de la taille de l'échantillon, converge en loi vers une loi normale centrée de même variance que la loi de Bernoulli sous-jacente, donc d'écart type

\sigma = \sqrt{p(1-p)}.

Autrement dit, la fonction de répartition suivante

t \mapsto \mathrm{P}\left(\sqrt{\frac{n}{p(1-p)}}\left(\frac{S}{n}-p\right)\le t\right)

converge vers la fonction de répartition de la loi normale centrée réduite.

Or les quantiles de cette loi peuvent être calculés par approximation numérique. L'antécédent de 0,975 par la fonction de répartition vaut environ 1,96, d'où l'inégalité suivante :

 \mathrm{P}\left(-1,96 \le \sqrt{\frac{n}{p(1-p)}}\left(\frac{S}{n}-p\right)\le 1,96\right) \le 0,95.

Par conséquent, la double inégalité suivante est vraie avec une probabilité de 0,95 :

p-1,96\sqrt{\frac{p(1-p)}{n}} \le \frac{S}{n} \le p+1,96\sqrt{\frac{p(1-p)}{n}}.

Ces inégalités définissent alors une approximation de l'intervalle de fluctuation au seuil de 95 %.

Pour changer le seuil, il suffit de modifier le coefficient 1,96 par un autre quantile de la fonction de répartition de la loi normale centrée réduite.

Quantiles de la fonction de répartition de la loi normale centrée réduite.
Seuil de l'intervalle de fluctuation 90 % 95 % 98 % 99 % 99,5 % 99,9 %
Valeur de la fonction de répartition 0,95 0,975 0,99 0,995 0,9975 0,9995
Valeur approchée du coefficient 1,64 1,96 2,33 2,58 2,81 3,29

Formule simplifiée

En majorant le coefficient 1,96 par 2 et en majorant le produit p(1 − p) par son maximum (14), la formule précédente peut être simplifiée pour l'intervalle de confiance à 95 % par

I = \left[p-\frac{1}{\sqrt{n}}\ ; \ p+\frac{1}{\sqrt{n}}\right].

La première majoration est une bonne approximation, tandis que la seconde majoration double la longueur de l'intervalle lorsque la fréquence théorique p vaut 0,2 ou 0,8. Cette simplification est donc en général acceptée seulement si la fréquence théorique se situe entre ces deux valeurs.

L'inclusion de l'intervalle de fluctuation de la fréquence dans l'intervalle [0 ; 1] est alors automatique dès que la taille de l'échantillon est supérieure ou égale à 25.

Variance

Dans le cas d'un échantillon de n variables indépendantes d'une même loi normale centrée réduite, la variance observée au sein de l'échantillon, multipliée par n−1, suit une loi du χ² de paramètre n−1. L'intervalle de confiance peut alors être défini à l'aide des quantiles de la fonction de répartition correspondante.

Ce calcul permet de tester l'adéquation d'un échantillon à une loi normale.

Notes et références

  1. Il n'y a pas de seuil officiel pour la validité de cette approximation, mais les programmes de mathématiques de classe de seconde en France requièrent un effectif minimal de 25 pour la formule de l'intervalle de fluctuation.
  2. Le générateur random décrit toujours la même suite pseudo-aléatoire lors du lancement d'un programme, sauf en cas d'appel à l'instruction randomize.
  3. Cette probabilité est équivalente à \scriptstyle 1/\sqrt{n\pi} lorsque le nombre 2n de lancers tend vers l'infini (voir le site de Chronomath pour un calcul explicite à l'aide de la loi binomiale et de la formule de Stirling). Pour un nombre impair de lancers, il est impossible d'obtenir autant de fois pile que face.
  • Portail des probabilités et des statistiques Portail des probabilités et des statistiques

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Intervalle de fluctuation de Wikipédia en français (auteurs)

Игры ⚽ Поможем сделать НИР

Regardez d'autres dictionnaires:

  • Intervalle de confiance —  Ne pas confondre avec l intervalle de fluctuation ni avec le calcul d incertitude en physique. En mathématiques, un intervalle de confiance permet de définir une marge d erreur entre les résultats d un sondage et un relevé exhaustif de la… …   Wikipédia en Français

  • Euro — Pour les articles homonymes, voir Euro (homonymie). euro ευρώ (Chypre et Grèce) евро (Bulgarie) evro (Slovénie) ewro (Malte) Unité monétaire moderne actuelle Pays officiellement utilisateur(s) …   Wikipédia en Français

  • Monnaie unique — Euro Pour les articles homonymes, voir Euro (homonymie). Unité monétaire moderne actuelle euro Euro (Allemagne et Autriche) ευρώ (Chypre et Grèce) евро (Bulgarie) …   Wikipédia en Français

  • Projet:Mathématiques/Liste des articles de mathématiques — Cette page n est plus mise à jour depuis l arrêt de DumZiBoT. Pour demander sa remise en service, faire une requête sur WP:RBOT Cette page recense les articles relatifs aux mathématiques, qui sont liés aux portails de mathématiques, géométrie ou… …   Wikipédia en Français

  • Échantillon (statistiques) — Pour les articles homonymes, voir Échantillon. Sommaire 1 Méthode 2 Voir aussi 2.1 Artic …   Wikipédia en Français

  • Persona : Trinity Soul — Persona Trinity Soul ペルソナ トリニティ・ソウル (Perusona Toriniti Sōru) Genre mystère, surnaturel Anime japonais Réalisateur Jun Matsumoto Scénariste Yasayuki Mutō Studio d’animation …   Wikipédia en Français

  • Persona trinity soul — Persona : Trinity Soul Persona trinity soul ペルソナ トリニティ・ソウル (Perusona Toriniti Sōru) Genre mystère, surnaturel Anime Réalisateur(s) Jun Matsumoto Scénariste Yasayuki Mutō Studio d animation …   Wikipédia en Français

  • oscillation — [ ɔsilasjɔ̃ ] n. f. • 1605; lat. oscillatio 1 ♦ Mouvement d un corps qui oscille. ⇒ balancement, branle. Oscillation d un pendule. ♢ Phys. Variation alternative d une grandeur, en fonction du temps, autour d une valeur fixe. ⇒ sinusoïde.… …   Encyclopédie Universelle

  • MOUVEMENT — Certes, la conceptualisation du mouvement ne date pas des débuts de la science moderne. Force est de constater, cependant, que la physique moderne est née à propos de la question du mouvement et en réaction, sur ce point précis, contre la… …   Encyclopédie Universelle

  • Chlorure de xénon — Général No CAS 55130 03 5 SMILES …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”