Erreur Statistique

Erreur Statistique

Erreur statistique

Afin d'aborder les sources d'erreurs en statistique, nous allons prendre l'exemple d'un sondage sur un référendum. D'une part parce que cela concerne tous les citoyens, et d'autre part le nombre de réponses possibles, égal à deux, simplifie grandement l'étude.

Sommaire

Les erreurs statistiques

Si le sondeur interroge uniquement une personne, le résultat du sondage indique un résultat de 100% pour le choix de l'unique sondé. Ce qui est aberrant. On ne peut pas interpoler le résultat d'un échantillon infime à l'ensemble de la population. Seule la consultation de l'ensemble des électeurs permettra de connaître la vraie répartition. Malheureusement en pratique on peut uniquement sonder un échantillon de cette population. Il faut alors entacher le résultat du sondage par une erreur dite statistique. Cette erreur sera d'autant plus petite que le nombre de sondés tendra vers la population entière. Notez que pour une mesure physique le nombre de mesures idéal est infini.

Un référendum consiste à répondre par oui ou non. Soit deux possibilités. On peut donc modéliser le référendum par la loi binomiale. Imaginons que r = 255 sondés répondent oui sur un total de n = 500 personnes sondées. On obtient alors une probabilité pour le oui de p = \frac{r}{n} = 0,51. La variance sur r vaut V(r) = np(1 − p). Donc la variance sur p est V(p) =
\frac{p(1-p)}{n}. On retrouve d'un point de vue mathématique le comportement intuitif précédent. Si n = 1 la variance est maximale, si n tend vers l'infini la variance devient nulle. Dans notre cas on a un écart type de 2,2% pour une probabilité pour le oui de 51%, soit une probabilité comprise entre 48,8% et 53,2% pour le oui, et comprise entre 46.8% et 51.2% pour le non. On ne peut donc tirer aucune conclusion valable sur ce sondage, le nombre de sondés étant manifestement choisi trop petit.

Les erreurs systématiques

Nous avons vu que la principale difficulté pour un sondage est de choisir un échantillon suffisant. Mais cela n'est pas la seule source d'erreur. Il faut aussi tenir compte de biais à caractère systématique. Dans le cas d'un sondage nous pouvons énumérer les sources d'erreurs suivantes :

  • l'échantillon n'est pas représentatif de la population
  • le sondé ment par honte de son choix
  • le sondé répond n'importe quoi pour se débarrasser au plus vite du sondeur

Le premier est intéressant, car il interfère avec les erreurs statistiques. En effet les erreurs statistiques sont dues à des fluctuations statistiques dans l'échantillonnage de la population. Autrement dit, les erreurs statistiques sont la conséquence de l'impossibilité de choisir l'échantillon parfait. Une autre façon d'étudier ce phénomène consisterait à calculer la probabilité de souiller un échantillon parfait en intervertissant un, deux, trois etc sondés entre le oui et le non. Imaginez un bac de bille contenant 51% de billes rouges et 49% de billes bleues. Quelle serait la configuration d'un sac de bille en fonction de sa taille, rempli à partir d'une infime partie du bac ? Ceci est toutefois un effet de second ordre. Le sondeur doit prendre garde à ne pas sonder uniquement un groupe d'individus orientés pour le oui ou le non, sinon le résultat serait absolument biaisé. Toutefois, cela n'est pas si facile en pratique.

Il est beaucoup plus difficile d'évaluer ce type d'erreurs. Ce qui nous amène à douter encore plus du résultat précédent sur notre sondage.

Voir aussi

Articles connexes

  • Portail des probabilités et des statistiques Portail des probabilités et des statistiques
Ce document provient de « Erreur statistique ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Erreur Statistique de Wikipédia en français (auteurs)

Игры ⚽ Поможем написать реферат

Regardez d'autres dictionnaires:

  • erreur statistique — statistinė paklaida statusas T sritis fizika atitikmenys: angl. statistical error vok. statistischer Fehler, m rus. статистическая погрешность, f pranc. erreur statistique, f …   Fizikos terminų žodynas

  • Erreur statistique — Afin d aborder les sources d erreurs en statistique, nous allons prendre l exemple d un sondage sur un référendum. D une part parce que cela concerne tous les citoyens, et d autre part le nombre de réponses possibles, égal à deux, simplifie… …   Wikipédia en Français

  • Erreur commise — Erreur Cette page d’homonymie répertorie les différents sujets et articles partageant un même nom …   Wikipédia en Français

  • Erreur théologique — Erreur Cette page d’homonymie répertorie les différents sujets et articles partageant un même nom …   Wikipédia en Français

  • Erreur — Cette page d’homonymie répertorie les différents sujets et articles partageant un même nom. Sur les autres projets Wikimedia : « Erreur », sur le Wiktionnaire (dictionnaire universel) Couramment, une erreur est un acte volontaire… …   Wikipédia en Français

  • Erreur (Métrologie) — Pour les articles homonymes, voir Erreur et Incertitude. Le calcul d erreur, ou calcul d incertitudes est un ensemble de techniques permettant d estimer l erreur faite sur un résultat numérique, à partir des incertitudes ou des erreurs faites sur …   Wikipédia en Français

  • Erreur (metrologie) — Erreur (métrologie) Pour les articles homonymes, voir Erreur et Incertitude. Le calcul d erreur, ou calcul d incertitudes est un ensemble de techniques permettant d estimer l erreur faite sur un résultat numérique, à partir des incertitudes ou… …   Wikipédia en Français

  • Erreur de mesure — Erreur (métrologie) Pour les articles homonymes, voir Erreur et Incertitude. Le calcul d erreur, ou calcul d incertitudes est un ensemble de techniques permettant d estimer l erreur faite sur un résultat numérique, à partir des incertitudes ou… …   Wikipédia en Français

  • STATISTIQUE — Le mot «statistique» désigne à la fois un ensemble de données d’observation et l’activité qui consiste dans leur recueil, leur traitement et leur interprétation. Au cours de l’histoire, la collecte d’observations et la méthodologie de leur emploi …   Encyclopédie Universelle

  • Erreur Quadratique Moyenne — En statistiques, l’erreur quadratique moyenne (ou plus souvent l’erreur quadratique, moyenne étant sous entendu) pour un paramètre θ de dimension 1, que nous noterons MSE (pour Mean Squared Error), est définie par: Définition    ave …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”