Tests de normalité

Tests de normalité

Test de normalité

En statistiques, les tests de normalité permettent de vérifier que des données réelles suivent une loi normale ou non. Les tests de normalité sont des cas particuliers des tests d'adéquation (ou tests d'ajustement, tests permettant de comparer des distributions), appliqués à une loi normale.

Ces tests prennent un place importante en statistiques. En effet, de nombreux tests supposent la normalité des distributions pour être applicable. En toute rigueur, il est indispensable de vérifier la normalité avant d'utiliser les tests. Cependant, de nombreux tests sont suffisamment robuste pour être utilisable même si les distributions s'écartent de la loi normale.

Sommaire

Approches empiriques et graphiques

Histogramme de la distribution

Il est possible de visualiser la forme de la distribution des données à analyser en les représentant sous forme d'histogramme puis de comparer la forme de cette histogramme avec une courbe représentant une loi normale (les paramètres de cette loi étant calculés à partir des données à analyser). Ceci ne permet pas de conclure à la normalité des données mais peut donner un idée du type de loi sous-jacente : loi normale, loi de Cauchy ou loi de Student si la distribution semble symétrique, loi log-normale, loi gamma, loi de Weibull, loi exponentielle ou loi bêta si la distribution est asymétrique.

Normality histogram.png


Histogramme des résidus

Il est également possible de représenter l'histogramme des résidus(c'est-à-dire la différence entre la distribution observée et la loi normale). Les résidus doivent suivre également un loi normale.


Boîte à moustaches (box-plot)

Une boîte à moustaches permet de visualiser rapidement la symétrie de la distribution des données réelles et la présence de valeurs atypiques.

Normality box-plot.png


Graphe quantile-quantile (qq-plot)

Coefficients d'asymétrie et d'aplatissement

Les Coefficients d'asymétrie et d'aplatissement sont également utiles pour définir une loi normale.

Pour l'aplatissement : ~ G_2 = \frac{(n+1)\,n}{(n-1)\,(n-2)\,(n-3)} \; \sum_{i=1}^n \left( \frac {x_i - \bar{x}} \sigma \right) ^4 - 3\,\frac{(n-1)^2}{(n-2) (n-3)}

et pour l'asymétrie : G_1 = \frac n {(n-1)\,(n-2)} \; \sum_{i=1}^n \left( \frac {x_i - \bar{x}} \sigma \right) ^3

avec σ un estimateur non biaisé de la variance.

On sait effectivement que le coefficient d'asymétrie vaut zéro pour toute loi normale, tandis que le coefficient d'aplatissement vaut 3 (0 si normalisé)

Approche probabiliste

Il existe également un grand nombre de tests de normalité:

  • ou encore le test de Shapiro-Wilk (en), ou le test de Shapiro–Francia.

Généralités

Les tests de normalité sont des tests d'hypothèse. En notant F(x) la fonction de répartition basée sur les données à analyser et F0(x) la fonction de répartition théorique, les hypothèses nulle et alternative peuvent s'écrire :

\begin{cases} {H_0~:~F(x) = F_0(x)} \\ {H_1~:~F(x) \neq F_0(x)} \end{cases}.

Les tests sur les moments ont une hypothèse moins forte, ils ne testent pas si la fonction de répartition est normale, mais si les moments (coefficients d'asymétrie et d'aplatissement) de la distribution inconnue sont identiques à ceux d'une loi normale:  H_{0}: G_1=0 \mbox{ et } G_2=3 \,

 H_{1}: G_1\ne 0 \mbox{ ou } G_2\ne 3 \,

On remarquera que ce n'est pas suffisant pour caractériser une loi normale (Problème des moments).

Test d'adéquation du χ²

Article détaillé : Test du χ².

Son utilisation n'est pas recommandé du fait de son manque de puissance et de la nécessité de diviser les distributions en classes.

[1].

Tests bayesien

Kullback-Leibler distances between the whole posterior distributions of the slope and variance do not indicate non-normality. However, the ratio of expectations of these posteriors and the expectation of the ratios give similar results to the Shapiro-Wilk statistic except for very small samples, when non-informative priors are used.[2]

Spiegelhalter suggests using Bayes factors to compare normality with a different class of distributional alternatives.[3] This approach has been extended by Farrell and Rogers-Stewart.[4]

Applications

One application of normality tests is to the residuals from a linear regression model. If they are not normally distributed, the residuals should not be used in Z tests or in any other tests derived from the normal distribution, such as t tests, F tests and chi-square tests. If the residuals are not normally distributed, then the dependent variable or at least one explanatory variable may have the wrong functional form, or important variables may be missing, etc. Correcting one or more of these systematic errors may produce residuals that are normally distributed.

Voir aussi

  • (fr) Gilbert Saporta, Probabilités, Analyse des données et Statistique, 2006 [détail des éditions] (p. 359 à 370).
  • Judge et al., Introduction to the Theory and Practice of Econometrics, Second Édition, 1988; 890–892.
  • Gujarati, Damodar N., Basic Econometrics, Fourth Édition, 2003; 147–148

Références

  1. Judge et al. (1988) and Gujarati (2003) recommendent le test de Jarque–Bera.
  2. Young K. D. S. (1993), Bayesian diagnostics for checking assumptions of normality. Journal of statistical computation and simulation, vol. 47, no3-4, pp. 167-180
  3. Spiegelhalter, D.J. (1980). An omnibus test for normality for small samples. Biometrika, 67, 493-496. DOI:10.1093/biomet/67.2.493
  4. Farrell, P.J., Rogers-Stewart, K. (2006) Comprehensive study of tests for normality and symmetry: extending the Spiegelhalter test. Journal of Statistical Computation and Simulation, 76(9), 803 – 816. DOI:10.1080/10629360500109023

Liens externes

  • Portail des probabilités et des statistiques Portail des probabilités et des statistiques
Ce document provient de « Test de normalit%C3%A9 ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Tests de normalité de Wikipédia en français (auteurs)

Игры ⚽ Нужна курсовая?

Regardez d'autres dictionnaires:

  • Test de normalité — En statistiques, les tests de normalité permettent de vérifier si des données réelles suivent une loi normale ou non. Les tests de normalité sont des cas particuliers des tests d adéquation (ou tests d ajustement, tests permettant de comparer des …   Wikipédia en Français

  • Analyse de la variance — L analyse de la variance (terme souvent abrégé par le terme anglais ANOVA : ANalysis Of VAriance) est un test statistique permettant de vérifier que plusieurs échantillons sont issus d une même population. Ce test s applique lorsque l on… …   Wikipédia en Français

  • Loi normale — Distribution gaussienne Densité de probabilité / Fonction de masse La courbe rouge représente la fonction φ (voir texte), densité de probabilité d une variable suivant une loi normale centrée réduite Fonction de répartition …   Wikipédia en Français

  • Distribution gaussienne — Loi normale Distribution gaussienne Densité de probabilité / Fonction de masse La courbe rouge représente la fonction φ (voir texte), densité de probabilité d une variable suivant une loi normale centrée réduite Fonction de répartition …   Wikipédia en Français

  • Distribution normale — Loi normale Distribution gaussienne Densité de probabilité / Fonction de masse La courbe rouge représente la fonction φ (voir texte), densité de probabilité d une variable suivant une loi normale centrée réduite Fonction de répartition …   Wikipédia en Français

  • Loi Normale — Distribution gaussienne Densité de probabilité / Fonction de masse La courbe rouge représente la fonction φ (voir texte), densité de probabilité d une variable suivant une loi normale centrée réduite Fonction de répartition …   Wikipédia en Français

  • Loi Normale Reduite — Loi normale Distribution gaussienne Densité de probabilité / Fonction de masse La courbe rouge représente la fonction φ (voir texte), densité de probabilité d une variable suivant une loi normale centrée réduite Fonction de répartition …   Wikipédia en Français

  • Loi de Gauss — Loi normale Distribution gaussienne Densité de probabilité / Fonction de masse La courbe rouge représente la fonction φ (voir texte), densité de probabilité d une variable suivant une loi normale centrée réduite Fonction de répartition …   Wikipédia en Français

  • Loi de Laplace-Gauss — Loi normale Distribution gaussienne Densité de probabilité / Fonction de masse La courbe rouge représente la fonction φ (voir texte), densité de probabilité d une variable suivant une loi normale centrée réduite Fonction de répartition …   Wikipédia en Français

  • Loi gaussienne — Loi normale Distribution gaussienne Densité de probabilité / Fonction de masse La courbe rouge représente la fonction φ (voir texte), densité de probabilité d une variable suivant une loi normale centrée réduite Fonction de répartition …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”