Regréssion fallacieuse

Regréssion fallacieuse

Régression fallacieuse

Page d'aide sur l'homonymie Pour les articles homonymes, voir Régression.

La régression fallacieuse désigne une situation dans laquelle l'utilisation de séries temporelles non stationnaires dans une régression linéaire fait apparaître des résultats erronés, trop optimistes, qui font croire à une relation entre les variables alors que ce n'est pas le cas.

Sommaire

Historique

Granger et Newbold [1] ont montré en 1974 que de nombreuses études statistiques de séries temporelles montraient des faux résultats, parce qu'elles ne prenaient pas en compte le problème de l'auto-corrélation des données. En effet, avec une forte auto-corrélation, l'indice R2 ainsi que les tests sur les coefficients, ont tendance à être trop optimistes et à faire croire à une relation entre les variables qui n'est en fait que fallacieuse.

Explication

On souhaite faire une régression linéaire entre deux séries temporelles:  Y_t= aX_t + \epsilon_t \qquad avec εt un bruit blanc.

Si Ytet Xt sont deux variables intégrées d'ordre 1, la distribution classique de l'estimateur des coefficients n'est plus selon une loi de Student, mais selon un mouvement brownien. Utiliser cependant la distribution de Student amène justement à ces résultats trop bons.

En effet, dans le cas classique, la convergence de l'estimateur des moindres carrés est montrée à partir du fait que la matrice de variance-covariance de l'échantillon tend vers la matrice de variance-covariance de la population, d'où l'on tire que Ωâ = σε²·(X 'X)-1. Cependant, la variance d'une variable non-stationnaire intégrée d'ordre 1 n'est pas fixe, et donc l'estimateur n'est pas convergent en probabilité, dû au fait que les résidus sont eux-mêmes intégrés d'ordre 1, comme Philips (1986) l'a montré. En conséquence, les tests de Student et de Fisher sont inadéquats également.

Solution

Il existe plusieurs manières de contourner le problème. Si les variables sont intégrées d'ordre 1, la série de leurs différences sera stationnaire (par définition de l'ordre d'intégration). Il suffit alors de faire la régression sur les variables en différences pour que celle ci devienne valide.

Il est sinon possible d'utiliser un modèle à retards distribués, soit un modèle qui intègre également les retards de la variable expliquée et de la variable explicative. (Hamilton, 1994, p 562)

Exemple

Une simulation avec le logiciel libre de statistiques R permet d'illustrer le phénomène:

Dans cet exemple où l'on régresse deux bruits blancs, la relation est rejetée: R2=0.0027, et la probabilité que y=0 est 24%.

On remarque ici par contre que la régression de marches aléatoires, qui sont des processus intégrés d'ordre 1, laisse penser à une relation significative: le coefficient R2=0.304, et la probabilité que y vaille zéro est inférieure à 0.0000001%, ce qui laisserait croire qu'il y a une relation entre les variables. La statistique de Fisher, qui teste si en soi la régression a un sens, est également très fortement rejetée.

On remarque finalement que lorsque l'on régresse les différences des marches aléatoires, on n'a plus le problème d'une relation apparente: les statistiques de Fisher et de Student sont moins fortement rejetées, et surtout le coefficient R 2 vaut 0.00717, ce qui conduit à la conclusion qu'il n'y a pas de relation entre ces variables.

Références

  1. Granger, C.W.J., Newbold, P. (1974): "Spurious Regressions in Econometrics", Journal of Econometrics, 2, 111-120

Philips P.C.B, « Understanding Spurious Regression in econometrics », dans Journal of econometrics, vol. 33, 1986, p. 311-340  Hamilton (1994), Time Series Analysis, Princeton University Press

Voir aussi

séries temporelles

  • Portail des probabilités et des statistiques Portail des probabilités et des statistiques
Ce document provient de « R%C3%A9gression fallacieuse ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Regréssion fallacieuse de Wikipédia en français (auteurs)

Игры ⚽ Нужно решить контрольную?

Regardez d'autres dictionnaires:

  • Régression fallacieuse — Pour les articles homonymes, voir Régression. La régression fallacieuse désigne une situation dans laquelle l utilisation de séries temporelles non stationnaires dans une régression linéaire fait apparaître des résultats erronés, trop optimistes …   Wikipédia en Français

  • Regression lineaire multiple — Régression linéaire multiple Pour les articles homonymes, voir Régression. Sommaire 1 Modèle théorique 1.1 Exemple 1.2 E …   Wikipédia en Français

  • Régression multilinéaire — Régression linéaire multiple Pour les articles homonymes, voir Régression. Sommaire 1 Modèle théorique 1.1 Exemple 1.2 E …   Wikipédia en Français

  • Regression — Régression Cette page d’homonymie répertorie les différents sujets et articles partageant un même nom …   Wikipédia en Français

  • Régression linéaire multiple — Pour les articles homonymes, voir Régression. La régression linéaire multiple est une analyse statistique qui décrit les variations d une variable endogène associée aux variations de plusieurs variables exogènes. Par exemple, une analyse de… …   Wikipédia en Français

  • Régression — Cette page d’homonymie répertorie les différents sujets et articles partageant un même nom. Sur les autres projets Wikimedia : « Régression », sur le Wiktionnaire (dictionnaire universel) Sommaire …   Wikipédia en Français

  • Logique fallacieuse — Sophisme Un sophisme, ou argument à logique fallacieuse, est un raisonnement qui apparaît comme rigoureux et logique, mais qui en réalité n est pas valide (à ne pas confondre avec vrai). À l inverse du paralogisme, il y a volonté de tromper. Le… …   Wikipédia en Français

  • Coefficient de corrélation multiple — Régression linéaire multiple Pour les articles homonymes, voir Régression. Sommaire 1 Modèle théorique 1.1 Exemple 1.2 E …   Wikipédia en Français

  • Coefficient de détermination — Régression linéaire multiple Pour les articles homonymes, voir Régression. Sommaire 1 Modèle théorique 1.1 Exemple 1.2 E …   Wikipédia en Français

  • Projet:Mathématiques/Liste des articles de mathématiques — Cette page n est plus mise à jour depuis l arrêt de DumZiBoT. Pour demander sa remise en service, faire une requête sur WP:RBOT Cette page recense les articles relatifs aux mathématiques, qui sont liés aux portails de mathématiques, géométrie ou… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”