Analyse exploratoire de données

Analyse des données

L’analyse des données est un sous domaine des statistiques qui se préoccupe de la description de données conjointes. On cherche par ces méthodes à donner les liens pouvant exister entre les différentes données et à en tirer une information statistique qui permet de décrire de façon plus succincte les principales informations contenues dans ces données. On peut également chercher à classer les données en différents sous groupes plus homogènes.

Par exemple l’âge, le sexe et la catégorie socioprofessionnelle des joueurs de golf peuvent être étudiés simultanément.

Les principales méthodes de l’analyse des données sont :

Ces méthodes permettent notamment de manipuler et de synthétiser l’information provenant de tableaux de données de grande taille.

Pour cela, il est très important de bien estimer les corrélations entre les variables que l’on étudie. On a alors souvent recours à la matrice des corrélations (ou la matrice de variance-covariance) entre les variables.

Les pères de l’analyse des données sont :

De nombreux logiciels permettent d'effectuer de l'analyse des données directe ou indirecte.

Références

  • (fr) Benzécri J.-P. et al. (1976), L'Analyse des données, Paris, Dunod
  • (en) The Collected Works of John W. Tukey (ISBN 0412063212) ; (ISBN 0534051014)
  • (en) J W Tukey, Graphical Analysis of Multiresponse Data, K E Basford (ISBN 0849303842)
  • (fr) Michel Volle, Analyse des données, Economica, 4e édition, 1997 (ISBN 2717832122)
  • (fr) Jean-Marie Bouroche et Gilbert Saporta, L'Analyse des données, P.U.F , 8e édition, 2002 (ISBN 2 13 052495 8)

Liens internes

Liens externes

  • Portail des probabilités et des statistiques Portail des probabilités et des statistiques
  • Portail de l’informatique Portail de l’informatique
Ce document provient de « Analyse des donn%C3%A9es ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Analyse exploratoire de données de Wikipédia en français (auteurs)

Regardez d'autres dictionnaires:

  • Fouille de données spatiales — Exploration de données Articles principaux Exploration de données Fouille de données spatiales Fouille du web Fouille de flots de données Fouille de textes …   Wikipédia en Français

  • Exploration de données — Articles principaux Exploration de données Fouille de données spatiales Fouille du web Fouille de flots de données Fouille de textes …   Wikipédia en Français

  • Analyse Discriminante — L’analyse factorielle discriminante ou analyse discriminante est une technique statistique qui vise à décrire, expliquer et prédire l’appartenance à des groupes prédéfinis (classes, modalités de la variable à prédire, ...) d’un ensemble… …   Wikipédia en Français

  • Analyse discriminante descriptive — Analyse discriminante L’analyse factorielle discriminante ou analyse discriminante est une technique statistique qui vise à décrire, expliquer et prédire l’appartenance à des groupes prédéfinis (classes, modalités de la variable à prédire, ...)… …   Wikipédia en Français

  • Analyse factorielle discriminante — Analyse discriminante L’analyse factorielle discriminante ou analyse discriminante est une technique statistique qui vise à décrire, expliquer et prédire l’appartenance à des groupes prédéfinis (classes, modalités de la variable à prédire, ...)… …   Wikipédia en Français

  • Analyse En Composantes Principales — Pour les articles homonymes, voir ACP. L Analyse en Composantes Principales (ACP) est une Analyse Factorielle de la famille de l Analyse des données et de la Statistique Multivariée, qui consiste à transformer des variables liées entre elles… …   Wikipédia en Français

  • Analyse en composante principale — Analyse en composantes principales Pour les articles homonymes, voir ACP. L Analyse en Composantes Principales (ACP) est une Analyse Factorielle de la famille de l Analyse des données et de la Statistique Multivariée, qui consiste à transformer… …   Wikipédia en Français

  • Analyse discriminante — L’analyse factorielle discriminante ou analyse discriminante est une technique statistique qui vise à décrire, expliquer et prédire l’appartenance à des groupes prédéfinis (classes, modalités de la variable à prédire, …) d’un ensemble… …   Wikipédia en Français

  • Analyse en composantes principales — Pour les articles homonymes, voir ACP. L Analyse en Composantes Principales (ACP) est une méthode de la famille de l analyse des données et plus généralement de la statistique multivariée, qui consiste à transformer des variables liées entre… …   Wikipédia en Français

  • Institut De Statistique De L'Université De Paris — ISUP Devise L excellence statistique Informations Fondation 1922 Type Grande école publique Localisatio …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”