CHAID


CHAID

CHAID (CHi-squared Automatic Interaction Detector) est une technique de type arbre de décision. Elle a été publiée, en 1980, par Gordon V. Kass[1]. Elle peut être utilisée pour la prédiction (comme la régression linéaire) ou pour la détection d'interaction entre variables.

En pratique, elle est souvent utilisée en marketing direct pour sélectionner un groupe de consommateurs et prédire leurs réponses à certaines variables et comment ils affectent d'autres variables.

Comme avec les autres arbres de décision, ces avantages sont un résultat essentiellement visuel et facilement interprétable. À cause de la segmentation de la population lors de l'analyse, l'échantillonnage doit être suffisamment large de manière à ce que la taille de chaque groupe ne devienne pas trop petite, ce qui rendrait l'analyse peu fiable.

CHAID détecte l'interaction entre variables dans un jeu de données. En utilisant cette technique on peut établir des relations de dépendance entre variables. En prenant la lecture d'un journal, par exemple, il sera possible d'étudier l'influence de variables explicatives comme le prix, la taille, les suppléments etc. CHAID opère cela par l'identification de groupes discrets puis en prenant le lien aux variables explicatives cherchant quel serait l'impact sur la variable initiale.

CHAID est souvent utilisé comme technique d'exploration et est une alternative aux multiples régressions, en particulier quand le jeu de données n'est pas parfaitement adapté aux analyses par régression.

Sommaire

ECHAID

L'algorthme CHAID[2] se déroule en trois étapes :

  • préparation des prédicteurs
  • fusion des classes
  • sélection de la variable de séparation

Dans cette dernière étape, l'algorithme utilise les Probabilités pour estimer si une catégorie peut être divisée. L'algorithme «  Exhaustive » CHAID (ECHAID) utilise une technique plus complexe à cette même fin.

Voir aussi

Références

  1. G. V. Kass. An Exploratory Technique for Investigating Large Quantities of Categorical Data. Journal of Applied Statistics, Vol. 29, No. 2 (1980), pp. 119-127.
  2. Robert Nisbet, John Elder, Gary Miner, Handbook for Statistical Analysis And Data Mining, Accademic Press, Page 247 Edition 2009

Liens externes

  • Portail des probabilités et des statistiques Portail des probabilités et des statistiques

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article CHAID de Wikipédia en français (auteurs)

Regardez d'autres dictionnaires:

  • CHAID — is a type of decision tree technique. It was published in 1980 by Gordon V. Kass. It can be used for prediction (like regression analysis) or for detection of interaction between variables. CHAID stands for CHi squared Automatic Interaction… …   Wikipedia

  • CHAID — (Chi square Automatic Interaction Detectors) ist ein Algorithmus, der zur Entscheidungsfindung dient. Er wird bei der Konstruktion von Entscheidungsbäumen eingesetzt. Der CHAID Algorithmus wurde 1964 erstmals von J.A. Sonquist und J.N. Morgan… …   Deutsch Wikipedia

  • CHAID — chi squared automatic interaction detection; chi squared automatic interaction detector …   Medical dictionary

  • CHAID — • chi squared automatic interaction detection; • chi squared automatic interaction detector …   Dictionary of medical acronyms & abbreviations

  • CHAID — abbr. CHisquard Automatic Interaction Detector / Detection (SPSS) …   United dictionary of abbreviations and acronyms

  • Chaid Oulad El Hadj — Infobox Martial artist biography name = Chaid Oulad El Hadj imagesize = caption = birthname = nickname = The Pitbull nationality = flagicon|MAR Morocco flagicon|NED Netherlands dateofbirth = Birth date and age|1988|6|21|mf=y placeofbirth =… …   Wikipedia

  • Entscheidungsmodell — Entscheidungsbäume sind eine spezielle Darstellungsform von Entscheidungsregeln. Sie veranschaulichen aufeinanderfolgende, hierarchische Entscheidungen. Sie haben eine Bedeutung in der Stochastik zur Veranschaulichung bedingter… …   Deutsch Wikipedia

  • Klassifikationsbaum — Entscheidungsbäume sind eine spezielle Darstellungsform von Entscheidungsregeln. Sie veranschaulichen aufeinanderfolgende, hierarchische Entscheidungen. Sie haben eine Bedeutung in der Stochastik zur Veranschaulichung bedingter… …   Deutsch Wikipedia

  • Regression Tree — Entscheidungsbäume sind eine spezielle Darstellungsform von Entscheidungsregeln. Sie veranschaulichen aufeinanderfolgende, hierarchische Entscheidungen. Sie haben eine Bedeutung in der Stochastik zur Veranschaulichung bedingter… …   Deutsch Wikipedia

  • Wahrscheinlichkeitsbaum — Entscheidungsbäume sind eine spezielle Darstellungsform von Entscheidungsregeln. Sie veranschaulichen aufeinanderfolgende, hierarchische Entscheidungen. Sie haben eine Bedeutung in der Stochastik zur Veranschaulichung bedingter… …   Deutsch Wikipedia