Algorithme C4.5
Page d'aide sur l'homonymie Pour les articles homonymes, voir C4.

L’algorithme C4.5 est un algorithme de classification supervisé, publié par Ross Quinlan. Il est basé sur l'algorithme ID3 auquel il apporte plusieurs améliorations.

C4.5

À partir d'un échantillon d'apprentissage composé d'une variable objectif ou variable prédite Y et d'au moins une variable d'apprentissage ou variables prédictives \{x_1,x_2,\ldots,x_n\}=X, C4.5 produit un modèle de type arbre de décision. Ce modèle permet de prédire pour un individu i la valeur estimé \hat{y_{i}} de la variable objectif en fonction des valeurs prise par les variables "prédictives" xi. L'algorithme C4.5 se base sur une mesure de l'entropie dans l'échantillon d'apprentissage pour produire le modèle (graphe d'induction). L'avantage du recours à l'entropie est que l'algorithme travaille sur des données symboliques que ce soient des variables catégorielles (comme des couleurs) ou numériques discrètes (par exemple x_{i}\in \mathbb{N}). Le désavantage de la méthode est que pour préserver l'efficacité de l'apprentissage et la pertinence du modèle produit, les variables continues doivent être discrétisées avant la mise en œuvre de l'algorithme.

C5.0 et See5

Quinlan continua avec les versions C5.0 et See5 (C5.0 pour les systèmes UNIX et See5 pour Windows) qu'il commercialisa. C5.0 améliore C4.5 sur plusieurs points dont :

  • la rapidité
  • l'utilisation de la mémoire
  • des arbres de décision plus petits

C5.0 est un produit commercial dont le code source est disponible gratuitement pour l'interprétation et l'utilisation des arbres de décision et l'ensemble des règles qu'il produit.



Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Algorithme C4.5 de Wikipédia en français (auteurs)

Regardez d'autres dictionnaires:

  • C4.5 — Algorithme C4.5 Pour les articles homonymes, voir C4. L’algorithme C4.5 est un algorithme de classification supervisé, publié par Ross Quinlan. Il est basé sur l algorithme ID3 auquel il apporte plusieurs améliorations. A partir d un échantillon… …   Wikipédia en Français

  • C4 — Cette page d’homonymie répertorie les différents sujets et articles partageant un même nom.   Sigles d’une seule lettre > Sigles de deux lettres   Sigles de trois lettres   Sigles de quatre lettres …   Wikipédia en Français

  • Algorithme ID3 — L’algorithme ID3 a été développé à l’origine par Ross Quinlan. Il a tout d’abord été publié dans le livre ‘’Machine Learning’’ en 1986. C’est un algorithme de classification supervisé, c’est à dire qu il se base sur des exemples déjà classés dans …   Wikipédia en Français

  • C-4 — C4 Cette page d’homonymie répertorie les différents sujets et articles partageant un même nom. {{{image}}}   Sigles d une seule lettre > Sigles de deux lettres   Sigles de trois lettres …   Wikipédia en Français

  • C.4 — C4 Cette page d’homonymie répertorie les différents sujets et articles partageant un même nom. {{{image}}}   Sigles d une seule lettre > Sigles de deux lettres   Sigles de trois lettres …   Wikipédia en Français

  • C04 — C4 Cette page d’homonymie répertorie les différents sujets et articles partageant un même nom. {{{image}}}   Sigles d une seule lettre > Sigles de deux lettres   Sigles de trois lettres …   Wikipédia en Français

  • C 4 — C4 Cette page d’homonymie répertorie les différents sujets et articles partageant un même nom. {{{image}}}   Sigles d une seule lettre > Sigles de deux lettres   Sigles de trois lettres …   Wikipédia en Français

  • Arbre De Décision — Un arbre de décision est un outil d aide à la décision et à l exploration de données. Il permet de modéliser simplement, graphiquement et rapidement un phénomène mesuré plus ou moins complexe. Sa lisibilité, sa rapidité d exécution et le peu d… …   Wikipédia en Français

  • Arbre de decision — Arbre de décision Un arbre de décision est un outil d aide à la décision et à l exploration de données. Il permet de modéliser simplement, graphiquement et rapidement un phénomène mesuré plus ou moins complexe. Sa lisibilité, sa rapidité d… …   Wikipédia en Français

  • Arbre de décision — Pour les articles homonymes, voir Arbre (homonymie). Un arbre de décision est un outil d aide à la décision qui représente la situation plus ou moins complexe à laquelle on doit faire face sous la forme graphique d un arbre de façon à faire… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”