Algorithme C4.5

Algorithme C4.5
Page d'aide sur l'homonymie Pour les articles homonymes, voir C4.

L’algorithme C4.5 est un algorithme de classification supervisé, publié par Ross Quinlan. Il est basé sur l'algorithme ID3 auquel il apporte plusieurs améliorations.

C4.5

À partir d'un échantillon d'apprentissage composé d'une variable objectif ou variable prédite Y et d'au moins une variable d'apprentissage ou variables prédictives \{x_1,x_2,\ldots,x_n\}=X, C4.5 produit un modèle de type arbre de décision. Ce modèle permet de prédire pour un individu i la valeur estimé \hat{y_{i}} de la variable objectif en fonction des valeurs prise par les variables "prédictives" xi. L'algorithme C4.5 se base sur une mesure de l'entropie dans l'échantillon d'apprentissage pour produire le modèle (graphe d'induction). L'avantage du recours à l'entropie est que l'algorithme travaille sur des données symboliques que ce soient des variables catégorielles (comme des couleurs) ou numériques discrètes (par exemple x_{i}\in \mathbb{N}). Le désavantage de la méthode est que pour préserver l'efficacité de l'apprentissage et la pertinence du modèle produit, les variables continues doivent être discrétisées avant la mise en œuvre de l'algorithme.

C5.0 et See5

Quinlan continua avec les versions C5.0 et See5 (C5.0 pour les systèmes UNIX et See5 pour Windows) qu'il commercialisa. C5.0 améliore C4.5 sur plusieurs points dont :

  • la rapidité
  • l'utilisation de la mémoire
  • des arbres de décision plus petits

C5.0 est un produit commercial dont le code source est disponible gratuitement pour l'interprétation et l'utilisation des arbres de décision et l'ensemble des règles qu'il produit.



Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Algorithme C4.5 de Wikipédia en français (auteurs)

Игры ⚽ Нужен реферат?

Regardez d'autres dictionnaires:

  • algorithme — [ algɔritm ] n. m. • 1554; lat. médiév. Algorithmus, n. pr. latinisé de l ar. Al Khawarizmi (cf. algèbre), pris pour nom commun, égalt sous la forme algorismus ♦ Vx Système de numération décimale emprunté des Arabes. ♢ Mod. Math. Suite finie,… …   Encyclopédie Universelle

  • Algorithme A* — Pour les articles homonymes, voir A*. L algorithme de recherche A* (qui se prononce A étoile, ou A star à l anglaise) est un algorithme de recherche de chemin dans un graphe entre un nœud initial et un nœud final tous deux donnés. De par sa… …   Wikipédia en Français

  • Algorithme —  Ne pas confondre avec la notion d algorithme en sport Un algorithme est une suite finie et non ambiguë d’opérations ou d instructions permettant de résoudre un problème. Le mot algorithme vient du nom latinisé du mathématicien persan Al… …   Wikipédia en Français

  • algorithme — (al go ri tm ) s. m. 1°   En termes d algèbre, procédé de calcul. 2°   Genre particulier de notations. Algorithme différentiel. HISTORIQUE    XIIIe s. •   Cette senefiance est apelée algorisme de le [la] quele nous usons de tels figures : 9, 8, 7 …   Dictionnaire de la Langue Française d'Émile Littré

  • algorithme —  Un algorithme est un processus specifique forme d une sequence d etapes parfaitement definies menant a la resolution d un certain type de probleme. Il est generalement numerique. Ce processus peut etre iteratif, c est a dire repete plusieurs… …   Glossaire de linguistique computationnelle

  • algorithme — algoritmas statusas T sritis automatika atitikmenys: angl. algorithm vok. Algorithmus, m rus. алгоритм, m; алгорифм, m pranc. algorithme, m …   Automatikos terminų žodynas

  • algorithme — algoritmas statusas T sritis fizika atitikmenys: angl. algorithm vok. Algorithmus, m rus. алгорифм, m pranc. algorithme, m …   Fizikos terminų žodynas

  • Algorithme De Knuth-Morris-Pratt — L algorithme de Knuth Morris Pratt (souvent abrégé par algorithme KMP) est un algorithme de recherche de sous chaîne, permettant de trouver les occurrences d une chaîne P dans un texte S. Sa particularité réside en un pré traitement de la chaîne …   Wikipédia en Français

  • Algorithme KMP — Algorithme de Knuth Morris Pratt L algorithme de Knuth Morris Pratt (souvent abrégé par algorithme KMP) est un algorithme de recherche de sous chaîne, permettant de trouver les occurrences d une chaîne P dans un texte S. Sa particularité réside… …   Wikipédia en Français

  • Algorithme de Knuth-Pratt-Morris — Algorithme de Knuth Morris Pratt L algorithme de Knuth Morris Pratt (souvent abrégé par algorithme KMP) est un algorithme de recherche de sous chaîne, permettant de trouver les occurrences d une chaîne P dans un texte S. Sa particularité réside… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”