Précédent Index Suivant
Conclusion
Nous avons présenté dans ce cours des systèmes d'apprentissage basés sur les arbres de décision et les réseaux de neurones. Il nous semble important de rappeler que pour l'analyse de données les méthodes statistiques restent très importantes et sont largement utilisées. Les méthodes présentées font partie de la classe des méthodes dites non paramétriques et sont issues de l'Intelligence artificielle. Les méthodes basées sur les arbres de décision sont des méthodes dites symboliques (la procédure produite peut s'écrire sous forme symbolique, i.e. sous forme de règles). Il existe d'autres méthodes que celles présentées et les méthodes présentées possèdent de nombreuses variantes. Il existe également des méthodes symboliques basées sur des langages de description plus riches. Les méthodes basées sur les réseaux de neurones sont des méthodes dites adaptatives (on procède par ajustement de coefficients) et la procédure produite est de type ``boîte noire''. Il existe d'autres architectures de réseaux que celles présentées dans ce cours (modèle de Hopfield, réseaux stochastiques, réseaux de Kohonen, réseaux réentrants, ...). Signalons enfin l'émergence d'une nouvelle classe de systèmes d'apprentissage basés sur les algorithmes génétiques.

Nous terminons par quelques éléments de comparaison entre les méthodes présentées. Si l'on souhaite que les procédures de classification puissent être compréhensibles par l'utilisateur, on s'orientera vers les méthodes à base d'arbres de décision. Sinon le choix reste ouvert. Certains auteurs prétendent que les méthodes à base de réseaux de neurones sont meilleures dès que les données d'entrée sont continues, mais les résultats expérimentaux ne valident pas toujours cette affirmation. Les résultats expérimentaux semblent prouver les faits suivants : le temps de calcul pour les réseaux de neurones est en général supérieur au temps de calcul pour les systèmes basés sur les arbres de décision (le rapport variant entre 1 et beaucoup), la procédure générée par un réseau de neurones est généralement légèrement meilleure, les réseaux de neurones semblent mieux se comporter en présence de bruit. Il semble enfin [Qui94] que les réseaux de neurones se comportent mieux que les arbres de décision lorsque tous les attributs sont signifiants et que l'inverse soit vrai lorsque la pertinence d'un attribut pour la classification dépend de la valeur d'autres attributs.




Précédent Index Suivant