Nous avons présenté dans ce cours des systèmes d'apprentissage basés
sur les arbres de décision et les réseaux de neurones. Il nous semble
important de rappeler que pour l'analyse de données les méthodes
statistiques restent très importantes et sont largement utilisées. Les
méthodes présentées font partie de la classe des méthodes dites non
paramétriques et sont issues de l'Intelligence artificielle. Les
méthodes basées sur les arbres de décision sont des méthodes dites
symboliques (la procédure produite peut s'écrire sous forme
symbolique, i.e. sous forme de règles). Il existe d'autres méthodes
que celles présentées et les méthodes présentées possèdent de
nombreuses variantes. Il existe également des méthodes symboliques
basées sur des langages de description plus riches. Les méthodes
basées sur les réseaux de neurones sont des méthodes dites adaptatives
(on procède par ajustement de coefficients) et la procédure produite
est de type ``boîte noire''. Il existe d'autres architectures de
réseaux que celles présentées dans ce cours (modèle de Hopfield,
réseaux stochastiques, réseaux de Kohonen, réseaux réentrants,
...). Signalons enfin l'émergence d'une nouvelle classe de systèmes
d'apprentissage basés sur les algorithmes génétiques.
Nous terminons par quelques éléments de comparaison entre les méthodes
présentées. Si l'on souhaite que les procédures de classification
puissent être compréhensibles par l'utilisateur, on s'orientera vers
les méthodes à base d'arbres de décision. Sinon le choix reste ouvert.
Certains auteurs prétendent que les méthodes à base de réseaux de
neurones sont meilleures dès que les données d'entrée sont continues,
mais les résultats expérimentaux ne valident pas toujours cette
affirmation. Les résultats expérimentaux semblent prouver les faits
suivants : le temps de calcul pour les réseaux de neurones est en
général supérieur au temps de calcul pour les systèmes basés sur les
arbres de décision (le rapport variant entre 1 et beaucoup), la
procédure générée par un réseau de neurones est généralement
légèrement meilleure, les réseaux de neurones semblent mieux se
comporter en présence de bruit. Il semble enfin [Qui94] que
les réseaux de neurones se comportent mieux que les arbres de décision
lorsque tous les attributs sont signifiants et que l'inverse soit vrai
lorsque la pertinence d'un attribut pour la classification dépend de
la valeur d'autres attributs.