Cours : classification supervisée, classification (clustering) et règles d'association pour la fouille de données

Ce cours est donné à des étudiants de master non informaticiens. Les objectifs du cours sont la compréhension des principaux algorithmes de fouille de données : le clustering par les k-moyennes, par classification hiérarchique ascendante, un algorithme par densité ; l'algorithme Apriori pour les règles d'association ; les algorithmes de classification supervisée par arbres de décision, par séparation linéaire (correction d'erreur, gradient, gradient stochastique, systèmes à vastes marges) et leurs extensions au cas de non séparation linéaire (réseaux de neurones, marges douces et noyaux).
L'accent est porté sur le choix des paramètres, la complexité des algorithmes et l'évaluation des performances pour un bon choix de méthode face à une étude de cas. Tous les TPs sont faits avec le logiciel R.
Quelques documents : notes de cours archéologiques (1999) sur la classification supervisée avec exercices ; une présentation datée (2007) de l'état de l'art du Machine Learning. Les cours qui suivent ont une durée de 2 à 4 heures.