site de Fabien Torre, université de Lille


Licence Sociologie Quantitative (Licence SoQ)

Déroulé de mes séances dans la troisième de la licence SoQ en 2015-2016. Le cours porte sur la programmation perl pour l'analyse de contenu textuel.

Descriptif du cours

Compétences visées

  • traitements de fichiers structurés, changements de formats,
  • traitements élémentaires du langage naturel,
  • maîtrise des bases de la programmation perl.

Contenu de la formation

Cet enseignement propose une introduction à la manipulation de corpus textuels, ainsi qu'une découverte du langage de programmation Perl.

Depuis sa création en 1987, Perl vise à faciliter le traitement des données textuelles. Par la suite, Perl a été utilisé comme un langage glu, c'est-à-dire permettant des changements de formats et facilitant ainsi le dialogue entre des logiciels basés sur des dialectes différents.

Nous étudierons ces changements de formats, puis l'extraction automatique de connaissances à partir de textes.

Séances de cours

Sauf avis contraire, les cours ont lieu le mardi de 8h30 à 11h30, salle A1.410.

Mardi 12 janvier, séance 1/8

Introduction au cours « Perl et textes ».

  • Système d'exploitation Linux et corpus textuels.
  • Discussion sur les formats ouverts.
  • Principes du langage Perl et applications.

Mardi 19 janvier, séance 2/8

Cours sur les bases du langage perl : syntaxe, variables, structures de contôle et procédures.

Travaux pratiques sur la production automatique de textes et de documents html.

Mardi 2 février, séance 3/8

  • Travaux pratiques sur les conjugaisons automatiques, production automatique de code html.
  • Cours sur le traitement des fichiers en perl : lecture et écriture.
  • Fin d'exercice sur les conjugaisons.
  • Début du pipotron.

Mardi 9 février, séance 4/8

  • Poursuite du pipotron : lecture depuis des fichiers, production des phrases en html, conjugaison du verbe.
  • Cours sur les expressions régulières en perl.
  • Travaux pratiques sur le catalogue de jouets.

Mardi 1er mars, séance 5/8

  • Travaux pratiques sur les expressions régulières : catalogue de Noël.

Mardi 8 mars, séance 6/8

Évaluation sur machine. Au programme :

  • Syntaxe Perl : structure conditionnelle, boucles, tableaux.
  • Production d'aléatoire.
  • Fichiers : lecture et écriture en html.
  • Expressions régulières.

Mardi 15 mars, séance 7/8

  • Utilisation d'un dictionnaire.
  • Normalisation et lemmatisation.

Mardi 22 mars, séance 8/8

  • Comptage de cooccurrences et visualisation du graphe associé.
  • Suivi de projets.
Fabien Torre Valid HTML5! Valid CSS!
Accueil > Enseignement > Formations > Licence SoQ
(contenu mis à jour )
site de Fabien Torre, université de Lille

Description

Survoler un lien de navigation pour lire sa description ici...