site de Fabien Torre, université de Lille


Master MIASHS parcours Web Analyste (Master WA)

Informations sur les cours que j'assure en Master WA pour l'année universitaire 2017-2018 : cours de recherche d'information et cours de référencement.

Présentation du cours

Contenu de la formation

Dans une première partie, le cours présente le fonctionnement d'un moteur de recherche d'information (RI) de l’indexation au classement des résultats : les pré-traitements des textes, l'indexation de textes, les algorithmes pour le modèle Booléen, le calcul de score pour le modèle vectoriel, l'algorithme PageRank de calcul du score de notoriété d'une page, etc.

La deuxième partie, en lien avec la première, présente les aspects techniques du référencement, en particulier en vue d'optimiser les documents pour le référencement, de dialoguer avec les robots, d'accélérer les visites des robots et de suivre les actions menées en matière de référencement.

Pré-requis

Bases d'algorithmique, notions générales sur internet et sur les langages du web (html, css, php, javascript, sql, xml, etc.).

Connaissances visées

  • Compréhension de l'indexation par les robots et du ranking par les moteurs,
  • manipulation d'expressions régulières,
  • connaissance des fichiers de configuration d'un serveur apache, et de leurs syntaxes, impliqués dans le bon référencement d'un site,
  • cas particulier du web sur mobile.

Compétences visées

  • Bonnes pratiques html/css,
  • écriture de fichiers .htaccess,
  • accélération du service des pages web,
  • exploitation des fichiers de log apache,
  • programmation de scripts,
  • développement d'un moteur de recherche.

Planning et contenu des séances

Lundi 8 janvier, séance 1/8, recherche d'information

  • Introduction au cours de recherche d'information.
  • Cours sur les recherches séquentielles.
  • Travaux pratiques en linux et python.

Lundi 15 janvier, séance 2/8, recherche d'information

  • Cours sur les prétraitements du corpus.
  • Cours sur le modèle booléen.
  • TP Python :
    • extraction du vocabulaire à partir du corpus,
    • construction de la matrice d'incidence.

Lundi 22 janvier, séance 3/8, recherche d'information

Séance de travaux dirigés et pratiques sur le modèle booléen.

Lundi 5 février, séance 4/8, référencement

Introduction au cours de référencement puis séance sur l'optimisation du contenu :

  • pour l'indexation par les robots,
  • à l'aide html5,
  • pour le rendu par le moteur,
  • pour les réseaux sociaux.

Cours sur le dialogue avec les robots : dire ce qu'il faut et ne faut pas indexer à l'aide de balises html et du fichier .htaccess.

Lundi 12 février, séance 5/8, référencement

Cours sur l'accélération des visites, accélérer en soulageant le serveur, le réseau et le robot.

Cours sur le suivi des actions de référencement.

Travaux pratiques : écriture de scripts pour attaquer fichiers de log.

Lundi 5 mars, séance 6/8, recherche d'information

Cours sur le modèle vectoriel : représentation vectoriel des documents, calcul de cosinus, classement des résultats par score de pertinence.

Séance de travaux dirigés et pratiques sur le modèle vectoriel.

Lundi 12 mars, séance 7/8

Cours sur la recherche d'information sur le web.

Suivi de projets.

Lundi 19 mars, séance 8/8

Interrogation.

Fabien Torre Valid HTML5! Valid CSS!
Accueil > Enseignement > Formations > Master WA
(contenu mis à jour )
site de Fabien Torre, université de Lille

Description

Survoler un lien de navigation pour lire sa description ici...