Master MIASHS parcours Web Analyste (Master WA)
Présentation du cours
Contenu de la formation
Dans une première partie, le cours présente le fonctionnement d'un moteur de recherche d'information (RI) de l’indexation au classement des résultats : les pré-traitements des textes, l'indexation de textes, les algorithmes pour le modèle Booléen, le calcul de score pour le modèle vectoriel, l'algorithme PageRank de calcul du score de notoriété d'une page, etc.
La deuxième partie, en lien avec la première, présente les aspects techniques du référencement, en particulier en vue d'optimiser les documents pour le référencement, de dialoguer avec les robots, d'accélérer les visites des robots et de suivre les actions menées en matière de référencement.
Pré-requis
Bases d'algorithmique, notions générales sur internet et sur les langages du web (html, css, php, javascript, sql, xml, etc.).
Connaissances visées
- Compréhension de l'indexation par les robots et du ranking par les moteurs,
- manipulation d'expressions régulières,
- connaissance des fichiers de configuration d'un serveur apache, et de leurs syntaxes, impliqués dans le bon référencement d'un site,
- cas particulier du web sur mobile.
Compétences visées
- Bonnes pratiques html/css,
- écriture de fichiers .htaccess,
- accélération du service des pages web,
- exploitation des fichiers de log apache,
- programmation de scripts,
- développement d'un moteur de recherche.
Planning et contenu des séances
Lundi 8 janvier, séance 1/8, recherche d'information
- Introduction au cours de recherche d'information.
- Cours sur les recherches séquentielles.
- Travaux pratiques en linux et python.
Lundi 15 janvier, séance 2/8, recherche d'information
- Cours sur les prétraitements du corpus.
- Cours sur le modèle booléen.
- TP Python :
- extraction du vocabulaire à partir du corpus,
- construction de la matrice d'incidence.
Lundi 22 janvier, séance 3/8, recherche d'information
Séance de travaux dirigés et pratiques sur le modèle booléen.
Lundi 5 février, séance 4/8, référencement
Introduction au cours de référencement puis séance sur l'optimisation du contenu :
- pour l'indexation par les robots,
- à l'aide html5,
- pour le rendu par le moteur,
- pour les réseaux sociaux.
Cours sur le dialogue avec les robots : dire ce qu'il faut et ne faut pas indexer à l'aide de balises html et du fichier .htaccess.
Lundi 12 février, séance 5/8, référencement
Cours sur l'accélération des visites, accélérer en soulageant le serveur, le réseau et le robot.
Cours sur le suivi des actions de référencement.
Travaux pratiques : écriture de scripts pour attaquer fichiers de log.
Lundi 5 mars, séance 6/8, recherche d'information
Cours sur le modèle vectoriel : représentation vectoriel des documents, calcul de cosinus, classement des résultats par score de pertinence.
Séance de travaux dirigés et pratiques sur le modèle vectoriel.
Lundi 12 mars, séance 7/8
Cours sur la recherche d'information sur le web.
Suivi de projets.
Lundi 19 mars, séance 8/8
Interrogation.