site de Fabien Torre, université de Lille


Programmation, mesures et visualisations pour le référencement

Des expérimentations informatiques pour mieux comprendre les robots qui passent sur ce site, le référencement de ces pages et leur apparition dans les SERPs. Programmation de scripts simples pour obtenir rapidement des indicateurs, à partir des fichiers de log par exemple.

Visualisation du maillage interne du site

Obtenir le graphe induit par les liens internes au site

Sur ce site, les pages sont classiquement organisées en arborescence, ce qui me permet d'afficher sur chacune des liens vers :

  • ses enfants,
  • ses ancêtres,
  • son frère gauche et son frère droit,
  • mais aussi vers d'autres pages associées, ce qui ne respecte pas la structure d'arbre.

Le tout étant spécifié dans un unique fichier XML, j'ai écrit un petit script Perl (pourquoi pas ?) pour parcourir ce fichier, à la mode SAX.

Visualiser avec Gephi

J'ai opté pour une visualisation à l'aide de Gephi. L'étape suivante consiste donc à construire un fichier texte contenant la matrice d'adjacence du graphe précédemment obtenu en respectant le format d'entrée de Gephi.

Enfin une utilisation basique de Gephi :

  • classer les nœuds en fonction du Degré, régler les tailles des nœuds (icône diamant) entre 20 et 75,
  • choisir force atlas comme méthode de spatialisation avec 100,000 comme force de répulsion et la case ajustement par taille cochée,
  • dans les paramètres, vue générale du réseau, lancer les calculs de la modularité avec une résolution entre 0.5 et 1 (par exemple 0.75),
  • lancer la partition en fonction de la modularité,
  • prévisualiser avec affichage des labels et une taille de police importante.

Résultats

Rien d'inattendu mais nous confirmons ici que la structure du site est appréhendable par un traitement automatique de base, c'est rassurant.

graphe de liens induit par le site

À suivre : les pages par profondeur, les visites des robots

Parcours en largeur du graphe précédent à partir du nœud « page d'accueil ».

Visualisation du résultat.

Mis en regard des pages par profondeur avec les fréquences de visite des robots.

Fabien Torre Valid HTML5! Valid CSS!
Accueil > Sur ce site > Référencement
(contenu mis à jour )
site de Fabien Torre, université de Lille

Description

Survoler un lien de navigation pour lire sa description ici...