Utilisation du fichier Robot.txt pour optimiser le référencement de Wordpress

Wordpress est l’une des meilleures plateformes de blogging, mais elle possède un petit problème : le contenu dupliqué. Un même billet peut être accédé depuis les archives, les feeds, les tags, etc.

Google possède un filtre qu’on appelle “Duplicate Content Filter” qui s’occupe de mettre dans un index à part appellé le “Supplemental Index” tout ce qu’il considère comme contenu parasite. Les pages placées dans cet index seront toujours présentes dans l’index mais ne s’afficheront presque jamais dans les premières pages de Google.

Pour éviter le contenu dupliqué dans Wordpress, vous pouvez créer un fichier personnalisé Robot.txt dans la racine de votre site qui permet de dire à Google ce qu’il doit indexer et ce qu’il doit ignorer. Le bot de Google ne passera qu’un temps bien limité sur votre blog et il vaut mieux qu’il le passe sur les pages qui comptent vraiment.

Voici par exemple le fichier ROBOT.txt utilisé sur ce site :

User-agent: Googlebot
Disallow: /*/feed/$
Disallow: /*/feed/rss/$
Disallow: /*/trackback/$
User-agent: *
Disallow: /wp-
Disallow: /feed/
Disallow: /trackback/
Disallow: /rss/
Disallow: /comments/feed/
Disallow: /date/

Ce fichier empêche Google d’indexer les répertoires commençons par wp-*. Ces répertoires sont les répertoires d’administration, ainsi que les répertoires qui contiennent les plug-ins et les thèmes.

Il bloque également la page des archives ainsi que les feeds. Vous aurez alors moins de contenu dupliqué et Google passera plus de temps à indexer les pages les plus importantes de votre site.


0 Réponses à “Utilisation du fichier Robot.txt pour optimiser le référencement de Wordpress”


  1. Pas de commentaires

Laisser un commentaire