Conseils, scripts & logiciels webmaster

Définition : META Robots

La balise META Robots est utilisé pour envoyé des informations aux robots indexeur des moteurs de recherche.

Meta tagsLa balise META Robots permet de contrôler si les robots d’indexation du moteur de recherche sont autorisés à indexer une page, ou non, et s’ils doivent suivre les liens d’une page, ou non, s’ils peuvent archiver cette page et d’autres réglages en rapport avec les robots indexeur des moteurs de recherche comme Bing, Yahoo, Google et même les moteurs de recherche secondaires. Il est possible de préciser des informations générales qui s’appliquent à tous les robots à la fois ou bien de signifier à quel robot indexeur précis la directive s’adresse. Normalement tous les robots indexeur respectent ces directives, mais il faut prendre bien garde avec les commandes secondaires qui peuvent être plus ou moins supportés par les moteurs de recherche.

<meta name="robots" content="noindex, nofollow, noarchive">
<meta name="robots" content="noindex">
<meta name="robots" content="nofollow">
<meta name="robots" content="noarchive">

<meta name="Googlebot" content="noodp">
<meta name="Googlebot-news" content="noindex" >
<meta name="Slurp" content="noindex">
<meta name="MSNbot" content="nofollow">

Importance de cette métadonnée

C’est une balise optionnel dans la mesure ou valeur par défaut autorise les robots indexeurs à faire les actions. Ce qui importe c’est de ne pas mal configurer les valeurs du META Robots, puisque cela peut empêcher le référencement par les moteurs de recherche en cas de mauvaise utilisation, le cauchemar du SEO.
Cette balise META Robots est particulièrement utile pour éviter de référencer du contenu qui se répète sur plusieurs page, le duplicate content. Par exemple, un blog peut voir un même article dans plusieurs catégories, dans le sytème de tags, dans le système d’archive, etc… ce qui produit à chauqe fois du duplicate content, dont l’impact est négatif pour le SEO. Il faut choisir le système à indexer dans les moteurs de recherche, généralement les catégories, et utiliser la balise META Robots pour empêcher l’indexation des autres systèmes qui répètent le contenu.

Utilisation de la Balise META Robots

A la place des balises META, il est possible d’utiliser le fichier robots.txt pour préciser les commandes d’indexation.
Google, puis Yahoo ont proposé de remplacer cette balise META par la balise « X-Robots-Tag ».

Voici la liste des principales directives de la balise META Robots :

  • aucune : si aucune valeur n’est précisée alors la directive est équivalente aux directives "index, follow" par défaut. Autrement dit, les robots indexent tout par défaut.
  • noindex : cette directive empêche l’indexation de la page par les robots indexeur. C’est une valeur utile pour éviter par exemple de réfénrecer du contenu dupliqué apparaissant sur plusieurs pages.
  • nofollow : cette directive empêche le robot indexeur de suivre les liens de cette page. Cette commande est souvent utilisé en relation avec « noindex » pour complètement rendre une page web en quelque sorte transparente au référencement.
  • none : cette directive est équivalente aux directives "noindex, nofollow", permettant de refuser que cette page et les oiens qui s’y trouvent puissent être pris en compte par les robots indexeur.
  • nosnippet : cette directive empêche l’affichage d’un extrait de la apge web dans les résultats de recherche, SERP.
  • noarchive : cette directive empêche le moteur de recherche de proposer le lien « En cache » associé à une page aux internautes.
  • noimageindex : cette directive permet d’indiquer que vous ne souhaitez pas faire apparaître votre page comme source d’une image apparaissant dans les résultats de recherche.
  • unavailable_after :[date] : cette directive permet de préciser l’heure et la date précises auxquelles l’exploration et l’indexation de cette page doivent cesser.
  • noodp : empêche l’utilisation d’une description de remplacement tirée des sites DMOZ.

Pour un SEO réellement optimal, on ne peut faire l’économie de la balise META Robots. Pour un blog fonctionnant avec le CMS WordPress il existe des plugins qui peuvent gérer de manière plus ou moins automatisée la balise META Robots pour chaque page du blog.

Utilisation du glossaire WP

Butaz