Conseils, scripts & logiciels webmaster

Définition : Web invisible

Le Web invisible est constitué des pages web et parfois de sites web complets qui ne sont pas référencés par les moteurs de recherche.

Web invisibleCe web invisible, ou web caché est la partie du World Wide Web accessible en ligne, mais non indexée par des moteurs de recherche classiques tels que Google ou Bing.

Raisons du web invisible

Les raisons fréquentes de la non-indexation de pages web sont variées:

  • contenu dynamique : la technique de développement du site employée comme le PHP peut empêcher volontairement ou involontairement le référencement d’un site web
  • contenu non lié : c’est ce qu’on appelle des pages orphelines, c’est à dire des pages existantes, valides mais dont aucun lien en provenance d’une page référençable n’est fait. Le seul moyen d’atteindre une page orpheline est de demander exactement l’URL de la page web.
  • contenu à accès limité : c’est typiquement le contenu protégé par mot de passe, le contenu payant (encore que le contenu payant est parfois indexé par Google News)
  • format non indexable : ceci se produit avec du contenu dans un format que les robots indexeur ne peuvent correctement interpréter, c’est le cas du Flash, d’une grande partie du javascript, du contenu de frame, c’était jadis le cas des documents pdf.

Il y a diverses raison à ce web invisible, comme la mauvaise conception des sites, le manque de maîtrise des technologies utilisées, la volonté de cacher des activités illégales (trafic en tout genre, hacking, pédophilie, snuff movies), volonté de ne pas laisser indexé du contenu privé (familial, entreprise, communauté), les bases de données qui ne sont pas adaptées à la navigation web classique.

Le Web invisible est beaucoup plus étendu que le Web visible, à la manière d’un iceberg. On parle parfois de web profond et de web surfacique pour les distinguer. Ce web invisible est évalué entre 70% et 75% de la capacité du web, tandis que la partie visible, le web surfacique est estimé entre 25% et 30%.

Utilisation black hat SEO du web invisible

Ce contenu disponible, gigantesque, que Google ne connait pas, c’est évidemment de l’or en barre pour le webmaster black hat.

Utilisation du glossaire WP

Butaz