Conseils, scripts & logiciels webmaster

Définition : META Charset

La balise META Charset précise l’encodage d’un document HTML afin d’afficher correctement les caractères spéciaux contenus dans la page web.

Meta tagsA l’origine, les fichiers HTML sont faits pour être encodé avec le jeu de caractère ASCII, c’est à dire sans caractères spéciaux, ce qui a vite limité les possibilité d’afficahge surtout pour des langues latines comme le français. Dans un document web, la balise META Charset définit le type de contenu de la page ainsi que le jeu de caractères. Elle n’a pas d’utilité SEO à proprement dit mais il faut toujours s’assurer de sa bonne utilisation afin de ne pas pénaliser le référencement et produire un mauvais affichage de la page web. L’encodage spécifie comment ces caractères sont effectivement stockés sous forme d’octets compréhensibles par un ordinateur.

<meta charset="UTF-8">

Avant le HTML5, cette balise se présentait sous cette forme:

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />

Importance de cette métadonnée

Ce n’est pas une balise obligatoire puisque le serveur web lui même envoie des informations sur l’encodage, mais elle permet de rattraper des mauvaises informations. Ce qui importe surtout, c’est de ne pas envoyer de mauvaises informations qui aurait pour effet de détériorer l’affichage du contenu, n’interprétant pas correctement les caractères spéciaux comme les lettres accentuées. D’ailleurs quand un document web contient des mauvais caractères dans les mots avec accents, c’est qu’il s’agit probablement d’une mauvaise valeur du charset.
Quelques exemples de charset :

  • UTF-8 appelé Unicode
  • ISO-8859-1 souvent appelée Latin-1
  • ISO-8859-15 souvent appelée Latin-9
  • Windows-1252 parfois appelé AINSI

Optimisation de la Balise META Charset

Il est recommandé de placer cette balise le plus tôt possible dans l’en-tête du document HTML, puisque d’autres balises comme la balise Title ou la balise META Description peuvent déjà contenir des données avec des accents et toutes sortes de caractères spéciaux.

Veillez à insérer la valeur de l’attribut de contenu entre des guillemets droits afin d’éviter à la page web d’être interprété de manière erronée.
Pour un site multilingue, il est recommandé d’utiliser le charset UTF-8. L’encodage UTF-8 est aujourd’hui compris par tous les navigateurs web courants. Il permet d’encoder un nombre très important de caractères.

Butaz