Gérer un site web engendre pas mal de choses et beaucoup de travail. On peut citer pèle mêle :
- Le contenu
- Les produits
- Les achats aux fournisseurs
- Les ventes, “suivi des commandes, expédition”
- etc…
- Le marketing
Dans le suivi du marketing, il y a tout ce que remonte Google via son outil Search console. Dans les choses à surveiller, il y a les erreurs d’exploration. L’erreur d’exploration est le mot utilisé par Google pour parler des pages en erreur : 404, 500, 503, etc….
La page 404 qu’est ce que c’est ?
La page 404 est une page qui annonce une erreur, lorsque le site web ne trouve rien sur l’URL présentée. La page 404 apparait à partir du moment ou l’on fait des modifications, des suppressions de produits, de catégories, d’articles. Cela peut aussi arriver lorsque l’on fait des modifications sur le rewriting ou des nouvelles fonctionnalités “mal maîtrisées”
Soyons bien clair, la présence de page 404 ne gênent pas le référencement généralement, mais il y a des nuances à apporter à cette remarque. C’est pourquoi il faut suivre attentivement ce qui se passe sur votre site et dans Google Search Console. Elles peuvent avoir de nombreuses causes et avoir de lourdes conséquences en terme de positionnement. Il faut donc les corriger et surveiller.
Petit aparté important
Une fois les règles d’URL définies pour un site web, normalement il ne faut plus les toucher. Les URL de vos catégories, de vos produits, etc. ne doivent plus bouger, jamais, jamais.
Exemple :
Site/id-nom-cat/
Site/id-nom-cat/id-nom-sous-cat/
site/id-nom-produit/
Donc on ne s’amuse pas à mettre des majuscules, puis des minuscules, ou des caractères accentuées dans les URLS, On ne s’amuse pas non plus à renommer ses catégories à tout bout de champ ou si vous les renommez, vérifiez que les URL ne changent pas.
Faites aussi attention à vos fins d’URL,
- / ou pas en fin d’URL
- .htm .html ou pas en fin d’URL
- URL en minuscule
ou avec des majuscules
Une fois que vous l’avez défini, cela ne doit plus bouger jamais. Faites simple et pratique.
L’outil pour voir les En-têtes HTTP
La page 404 doit respecter plusieurs choses, à commencer par le plus important , une réponse “en-têtes HTTP” contenant un
404 Not Found et pas comme je le vois parfois des en-têtes HTTP en 200.
Pour voir les en-têtes HTTP, il y a de nombreux outils, je vous conseille Web developer de Chris Pederick
Très simple d’utilisation, il permet de voir n’importe quel en-tête HTTP. Ouvrez la page et sélectionnez En-têtes HTTP.
Personnaliser sa page 404
La page 404, par défaut est souvent un peu brute, il est facile de l’améliorer en ajoutant un message personnalisé et en ajoutant des liens vers les principales rubriques, elle inclut souvent le menu dans les CMS maintenant. Cela peut vous aider à récupérer quelques visiteurs.
Comment détecter et trouver les pages 404 ?
La search console
L’outil est absolument indispensable, il vous remonte des erreurs avec seulement 24 heures de retard et vous donne les pages d’où viennent les erreurs.
Voir d’où viennent les erreurs 404 ?
Là, ce sont des URL source qui viennent du même site, il peut y avoir des sites externes. C’est à ces URL externes qu’il faut prêter attention.
Logiciel pour scanner un site
Il est aussi primordial de scanner son site web, pour voir ce qu’il se passe. Screaming frog est l’outil indispensable, il y en a certainement d’autres, mais celui ci fait bien son travail.
Scanner un site est important, lorsque vous détectez une baisse de trafic, lors de la mise en place d’un correctif, d’une mise à jour, etc… Cela permet de voir si le site ne bouge pas et que les URL ne bougent pas.
Je vous conseille même de le faire régulièrement, il permet de sauvegarder le fichier de scan et vous pouvez faire des exports au format Excel.
Si vous voyez “une explosion” de redirection 301, 302 d’erreur 404, d’erreur 500, il y a un soucis et il faut chercher ce qu’il se passe.
Vous avez un mise à jour qui va être déployée sur votre site, scannez le avant et après, dés que votre développeur vous signale que la publication est OK, avec cet outil vous pouvez vérifier beaucoup de choses et comparer, si vous constatez un soucis, vous pouvez réagir plus vite pour corriger et éviter que le Bot Google indexe des pages en erreur et qu’en suite Search Console vous remonte des centaines d’erreurs.
Cela vous évitera des pages par centaines en erreur ou avec de mauvaises URL indexés par erreur.
La règle est que ous devez avoir un minimum de 404 et 301 présent sur votre site lorsque lors d’un scan, Si vous détectez un nombre important il faut se pencher sans tarder sur le problème.
Surveiller les Sitemap.xml
Il permet aussi de scanner les sitemap.xml, c’est tout aussi facile qu’un site web. Beaucoup d’erreurs viennent souvent du sitemap.xml
Je ferai un article pour présenter Screaming Frog ultérieurement.
Que faire alors de ces pages 404 ?
Voila, vous avez tout un tas de page en 404 dans Search Console , que fait on ? il faut les corriger, il y a plusieurs choses à faire.
- si les liens en erreur ont comme source votre site ou des sites que vous maitrisez, il faut corriger les pages qui donnent des URL erronées .
- Si les liens en erreur ont comme source des sites sur lequel vous ne maitrisez rien, il faut mettre en place une redirection 301 de l’URL en erreur vers celle qui fonctionne .
La mise en place des redirections 301 quelles sont les règles ?
Faire des redirections : OK mais vers quoi ? Pour les redirections 301, faire des redirections vers un produit équivalent ou la catégorie supérieure. Ne faites pas de redirection systématique vers la page d’accueil. Faites aussi attention à vos articles de blog.
Toute URL qui pointe vers votre site et tombe sur une page 404 doit faire l’objet d’un traitement, vous gagnez un lien en fait.
Doit on traiter toutes les 404 ?
Réponse de normand, cela dépend. Cela dépend de pas mal de choses, j’aurai tendance à traiter toutes les 404 qui viennent de Google, Surtout si vous avez des sources qui viennent de forum, de discussion, de sites institutionnels, il faut les corriger en les optimisant.
Exemple :
- Vous avez un lien qui vient d’un forum et la discussion parle d’un de vos produits, il faut trouver un produit équivalent et faire la redirection 301.
Cela dépend du nombre si vous avez un gros site et que vous n’avez jamais traité les 404, vous pouvez vous trouver face à 10 000 URL en 404 voir bien plus.
Le site ci-dessus a eu droit à un changement de technologie, donc les URLS ont changé, ce qui génère toutes ces erreurs.
Des milliers de 404
Si vous avez des milliers de 404, il faut certainement mettre en place une automatisation en définissant clairement les règles avec le développeur, Tout produit en 404 doit être redirigé vers le produit le plus proche ou la catégorie qui le contient.
Mise en place des 301
La mise en place des 301 peut se faire via le fichier .Htaccess ou via un soft dans le Back office. Pour la plupart des CMS : Prestashop, Magento WordPress Joomla, etc…, il existe des plugins gratuits ou payants pour gérer les redirections. Si vous utilisez un CMS propriétaire, je vous engage à développer ou faire développer un outil de gestion de redirection, certains diront, on peut tout faire dans le .Htaccess, mais une erreur dans ce fichier et le site est par terre, on ne peut pas le déléguer non plus.
Exemple avec WordPress
Conclusion
La gestion des 404 et leurs corrections est un sujet important. Il faut bien savoir ce que l’on fait, au risque de faire de gros dégâts. Et vous comment gérez vous les 404 ?
Comments (3)
Merci pour cet article très complet. C’est vrai que la question de la page 404 n’est pas toujours traitée quand on créer un site web, à tort comme on peut le voir
[…] posts sur les recommandations de base pour améliorer votre référencement naturel comme la correction des erreurs 404 , les bonnes pratiques des balises Hn , le référencement des images , la rédaction du contenus […]
[…] erreurs 404 qui impliquent des redirections à […]