L’url canonique est un jargon bien connu des webmasters et des professionnels du html. Son utilisation est fortement recommandée dans certains cas de figure, mais avant cela, à quoi sert-elle et quand faut-il l’utiliser ? Découvrez tout ce qu’il faut savoir là-dessus, car elle influe positivement sur le référencement de vos pages.
Qu’appelle-t-on url canonique ?
L’url canonique c’est l’adresse officielle que l’on attribue à une page web. Autrement dit, c’est l’adresse d’un contenu que l’on indique aux robots crawlers comme celle à indexer. Ainsi, si d’autres pages de votre site ou d’un autre site copient votre contenu, les robots crawlers n’en tiennent pas compte. Ils se contentent seulement d’indexer, et donc de faire figurer sur la toile, le contenu publié sous l’url canonique. Cela évite d’avoir des contenus dupliqués.
On utilise aussi les termes « rel canonical, web meta canonical, balise canonical ou balise canonique » pour désigner cette url.
Pourquoi utiliser une url canonique ?
Pour optimiser le classement d’un site, les robots crawlers tiennent compte de nombreux paramètres. Parmi eux, il y a l’adresse web ou url de la page et de son contenu. La logique veut qu’à une url corresponde un contenu unique, mais ce n’est pas toujours le cas. Il arrive qu’on tombe sur de la duplication de contenus c’est-à-dire différentes urls affichant le même contenu. Pour les robots crawlers, c’est un motif plus que valable pour pénaliser les pages dupliquées, or la pénalisation implique que les pages prises en faute soient chassées de la toile.
Si lesdites pages pénalisées appartiennent à des copieurs malhonnêtes, cela ne pose aucun problème. Par contre, si la page source qui a été victime de plagiat se retrouve également pénalisée (et c’est malheureusement le cas), le webmaster propriétaire de la source aura investi son temps et, parfois son argent, inutilement. Pour vous éviter pareille injustice, l’utilisation de l’url canonique est conseillée.
Tout savoir sur le Duplicate Content
Il faut comprendre que lorsque les spiders tombent sur des contenus identiques, ils n’ont que peu de moyens de vérifier la paternité du contenu. Si la paternité est claire, seules les pages copieuses sont pénalisées. Le seul problème c’est qu’il est difficile de la déterminer et la source se fait pénaliser injustement.
Parfois, le plagiat est interne à un même site. C’est souvent le cas sur un site e-commerce lorsque des fiches produits sont assez similaires. Dans ce cas-là, le responsable est le propriétaire même du site.
Mais il arrive aussi que le plagiat soit externe lorsqu’un autre site vole tout bonnement votre contenu ou qu’il copie une partie de votre contenu sans citer la source. Il peut s’agir, dans ce cas-là, d’une ruse du Negative SEO, c’est-à-dire faire exprès de générer du duplicate content pour le concurrent afin de le faire chuter dans le classement. Malheureusement, de telles pratiques existent bel et bien et certains utilisent même des outils pour voler le contenu d’autrui.
Que le duplicate soit interne ou externe, la balise canonique est la solution à privilégier pour éviter toute forme de duplication. Grâce à elle, les robots crawlers sont bien informés que c’est cette adresse qu’il faut indexer. Ils ne risquent donc pas de détecter du duplicate content puisque tous les autres contenus dupliqués seront automatiquement assimilés à l’url canonique. Même les voleurs peu scrupuleux n’auront rien à redire et leurs tentatives ne feront qu’échouer.
Pour information :
Si les robots détestent autant le plagiat c’est parce que crawler des contenus semblables équivaut à répéter le même travail. Non seulement, c’est inutile, mais indexer des pages de même contenu ne fait qu’encombrer leurs serveurs. C’est aussi un très mauvais point pour l’écologie numérique, car refaire deux fois le même travail fait consommer de l’énergie inutilement sans compter l’énergie nécessaire au serveur pour stocker des pages dupliquées.
A quoi ressemble une url canonique ?
C’est une url comme toutes les autres, mais dans laquelle on va insérer la balise canonique. Pour ce faire, vous avez deux options :
- Déclarer la balise dans le fichier .htaccess au niveau de l’en-tête HTTP :
Dans ce cas-ci, la balise à insérer prend cette forme :
Link : <url> ; rel=«canonical »
Une fois insérée, l’url canonique prend le format suivant :
Link : <http://www.nomdedomaine.com> ; rel=«canonical»
Il est toujours conseillé d’écrire l’url en absolu, c’est-à-dire avec le http:// ou le https://.
- Déclarer la balise dans le code HTML au niveau de la balise head :
Dans ce cas-ci, la balise à insérer prend la forme suivante :
<head>
…
<link rel=«canonical» href=«URL» />
…
</head>
Une fois insérée, l’url canonique de la page prend la forme suivante :
<head>
…
<link rel=«canonical» href=« http://www.nomdedomaine.com» />
…
</head>
Il faut bien préciser que dans ce second cas, la balise doit être insérée dans le head et non dans le body.
Lire aussi – Référencement SEO : profondeur des pages Vs structure des urls
La balise canonique avec Yoast SEO
Pour insérer une balise canonical, nous venons de vous dévoiler, ci-dessus, les deux options envisageables. Toutefois, si ces techniques vous paraissent un peu trop technique, vous pouvez utiliser le plugin Yoast SEO si et seulement si, votre site est édité sous WordPress.
Une fois le plugin déployé (il se situe en bas de l’éditeur de texte, là où on remplit les métadonnées), vous aurez le champ url canonique. Il vous suffit d’indiquer dans le champ adapté l’url canonique qui doit pointer vers la page que vous êtes en train d’éditer. Si vous le laissez vide, l’url de la page sera le permalien émis par défaut.
Quand utiliser l’url canonique ?
Puisqu’on n’est jamais à l’abri d’un vol de contenus, l’idéal c’est de l’utiliser pour toutes vos pages. Mais vous pouvez aussi vous contenter de l’insérer lorsque vous le jugez vraiment nécessaire. C’est le cas lorsque :
- Vous souhaitez afficher un produit ou un contenu dans deux catégories différentes du site. Ce contenu ne gardera donc qu’une seule et unique adresse, même s’il s’affiche dans différentes catégories. Cela évite le duplicate content en interne.
- Vous instaurez des systèmes de filtre et de tri sur votre site e-commerce : puisqu’un produit peut apparaître suite à différents filtres, la balise canonique vous évite d’avoir des contenus dupliqués puisque le produit n’aura qu’une seule url canonique visible vous n’importe quel filtre y correspondant.
- Vous souhaitez vous protéger du vol de vos contenus : ainsi, même si certaines pages copient le contenu, les robots ne tiennent compte et n’indexent que votre url canonique. Celles dupliquées pointent directement vers votre page.
Quelle est la différence entre url canonique et redirection 301 ?
On a tendance à confondre les deux du fait de leur grande similitude étant donné qu’elles redirigent d’une page à une autre. Toutefois, il faut savoir que :
- L’url canonique est entièrement destinée aux robots crawlers : elle redirige ces derniers vers la page à indexer.
- La redirection 301 redirige robots crawlers et internautes vers la page à prendre en compte. Elle n’influe pas sur l’indexation, mais plutôt sur l’expérience utilisateur.
Prendre connaissance de cette différence vous permet de choisir entre la redirection et la balise canonique le cas échéant. Quand c’est possible, privilégiez toujours la redirection.
Attention aux erreurs lors de l’utilisation de l’url canonique
Certaines erreurs ont effectivement été enregistrées du fait de leur fréquence. Pour que vos urls canoniques soient correctes, voici ce qu’il faut éviter à l’avenir :
- Utiliser une même url canonique pour des contenus différents :
L’url canonique ne doit être utilisée que lorsqu’il y a duplication de contenus et donc en cas de contenus similaires. Tâchez toujours de vérifier que vous avez entré la bonne url, car sinon, les pages de contenus différents enregistrés ne seront pas indexées.
- Inverser la page source à indexer et celle secondaires :
Une bonne vérification vous permet d’éviter ce genre d’erreur. Si cela survient, c’est qu’au lieu de faire indexer votre page, vous allez générer l’effet inverse.
- Insérer la balise dans le body :
La balise canonical doit se trouver dans le head. Retenez bien cela, car sinon, elle ne servirait à rien.
- Utiliser plusieurs urls canoniques pour une même page :
Cela peut paraître bête, mais ce type d’erreurs a été enregistré plus de fois qu’on ne le pense. Il faut absolument l’éviter, car oui, la page sera considérée comme celle à indexer, mais l’url que les spiders choisiront de garder ne sera pas forcément la mieux optimisée.
A lire – Optimisation des URLs pour le référencement, ce qu’il faut savoir
- Mélanger les urls canoniques et les redirections faites :
Si vous avez redirigé la page A vers la page B, assurez-vous que c’est la page B (page de destination de la redirection) qui ait l’url canonique et non pas celle qui a été redirigée. C’est totalement logique, mais parfois on s’emmêle les pinceaux.
Voilà, maintenant que vous savez ce qu’est une url canonique et à quoi elle sert, n’hésitez pas à en utiliser quand cela vous paraît nécessaire.
Laisser un commentaire