La balise canonical vient du terme “canon”, qui désigne un ensemble de règles normatives (par exemple : les “canons” de beauté). Dans le cadre informatique, l’adjectif “canonique” renvoie au contenu original dont sont issues des versions dupliquées. Dans tous les cas, il s’agit d’un modèle, d’un repère initial.

La balise canonique est donc un marquage html permettant d’indiquer aux bots des moteurs de recherche une URL de référence pour un contenu original. Plus concrètement, il s’agit d’une protection contre le duplicate content.

Balise canonical et duplicate content

En effet, quand l’algorithme perçoit deux contenus identiques, il cherche à trouver la version canonique, afin de la positionner beaucoup plus haut que la copie. D’ordinaire, il s’aide de la date du premier crawl (le contenu le plus ancien est rarement une copie), mais également du PageRank. En effet, cet indicateur inclut la qualité des liens qui pointent vers les pages à vérifier : il en déduit le degré d’autorité, ce qui l’aide à trancher.

Toutefois, il n’est pas à l’abri d’une erreur ; c’est donc là qu’intervient la balise canonical.

C’est quoi du contenu dupliqué ?

Il en existe plusieurs sortes :

  • le plagiat externe, quand un contenu est copié pour apparaître tel quel sur une autre page web ;
  • la duplication interne, lorsque vous placez un ou plusieurs paragraphes identiques sur différentes pages du même domaine, de manière volontaire ou non ;
  • le dust, à savoir l’existence de plusieurs URL pour arriver à la même page web (que Google peut prendre pour du duplicate content).

Pour le plagiat externe, les seules solutions sont de ne pas en produire soi-même, et de contacter rapidement tout webmaster qui se serait approprié votre travail. Pour le reste, vous pouvez avoir recours à une balise canonique.

Nota Bene : dans le cas d’une refonte de site ou d’un changement de domaine, on utilise les redirections 301, qui permettent de faire passer directement l’utilisateur d’une URL à une autre, de sorte que Google ne perçoive pas les contenus comme étant dupliqués.

Objectifs SEO de la balise canonical

Si les algorithmes de Google croient que votre site a dupliqué des contenus (y compris les vôtres), ils risquent de déclasser vos pages dans les SERPs, estimant qu’elles sont de faible qualité. Voyons, pour illustrer, deux cas de figure assez courants…

Le Dust, c’est quoi ?

C’est quand plusieurs URLs pointent vers le même code source, autrement dit la même page web. Prenons une page d’accueil (totalement au hasard), dont l’adresse serait la suivante : https://www.uplix.fr/. Il est tout à fait possible de l’atteindre avec des variations d’URL, comme :

– http://www.uplix.fr

– http://uplix.fr/

– https://www.uplix.fr/index.php

– http://www.uplix.fr/index.php?source=emailing

– etc.

Et ce à l’infini, ne serait-ce que parce que quand un autre site utilise un lien qui pointe vers votre page (les fameux backlinks), il peut donner une variation de l’adresse principale de redirection. La balise canonique met donc fin à tous les débats, et demande aux robots de traiter toutes les URL pointant vers votre page comme l’originale.

Sites d’e-commerce et auto-plagiat

Les boutiques en e-commerce se présentent souvent sous forme de catalogue numérique, ce qui peut amener, outre le phénomène de “dust” à laisser plusieurs pages arborer les mêmes contenus. Par exemple, la même description de produit apparaîtra sur deux pages présentant une variation du coloris de l’objet, ou des options supplémentaires.

Exemple site e-commerce balise canonical duplicate content

Autre possibilité : un même produit est vendu avec la même description sur deux sites régionaux (ou nationaux) de la même enseigne. Encore une fois, la balise canonique constitue la solution idéale pour éviter un problème de ranking.

Comment utiliser une balise canonique ?

La balise canonique se situe dans la section head ou dans l’en-tête HTTP des pages concernées.

Comme il s’agit d’un point important en SEO, des CMS tels que WordPress créent la balise canonical automatiquement, sans que vous ayez à vous en soucier, grâce à des extensions comme Yoast.

Balise canonical Yoast SEO

Mais dans le cas où vous auriez besoin de procéder manuellement, il existe plusieurs techniques assez faciles à maîtriser.

Via la Search Console

Si vous possédez plusieurs domaines avec des contenus identiques, comme un site régional ou national sur lesquels certaines informations de base ne doivent pas trop varier, sous peine de perdre l’utilisateur, allez directement dans la Search Console afin d’indiquer au moteur de recherche le domaine de référence. Une méthode rapide et efficace !

Directement dans la section head

Reprenons l’exemple https://www.uplix.fr/. Il suffit d’ajouter le tag “rel=canonical” dans la section head de toutes les pages incluant du contenu dupliqué, mais également dans le code source de la page que vous avez désignée comme étant canonique. Ainsi, les crawlers se réfèreront directement à l’URL désignée de la manière suivante :

<head>

<link rel= »canonical » href= »https://www.uplix.fr/ »>

<head>

En gros, toutes les pages de votre site web doivent contenir une balise canonical. Seul inconvénient de cette méthode : le tag “link” ajoute des méta données à toutes les pages concernées, ce qui peut les alourdir et ralentir leur chargement.

Page speed uplix balise canonique

Ainsi, pour être certain ou certaine de ne pas rencontrer de problèmes, utilisez Google PageSpeed Insights pour vérifier les temps de chargement, ou faites un audit SEO.

Erreurs à ne pas commettre avec la balise canonique

Il existe plein de manières de mal utiliser les balises canonical. Voici, rapidement tout ce qu’il ne faut pas faire :

– ne pas utiliser les URLs absolues quand elles existent (liens qui incluent des catégories) ;

– placer plusieurs tags canonical sur une même page (Google les ignorera) ;

– mettre des pages non canoniques dans votre sitemap ;

– faire cohabiter un tag canonical et une balise “noindex” (cela n’a de sens ni sur du contenu orignal ni sur des copies) ;

– insérer un tag canonical dans des contenus différents ;

– insérer la balise canonique dans la partie “body” au lieu du “head”.

Enfin, pour un contenu sémantiquement identique mais dans une langue différente, utilisez plutôt une balise Hreflang.

Pour finir…

La balise canonical est assez simple à comprendre et à mettre en place. Elle vous aidera principalement sur des sites assez volumineux, plus sujets aux contenus dupliqués. En outre, vous redonnez toute leur valeur aux backlinks de qualité en supprimant l’effet dust, car Google saura reconnaître l’URL vers laquelle doit aller tout le linkjuice.