Vérifier la prise en compte de vos balises canoniques

La balise <link rel= »canonical »… > est devenue la solution la plus employée pour résoudre les problèmes de duplicate content sur les sites. Si votre site contient des doublons, vous pouvez grâce à cette balise faire pointer vos pages inutiles vers la version canonique de la page, et Google (comme les autres moteurs qui supportent cette balise) comprendra qu’il faut indexer la version canonique de la page.

Vous trouverez toutes les explications nécessaires sur l’implémentation de cette balise ici :

https://developers.google.com/search/docs/advanced/crawling/consolidate-duplicate-urls

La balise canonical suggère une canonicalisation, ce n’est pas une directive

Mais attention : depuis sa création, cette balise a été présentée comme « a hint », un indice que vous fournissez à Google sur la bonne façon de canonicaliser les urls. Cela signifie que Google se servira de l’information, au même titre que d’autres indices : par exemple, les syntaxes d’urls dans vos sitemaps.

Mais dans certains cas, Google ignore votre balise <link rel= »canonical »… >. Superbement. Comme ça. Sans vergogne… Ils s’en fichent, font autre chose.

Bref, Google ne respecte pas toujours vos belles canonicals.

Parfois, en cherchant bien on trouve la raison :

  • Les pages sont trop différentes
  • La page canonicalisée se charge plus vite que la version canonique
  • Les indices sont contradictoires…
  • Vous avez mélangé hreflang et canonical (le résultat est aléatoire…)
  • etc.

Parfois, c’est plus mystérieux…

Comment tester si Google respecte vos canonicals…

Et bien c’est simple : il suffit de tester la présence dans l’index de la version canonicalisée, en copiant/collant l’url dans la barre de recherche :

  • s’il n’y a pas de résultats : et bien c’est bon. Google respecte bien la balise canonical
  • s’il y’a des résultats : euh… non !

Exemple : sur un site ecommerce que je connais bien, le paramètre ?type=model n’ajoute pas grand chose (en fait rien du tout) aux pages catégories. Mais les urls avec ce paramètre se trouvent dans les liens affichés sur le site. Donc Google les crawle… Et les indexe.

Pourtant, le développeur du site a placé une canonical pointant vers la version sans paramètre « model= ». Mais… ça marche sur certaines urls, mais pas sur toutes !

Vous pouvez aussi utiliser l’inspection d’url dans la Google Search Console, vous obtiendrez l’information sur l’url canonique proposée par Google.

Conclusion : même si les balises <link rel= »canonical » …> sont la solution la plus employée pour résoudre les problèmes de Duplicate Content, cette solution n’est pas parfaite et pas toujours la plus appropriée.

En tout cas, avant de crier « Victoire, j’ai éliminé tous mes doublons d’urls… », vérifiez que c’est bien vrai.

Laisser un commentaire