Définition de Duplicate Content (Contenu Dupliqué) :
On entend très souvent parler de duplicate content en SEO. Ce concept peut prendre plusieurs formes et est effectivement très important en référencement naturel si on désire optimiser sa visibilité sur Google et les autres moteurs. Explications…
Le Duplicate Content intervient lorsque Google détecte, sur un même site ou sur des sites différents, des contenus identiques ou similaires (on parlera dans ce cas de near duplicate content). Lorsque cela arrive, Google tentera d’identifier le contenu original, dit canonique au travers de deux critères : la date de première découverte et le PageRank de la page. C’est cette page canonique qui sera bien positionnée et qui aura la principale visibilité dans les SERP.
Les contenus dupliqués (les copies) seront la plupart du temps indexés, mais n’auront qu’une très faible visibilité.
Il est à noter que Google ne sanctionne pas – ne pénalise pas – contrairement à une croyance très répandue, les sites faisant du duplicate content (copiant du contenu depuis un autre site). En revanche, ces sites n’auront qu’une visibilité très faible puisqu’ils seront la plupart du temps considérés comme dupliqués.
L’utilisation de la balise « canonical » permet de « forcer » Google à prendre en compte une URL comme canonique plutôt qu’une autre et ainsi à mieux gérer et maîtriser la situation de contenu dupliqué.
Enfin, le DUST est une autre forme de contenu dupliqué, qui se règle également la plupart du temps au travers de la balise « canonical ».
Dernier type de duplicate content : lorsque plusieurs sites, dédiés à plusieurs pays différents mais dans la même langue (exemple : France, Belgique, Suisse et Québec pour la langue française) proposent le même contenu. Dans ce cas, c’est la balise Hreflang qu’il faudra utiliser pour faire tomber les barrières du contenu dupliqué.
Infographie illustrant le phénomène de Duplicate Content en e-commerce. Source : Ineolab |
Voici également quelques liens pour aller plus loin sur le sujet :
- Contenu en double (aide officielle Google)
- Duplicate content : 60% du Web est copié/dupliqué, selon Google
- Le Duplicate Content ne serait pas un critère Panda, selon Google
Et cinq vidéos :
Does translated content cause a duplicate content issue? (Matt Cutts)
Balise Canonical et Duplicate Content.
Le DUST (Duplicate URL, Same Text), c’est quoi ?
Google pénalise-t-il le contenu dupliqué intersites ?
Extraits de Contenus et Duplicate Content
Bonjour, merci pour ce super article avec de belles illustrations !
En effet le problème du contenu dupliqué peut être réglé grâce à diffèrentes solutions, parmies elles la balise canonique. Nous avons étudié le sujet et avons pu faire ressortir des chiffres. L’analyse d’un grand nombre de pages web avec un classement dans Google conduit à des conclusions surprenantes !