Définition de Content Spinning :
Le Content Spinning, bien qu’interdit par Google, est une technique assez souvent utilisée sur le Web pour réécrire automatiquement des contenus. Explications…
Quiconque a travaillé sur le Web sait qu’il est très complexe de gérer la problématique du duplicate content (contentu dupliqué). Pour éviter le fait de proposer en ligne des contenus trop proches les uns des autres, certains éditeurs ont recours à des outils de Content Spinning. Le principe en est simple : vous donnez en entrée un texte, et en sortie l’outil le réécrit automatiquement en utilisant des synonymes, des termes proches, plusieurs variations d’un mot donné, etc.
En voici un exemple proposé par le site Axenet :
Une {voiture|moto|mobylette} {rouge|bleue|verte|jaune|noire|blanche} a été {retrouvée|perdue|volée} hier {porte de la chapelle|à trifouilly les oies|chez Robert}.
Chaque terme entre crochets peut être utilisé indifféremment pour créer de nombreuses phrases différentes. Quelques exemples pour le cas précédent : Une mobylette noire a été trouvée hier à trifouilly les oies, Une voiture jaune a été perdue hier chez Robert, Une moto blanche a été volée hier porte de la chapelle, etc.
Voici un autre exemple, plus long et plus sophistiqué, toujours proposé par Axenet :
Suivi de {l’avancée|la progression} {en ce qui concerne les|concernant les|pour ce qui est des|relative aux} {implémentations|ajustements|recommandations} techniques et {recettage {avant la mise en ligne{||||| du site}|final|en fin de projet}|mise au point {avant la mise en ligne{||||| du site}|finale|en fin de projet}}|{Reporting régulier|Mise au point {régulière|assurée tout au long de la prestation|continue|ininterrompue|permanente}} en ce qui concerne {la mise en place|l’implémentation} des {recommandations|préconisations} techniques|{Mise en place|Application} des {recommandations|préconisations} techniques {avec |accompagnée d’|incluant } un { {reporting|suivi}|e mise à jour} hebdomadaire.
On obtient ainsi 444 variations du paragraphe avec des phrases allant de 8 à 22 mots en sortie et une moyenne de 16,4 mots.
On pourra débattre longtemps du caractère White hat ou Black hat de ces procédés. Toujours est-il que Google les interdit et les considère comme du spam (voir également lien ci-dessous), ce qui résout quelque peu le problème… 🙂
Il est en tout cas clair que le fait de piller du contenu sur d’autres sites, le réécrire automatiquement pour le reproposer sur son propre site n’est pas une technique des plus fair-plays 🙂 Mais il ne s’agit que d’une des utilisations du content spinning sur le Web…
Exemple d’interface d’un outil de Content Spinning. |
Voici également quelques liens pour aller plus loin sur le sujet :
- Le content spinning (Axenet)
- Contenu détourné (Google)
- Content Spinning et génération automatisée de contenus éditoriaux (Abondance)
- Comment les moteurs de recherche détectent-ils le content spinning ? (Abondance)
Sources des images de l’article : GHS Tool, WebContent Spinning.