Dans cet article, nous allons présenter brièvement toutes les formes courantes de spam présentent dans la recherche Google et contre lesquelles Google essayent de lutter.
Des infractions répétées au règlement peuvent amener à une restriction ou à une suppression de certaines options d’affichage dans les résultats de recherche.
Techniques de dissimulation (cloaking)
Le « cloaking » c’est lorsque vous présentez aux utilisateurs de votre site un contenu différent de celui que vous présentez aux moteurs de recherche, dans le seul but de manipuler les algorithmes de Google.
C’est pourquoi le recours au Javascript par exemple peut s’apparenter a du cloaking s’il est mal paramétré.
C’est parfois une technique qu’utilisent les hackers lorsqu’ils piratent votre site.
Bien sûr, un site avec un paywall par exemple comme on en trouve sur les sites d’informations, pour restreindre le contenu accessible et inciter à l’abonnement, n’est pas considéré comme du cloaking.
Satellites
Créer des pages ou des sites dans le seul but d’améliorer son classement dans les résultats de recherche pour certaines requêtes.
Utilisation abusive d’un domaine arrivé à expiration
Acheter un nom de domaine arrivé à expiration et l’utiliser pour héberger des contenus sans valeur ajoutée pour l’utilisateur dans le seul but de manipuler le classement dans la recherche Google.
Contenu piraté
Tout contenu non autorisé sur un site web présentant des failles de sécurité : injection de code, injection de page, injection de contenu, des redirections.
Texte et liens cachés
Texte ou liens cachés volontairement aux utilisateurs sur une page dans le but de manipuler les moteurs de recherche selon Google :
- Texte blanc sur fond blanc
- Texte caché derrière une image
- Code CSS utilisé pour positionner du texte en dehors de l’écran
- Taille de police ou opacité définie sur 0
- Lien appliqué à un seul caractère de petite taille (par exemple, un trait d’union au milieu d’un paragraphe) afin de le rendre le moins visible possible
Accumulation de mots clés
Manipuler les algorithmes de Google en remplissant une page Web de mots clés ou de chiffres. Faire des listes sans intérêt, citées plusieurs fois une localisation précise ou encore répéter fréquemment les mêmes mots ou expressions.
Liens toxiques
Cette partie sera détaillée dans un prochain article.
Trafic généré automatiquement
L’envoi de requêtes automatiques à Google ou encore le scraping des résultats de recherche pour vérifier les classements des résultats de recherche sont interdits sans autorisation à cause notamment de la consommation de ressources que ces demandes entraînent.
Logiciels et comportements malveillants
Des logiciels malveillants ou indésirables pouvant nuire à l’expérience utilisateur.
Fonctionnalités trompeuses
Sites proposant des services ou des contenus trompeurs pour les utilisateurs.
Utilisation abusive de contenu à grande échelle
Générer de grandes quantités de contenus non originaux et sans valeur ajoutée pour les utilisateurs.
Contenu détourné
Recopier et republier du contenu provenant d’autres sites sans y ajouter de contenu original, de valeur ou la source d’origine. Une simple agrégation de photos ou vidéos provenant d’autres sites.
À noter : un site peut être rétrogradé si un grand nombre de demandes de suppression légales et valides ont été reçues.
Redirections trompeuses
Les redirections visant à tromper les internautes ou les moteurs de recherche.
Utilisation abusive de la réputation d’un site
Lorsqu’un site héberge des pages sponsorisées, publicitaires, de partenaires ou de tiers sans intérêt pour les utilisateurs et dans le but de manipuler le classement des résultats de recherche.
Cela n’inclut pas les publications d’actualités.
Pages de site affilié sans valeur ajoutée
La reproduction d’une page produit depuis le site du marchand d’origine sans valeur ajoutée pour l’utilisateur.
Selon Google, les « bons » sites affiliés apportent une valeur ajoutée en proposant du contenu ou des fonctionnalités utiles (par exemple, des informations supplémentaires sur les prix, des avis sur des produits originaux, des notes et des tests rigoureux, la possibilité de parcourir les produits ou catégories, ainsi que des comparaisons de produits).
Spam généré par l’utilisateur
Il est possible sur certains sites web qu’un utilisateur puisse produire du contenu, cependant le spam généré par des utilisateurs est un contenu indésirable.
Suppression de contenu pour des raisons juridiques
En cas de diffamation, d’articles de contrefaçon, de suppressions sur ordonnance du tribunal, de contenus d’abus sexuels sur mineurs ou encore d’atteinte aux droits d’auteur, le contenu est supprimé ou rétrogradé ainsi que d’autres contenus similaires présents sur le site.
Suppression d’informations personnelles
Les sites peuvent être rétrogradés s’ils divulguent des données personnelles ou encore des images explicites non consenties et qu’ils vous demandent de l’argent pour retirer le contenu.
Escroqueries et fraudes
L’usurpation d’identité d’une entreprise ou d’un service officiel par le biais de sites frauduleux.
Google a besoin de vous !
Afin d’améliorer ses systèmes de détection du spam, Google vous incite à signaler
- toutes les pages web trompeuses, de mauvaise qualité ou contenant du spam : https://search.google.com/search-console/report-spam?hl=fr
- tous les logiciels malveillants : https://www.google.com/safebrowsing/report_badware/?hl=fr
- toutes les tentatives d’hameçonnage : https://safebrowsing.google.com/safebrowsing/report_phish/?hl=fr
Merci pour la lecture de cet article 😊