A la fin du mois d’août, Google a discrètement approché plusieurs influenceurs anglo-saxons de la sphère SEO pour leur présenter en avant-première les caractéristiques d’une mise à jour de leur algorithme de classement.
Cette mise à jour, Google l’a affublée du nom de « helpful content update » (mise à jour contenu utile). Elle a été officiellement annoncée le 18 août par Danny Sullivan dans ce billet du blog « The Keyword » :
https://blog.google/products/search/more-content-by-people-for-people-in-search/
Ce billet donne peu d’informations techniques ou pratiques sur la mise à jour.
Par contre il précise bien les objectifs de la HCU : éliminer de la tête des résultats les sites comportant des contenus conçus plus pour se positionner dans les moteurs de recherche que pour répondre à des besoins de « vrais » utilisateurs humains.
Dans le même temps, un autre billet publié sur le blog destiné aux développeurs donne beaucoup plus de détails :
https://developers.google.com/search/blog/2022/08/helpful-content-update?hl=en
Une mise à jour majeure ?
Cette mise à jour est déployée depuis le 25 août sur les versions en langue anglaise de Google. Le déploiement complet devrait prendre deux semaines. Ce déploiement très progressif ne produit pas de gros pics de changements dans les outils de type « baromètres des SERPs » car ils se focalisent sur les changements d’un jour à l’autre.
Par contre, les changements cumulés commencent d’ores et déjà à produire des mouvements notables sur certaines requêtes, et on remarque des chutes brutales de visibilité sur les sites qui sont déjà impactés !
Pour l’instant, ce filtre n’impacte que les contenus en langue anglaise. Il sera étendu à d’autres langues plus tard, mais Google n’a communiqué aucun calendrier sur cette prochaine étape.
Il est trop tôt pour dire quelle proportion de sites seront impactés, et à quel degré.
Mais Google, sans donner de chiffres, présente HCU comme une mise à jour majeure, et il faut probablement prendre ce changement beaucoup plus au sérieux que, par exemple, la Page Experience Update.
Un filtre, avec de nombreux points communs avec Panda, mais aussi des différences notables…
HCU présente plusieurs points communs avec le filtre Panda déployé il y’a plus de onze ans, en 2011.
D’abord il s’agit d’un filtre. Rappelons-ici que pour fabriquer sa page de résultats, un moteur de recherche utilise une fonction d’évaluation de la pertinence d’une page sur une requête pour déterminer un score qui permet d’ordonner les résultats par ordre décroissant de pertinence. C’est ce que Google appelle le « cœur » (core) de son algorithme. HCU n’est donc pas techniquement une modification du cœur de l’algorithme.
La liste des résultats produite par le cœur de l’algorithme est ensuite « filtrée » par des systèmes qui identifient des résultats qui ne devraient pas figurer en tête de classement, soit pour ajouter plus de fraicheur, de diversité ou simplement pour éliminer du spam.
HCU est clairement un filtre, tel qu’il est présenté par Google.
Comme avec Panda, le filtre agit sur la visibilité d’un domaine entier. Si votre site contient beaucoup de contenu ciblé par HCU, même le contenu qui serait OK sera impacté. Et vous ne vous en tirerez pas en créant des sous domaines pour isoler votre contenu « à problème ». Ce qui nous ramène 11 ans en arrière, où cette tactique a été souvent tentée, avec les résultats que l’on connait.
Panda et HCU reposent tous les deux sur du machine-learning semi supervisé.
En clair, cela signifie que pour identifier les sites à retirer de la tête des classements, HCU reproduit à partir des indicateurs stockés dans son index les décisions que des humains ont pris sur un échantillon de requêtes et de sites.
Dans les deux cas (pour Panda et HCU) Google a communiqué une liste de questions qui sont probablement celles qui ont permis de « cadrer » les choix des humains chargés d’identifier les contenus utiles ou non.
Ensuite, les objectifs de Panda et de HCU sont assez similaires. Mais 11 ans se sont écoulés, les techniques employées sont probablement très différentes, et les pages ciblées ne se ressemblent pas. Il serait d’ailleurs logique que HCU complète Panda, et ne le remplace pas.
Quelques grosses différences avec Panda :
Dans le même temps, HCU présente quelques différences notable avec Panda : le classifieur est pondéré, ce qui signifie que le filtre ne fonctionne pas en mode tout ou rien. Plus votre site contient de contenu problématique, plus l’impact pour votre domaine sera fort.
Oui, mais c’est quoi le « helpful content »
Pour comprendre les pages (et les sites qui les contiennent) que Google cherchent à éliminer, le mieux est d’examiner les listes de questions qui ont été publiées dans le post du blog pour développeurs.
En voici une traduction :
Privilégier le contenu ciblant des personnes réelles
La mise à jour « contenu utile » vise à mieux récompenser le contenu dont la lecture donne aux visiteurs le sentiment d’avoir vécu une expérience satisfaisante, tandis que le contenu qui ne répond pas aux attentes des visiteurs performera moins bien.
Comment pouvez-vous vous assurer que vous créez du contenu qui aura du succès avec notre nouvelle mise à jour ? En suivant nos conseils et directives de longue date, qui consistent à créer du contenu pour les gens, et non pour les moteurs de recherche. Les créateurs de contenu « People-first » se concentrent d’abord sur la création d’un contenu satisfaisant, tout en utilisant les meilleures pratiques de référencement pour apporter une valeur ajoutée aux chercheurs. Si vous répondez par l’affirmative aux questions ci-dessous, vous êtes probablement sur la bonne voie avec une approche axée sur les personnes :
- Avez-vous un public cible existant ou prévu pour votre entreprise ou votre site qui trouverait le contenu utile s’il venait directement à vous ?
- Votre contenu démontre-t-il clairement une expertise de première main et une connaissance approfondie (par exemple, l’expertise qui découle de l’utilisation d’un produit ou d’un service, ou de la visite d’un lieu) ?
- Votre site a-t-il un but ou un objectif principal ?
- Après avoir lu votre contenu, le lecteur aura-t-il le sentiment d’en avoir appris suffisamment sur un sujet pour l’aider à atteindre son objectif ?
- Le lecteur de votre contenu aura-t-il le sentiment d’avoir vécu une expérience satisfaisante ?
- Gardez-vous à l’esprit nos conseils pour les mises à jour de base et les évaluations de produits ?
- Évitez de créer du contenu destiné d’abord aux moteurs de recherche
Notre conseil d’adopter une approche centrée sur les personnes n’exclut pas le respect des meilleures pratiques de référencement, telles que celles décrites dans le guide de référencement de Google. Le référencement est une activité utile lorsqu’il est appliqué à un contenu destiné à de vraies personnes. Cependant, le contenu créé principalement pour le trafic des moteurs de recherche est fortement corrélé au contenu que les chercheurs trouvent insatisfaisant.
Évitez de créer du contenu destiné d’abord aux moteurs de recherche
Comment éviter d’adopter une approche centrée sur les moteurs de recherche ? Si vous répondez par l’affirmative à certaines ou à toutes ces questions, vous devez réévaluer la manière dont vous créez le contenu de votre site :
- Le contenu est-il principalement destiné à attirer les internautes à partir des moteurs de recherche, plutôt que d’être conçu pour les humains ?
- Produisez-vous beaucoup de contenu sur différents sujets dans l’espoir que certains d’entre eux soient performants dans les résultats de recherche ?
- Utilisez-vous une automatisation poussée pour produire du contenu sur de nombreux sujets ?
- Résumez-vous principalement ce que les autres ont à dire sans y ajouter beaucoup de valeur ?
- Écrivez-vous sur des sujets simplement parce qu’ils semblent être à la mode et non parce que vous écririez sur eux autrement pour votre public existant ?
- Votre contenu donne-t-il aux lecteurs l’impression qu’ils doivent chercher à nouveau pour obtenir de meilleures informations auprès d’autres sources ?
- Etes-vous en train d’écrire en respectant un nombre de mots particulier parce que vous avez entendu ou lu que Google a un nombre de mots préférés (non, ce n’est pas le cas) ?
- Avez-vous décidé d’entrer dans un domaine de niche sans réelle expertise, mais surtout parce que vous pensiez obtenir du trafic de recherche ?
- Votre contenu promet-il de répondre à une question qui n’a en fait pas de réponse, par exemple en suggérant qu’il existe une date de sortie pour un produit, un film ou une émission de télévision alors qu’elle n’est pas confirmée ?
Comment préparer son site pour la HCU ?
Déjà, précisons que si le déploiement sur les index francophones de Google ont lieu dans quelques semaines, il est probablement déjà trop tard pour agir. Calculer les scores pour un tel filtre pour des dizaines de milliards de page prend probablement des semaines.
Si vous avez suivi nos conseils depuis un an (je vous invite en particulier à revoir notre webinar sur les « topical clusters ») vous devriez être dans les clous. Mais si vous avez continué à produire du contenu pour les moteurs comme on le faisait déjà il y’a dix ans post Panda, cela risque de faire mal.
Dans ce cas, la meilleure façon pour récupérer une partie de votre visibilité sera de supprimer le contenu incriminé (cela signifiera renvoyer une erreur 404 sur ces urls). Placer le contenu de mauvaise qualité en noindex fonctionnera aussi, car le classifieur est apparemment conçu pour prendre en compte le contenu indexable et Google ne s’intéresse pour l’instant qu’à la Search eXperience. Mais est-ce que montrer ces contenus faits pour les moteurs de recherche aux utilisateurs et pas aux moteurs a du sens ? Est-ce que c’est durable ? Certainement pas.
Est-ce qu’il y’aura d’autres mises à jour comme la HCU ?
Google l’a déjà annoncé, ils sont susceptibles de lancer régulièrement (mais on ne sait pas à quels intervalles) des mises à jour de la HCU.
Notons que le risque est grand que lors de la première mouture de la HCU, il y’ait des effets de bord non désirés et des tas de « faux positifs ».
C’est le problème avec le machine learning semi supervisé : si les données d’entrainement sont trop réduites ou inadéquates, le classifieur mal entrainé peut prendre des décisions erronées. En plus la méthode a ses limites, car en se basant sur des critères et des informations différentes de celles réellement utilisées par les humains, les premières tentatives peuvent aboutir à des décisions étranges…
Par ailleurs, Google a déjà annoncé qu’ils avaient intégré dans leur système la prise en compte d’un délai de « mise à l’épreuve ». Si vous changez vos pages aujourd’hui, ce changement ne produira aucun effet avant plusieurs mois !
Ce que cherche à éviter Google, ce sont des tentatives de remise en ligne des contenus à problème une fois sortis du filtre HCU !
Est-ce que cela change les bonnes pratiques en matière de création de contenu ?
La HCU est de nature à changer radicalement les bonnes pratiques en matière de création de contenu pour le SEO.
Par contre, chez Neper, il est probable que les conseils que nous délivrons depuis deux ans seront encore conformes et utiles après la mise à jour HCU.
Mais on manque encore de recul pour pouvoir délivrer des conseils précis.
En attendant, l’examen des questions fournies pour identifier les contenus conformes montre que cela sonne peut-être définitivement le glas de certaines pratiques de production de contenu pour le SEO encore très répandues en 2022…