Depuis quelques jours, un nouveau changement dans l’identification des Soft 404 chez Google provoque des effets de bord inattendus. Plusieurs propriétaires de sites ont remarqué qu’un pic de détection de soft 404 sur leurs sites s’accompagnait d’une baisse sensible du trafic sur leur site. Et Google a confirmé qu’ils s’étaient aperçus qu’il y’avait un souci de leur côté.
Qu’est-ce qu’une soft 404 ?
Si je reprend la définition de Google :
Une erreur "soft 404" renvoie une page informant l'internaute que l'URL qu'il recherche n'existe pas ainsi qu'un code de niveau 2xx (réussite). Dans certains cas, il peut s'agir d'une page avec peu ou pas de contenu (page peu renseignée ou vide, par exemple).
Vous retrouverez cette définition ici :
https://developers.google.com/search/docs/advanced/crawling/soft-404-errors?hl=fr
Donc Google cherche à identifier les cas où une url appelée devrait renvoyer une page 404 mais renvoie 200.
Mais en réalité, Google a tendance a considérer comme « Soft 404 » une grande variété de situations, qui ne sont pas mentionnées dans la définition. Par exemple, si vous redirigez un grand nombre de pages produits indisponibles vers une page de catégorie, il y’a de forte chances que Google se dise : bon en fait, le webmaster aurait du me renvoyer un code 404, mais il ne l’a pas fait, donc je classe cela en soft404.
Le problème, c’est que Google génère des faux positifs depuis qu’il a décidé d’adopter ce comportement. Bref ils tâtonnent, et ce dernier épisode en est une nouvelle illustration.
Pourquoi les soft 404 posent problème en général ?
Si Google a raison de classer vos pages en soft404, il va les traiter comme des pages renvoyant un code 404 ou 410 : il ne va pas les indexer. Et va même arrêter de les crawler au bout d’un (long) moment. Dans ces cas, l’impact pour le SEO est nul. Cela vous indique juste que vous devriez corriger le code de votre site pour que ces urls renvoient bien un code 404, et pas 200.
Si par contre Google se trompe… alors cela tue le référencement de ces urls. Si en plus des redirections sont impliquées, alors la page de destination de ces redirections peut être considérée aussi comme une page devant renvoyer 404 et cette page peut-être également déréférencée.
Qu’est-ce qui s’est passé vers le 9 avril ?
Le 9 avril dernier, Google a encore modifié quelque chose dans son process d’identification des soft404. Et de l’aveu même de John Mueller dans un hangout récent, ce changement a généré des effets de bord inattendus.
Plusieurs webmasters ont noté que certaines des urls les plus importantes de leur site avaient disparu de la tête des classements. Et le seul changement très visible dans la Google Search Console était un pic de soft404.
Google est en train de corriger le problème… Pas de délai communiqué pour le retour à la normale.