Codes d’état HTTP
Les codes d’état HTTP sont des codes renvoyés par un serveur en réponse à une requête demandée par un utilisateur via un navigateur ou un robot d’exploration comme Googlebot.
Chaque code a une signification différente, le code d’état 2xx indique un contenu pouvant être indexé mais ici nous allons nous intéresser aux codes d’état HTTP 4xx.
A noter, les codes d’état HTTP 4xx sont visibles dans la Google Search Console lorsqu’un robot d’exploration de Google reçoit ce type de code d’un serveur.
Codes d’état HTTP 4xx les plus courants rencontrés par Googlebot
400 (bad request) |
401 (unauthorized) |
403 (forbidden) |
404 (not found) |
410 (gone) |
411 (length required) |
429 (too many requests) |
Comment Google traite les codes d’état HTTP 4xx ?
Toutes les erreurs 4xx, sauf l’erreur 429, sont traitées de la même manière : Googlebot déclare à la partie indexation que le contenu n’existe pas, ce contenu est ignoré. Les urls qui renvoient un code 4xx ne peuvent pas être indexées.
Si l’url crawlée fait partie de l’index et qu’elle renvoie un code 4xx, alors cette url sera supprimée de l’index.
A noter, si le code d’état HTTP 4xx ne change pas, la fréquence d’exploration diminue progressivement.
Cas particulier l’erreur 429 : Googlebot traite le code d’état 429
comme un signal indiquant que le serveur est surchargé et donc comme une erreur de serveur.
Merci pour la lecture de cet article 😊