John Mueller, le « Google Search Advocate » basé à Zürich, a donné récemment un conseil très intéressant sur Reddit.
Voici ce qu’il a déclaré
Si vous n’avez pas de site prêt, désactivez les DNS ou créez une page d’attente personnalisée. N’utilisez pas un serveur générique / une page d’attente CMS. Il faut généralement plus de temps pour qu’un site connu pour être parqué / dupliqué soit reconnu comme un site normal que pour qu’un site soit initialement récupéré.
John Mueller, Google Search Avocate sur Reddit :
Voici le lien pour retrouver la source :
Pourquoi ce conseil est important ?
Si on lit entre les lignes, cela signifie que Google se base sur ce genre d’indices pour identifier les sites qui ne sont pas actifs ou parkés. Et que pour ce type de sites, Google va éviter de les crawler souvent, et risque donc de mettre plus de temps avant de les considérer comme des sites intéressants pour son index.
Or, il arrive assez souvent que les équipes techniques oublient d’empêcher les bots de moteurs de recherche d’accéder à ces pages par défaut.
Cela ressemble à ceci pour Apache :
Ou à ceci pour WordPress :
Ou à ceci pour un site hébergé chez Gandi
C’est donc une erreur qui peut coûter des semaines de délai avant le démarrage de l’indexation du site et donc l’obtention d’un début de visibilité SEO (et de trafic).
Que faut-il faire ?
La solution c’est de bien surveiller la mise en service des hébergements, des plateformes et tant que le site est en construction :
- de bloquer l’accès aux bots à tout site miroir de celui qui sera installé sur le domaine définitif (version preprod en sous domaine, sur le domaine de l’ESN/la Webagency/le développeur, sur un domaine « technique » fourni par l’hébergeur etc… Pour cela, le robots.txt est utile, où un blocage par login mot de passe, ou une réponse 403 systématique
- et de créer une page d’attente « site en construction » personnalisée, différente de la page d’accueil par défaut de votre CMS/plateforme/serveur web/hébergement et de la mettre en ligne dès que la version en préprod est disponible.
En pratique, ces pages « en construction » personnalisée répondront plutôt par un code 503 ou 403 qu’un code 200 (donc elles ne sont pas indexables), mais dans tous les cas, il faut que leur contenu les différencie de ces pages par défaut.
En faisant cela, Google détectera un futur site actif, et continuera de crawler la page d’accueil pour tester la présence d’un contenu indexable.