Pour que votre page ait une chance d’apparaître dans les résultats de recherche de Google, elle doit respecter certaines exigences techniques fondamentales. Google préconise trois points en particulier :
- 1. Googlebot ne doit pas être bloqué
Les robots d’exploration de Google (les bots), doivent pouvoir accéder au contenu de la page. Google n’indexe que les pages Web qui lui sont accessibles.
- 2. Google doit recevoir un code d’état HTTP 200 (success), la page doit être valide
La page n’affiche pas un code erreur de la part du client ou du serveur. L’outil d’inspection d’URL disponible dans la Google Search Console vous permet de déterminer si une page de votre site peut être indexée. Pour en savoir plus, vous pouvez consulter cette page d’aide : https://support.google.com/webmasters/answer/9012289?hl=fr
- 3. La page doit posséder un contenu pouvant être indexé
Le contenu doit être référencé dans l’un des types de fichiers indexables par Google. Le contenu ne doit pas être considéré par Google comme étant du spam. Nous vous présenterons les formes courantes de spam interdites par Google lors d’un prochain article…
Bonus :
Attention, même si une page remplit l’ensemble de ces conditions, cela ne garantit pas son indexation par Google.
Bloquer une ou plusieurs pages à Googlebot par l’intermédiaire du fichier robots.txt ne garantit pas à 100% que ces urls ne figurent pas dans les résultats de recherche de Google.
Pour empêcher l’indexation d’une page par Google, le mieux est d’utiliser la balise noindex et d’autoriser Google à explorer l’URL.
Merci pour la lecture de cet article 😊