Dans les pages de résultats de Google, au milieu des blocs « normaux » figurent parfois des résultats qui montrent non pas un seul lien cliquable, mais plusieurs.
C’est ce Google appelle des « liens sitelink » en français, sitelinks tout court en anglais.
Ces sitelinks ont une apparence très différente selon qu’ils apparaissent en première position, ou plus loin dans la page.
En première position, cela donne ceci :
Plus loin dans la page; cela ressemble à cela :
Ces liens sur une ligne sous le snippet sont parfois appelés deeplinks
Pourquoi ces sitelinks s’affichent sur certains résultats et pas les autres ?
L’affichage de ces liens se déclenche dés que deux conditions sont remplies :
- sur la requête, un domaine ou plusieurs domaines (un host ou plusieurs hosts pour être précis) bénéficient d’un CTR élevé
- et les urls proposées sont parmi les plus cliquées sur cette requête
Oui, voila une utilisation des fameuses données de comportement utilisateurs. Et non les Google Leaks ne nous ont rien appris, ni rien confirmé sur les sitelinks, même si cette fonctionnalité est mentionnée. Cela fait très longtemps que l’on sait comment cela fonctionne, c’était décrit dans un brevet qui date de 2006 ! Et d’autres évolutions sont également décrites dans des brevets ultérieurs datant de 2009. L’utilisation des logs de recherche et des données de comportement utilisateurs a été confirmée par les Googlers à plusieurs reprises.
Les sitelinks à base de « jumplinks »
Les urls figurant dans les sitelinks peuvent être de deux types :
- des urls totalement différentes, pointant vers différentes pages du même site
- des urls pointant toutes vers la même page, mais vers des ancres différentes
Voilà un exemple sur la requête Véolia :
Les liens affichés correspondent tous à des pages différentes
Et voila un autre exemple, où les liens pointent vers des ancres de la même page (requête : « Taggart wikipedia »)
Le premier lien bleu pointe vers cette page :
https://en.wikipedia.org/wiki/List_of_Taggart_episodes
Le lien « Series 6 (1990 » vers
https://en.wikipedia.org/wiki/List_of_Taggart_episodes#Series_6_(1990)
Soit exactement la même page, mais si on clique sur le lien le navigateur ne va pas afficher le haut de la page, il va se caler sur l’ancre appelée par cette url.
Les liens internes pointant vers un emplacement du code html d’une même page sont appelés « jumplinks » en anglais. En français, on parle de « lien vers une ancre ».
Rappelons au passage que la balise <a> s’appelle comme cela en référence au mot « anchor » (ancre). Dans les débuts du web, avec des navigateurs primitifs et des connexions lentes, il était courant d’utiliser des liens pointant vers des ancres de la même page, et c’est ce qui a conduit à sélectionner <a> pour coder le balisage des liens hypertextes.
Comment tracker les clics sur les sitelinks ?
Ce n’est pas toujours possible; sauf dans certains cas particuliers.
Il n’y a pas de filtre pour les sitelinks dans le rapport de performance de la Google Search Console.
Avec les sitelinks classiques, les clics sur tous les liens sont attribués au lien qui apparait en premier sur le snippet. Les autres
Mais il y’a des exceptions : parfois, le rapport contient les urls avec les ancres séparés par « # », et même parfois Google propose des urls mixtes, séparés par des #, composées de l’url apparaissant en haut du snippet + les textes d’ancres des liens figurant en dessous.
Et cela donne ceci :
Dans l’exemple ci-dessus, les « jumplinks » sont inventés par Google : dans le sitelinks, les liens pointaient bien vers des pages différentes. Mais cette fonctionnalité permet d’avoir accès à la ventilation des clics sur les différents liens
Pour faire apparaître ces « variantes » de liens, il suffit de filtrer sur une requête et d’afficher les pages associées à cette requête..
Les « # » dans les rapports GSC correspondent au tracking des sitelinks, pas à des problèmes de canonicalisation
Récemment, John Mueller s’est vu obliger d’intervenir en commentaire d’un post Linkedin. L’auteur du post se demandait si la présence de ces liens étranges avec des fragments séparés par un # étaient « normaux », s’il n’y avait pas un bug chez Google et si cela ne révélait pas un gros problème de canonicalisation.
Sauf que non : si vous voyez des urls avec des # dans les rapports GSC, cela vient de l’affichage de sitelinks quand vos pages apparaissent dans les SERPs et du fait que curieusement, Google stocke parfois ces informations sous cette forme dans ses bases pour la GSC.