J’ai souvent des questions sur les « byline dates », les dates qui s’affichent dans les blocs de résultats sur Google Search.
En général, les propriétaires de sites sont perturbés par différentes situations, qui montrent que la gestion des bonnes dates de publication par Google est mal connue, et parfois… cahotique.
Les principales questions posées sont les suivantes :
- pourquoi est-ce que, pour la même url, parfois la « byline date » s’affiche, et parfois non ?
- pourquoi est-ce que ma page n’a pas de date de publication, alors que mes concurrents en ont une ?
- pourquoi est-ce que la date de publication affichée est fantaisiste
Nous allons essayer de répondre à toutes ces questions et vous expliquer comment améliorer la situation si Google n’arrive pas à associer une date de publication correcte à vos contenus.
Pourquoi la date de publication apparait dans certaines SERPs mais pas d’autres ?
Pour commencer, rappelons que Google n’affiche une « byline date » que dans les cas d’usage où l’affichage de cette information apporte un élément utile pour les utilisateurs.
Si vous cherchez une information liée à l’actualité par exemple, Google va automatiquement détecter cette intention de recherche et modifier la page de résultats pour faire apparaître en priorité des contenus récents. Et au passage, sur ce type de requêtes (appelées QDF en jargon Google, Query Deserves Freshness), la date de publication apparaîtra sur tous les contenus où elle sera disponible…
Donc si la date de publication apparait sur certaines requêtes et pas d’autre, ce n’est pas un bug mais une fonctionnalité. Google choisit ou non d’afficher cette info en fonction de l’intention de recherche.
Comment Google détermine la date de publication ?
La « byline date » est la date de publication estimée par Google. Mais le processus de collecte de cette information n’est pas fiable à 100%, surtout si vous ne faites rien pour faciliter la tâche de Google
Google essaie donc de déterminer une date d’après toutes les informations disponibles.
Techniquement, Google a accès à plusieurs informations sur les dates, qui ne sont pas toujours dignes de confiance :
- la date de première découverte du contenu par Googlebot => Attention ce n’est pas la date de première publication, qui est forcément antérieure à la première exploration
- les dates de mise à jour du contenu découvertes par Googlebot (mais même problème que pour les dates de publication)
- la date du fichier indiquée dans l’entête http => Problème, cette date est difficile à interpréter : est-ce la date de dernière génération du fichier, la date de dernière mise à jour du contenu, ou la date de création du document ?
- une ou plusieurs dates disponibles dans le code HTML => Ok, mais qu’elle est la date utile ?
Ce que Google cherche à identifier pour l’utiliser, c’est la date de dernière mise à jour d’un contenu. Et là encore, attention à la notion de « mise à jour » : une modification de détail n’est pas censée être une mise à jour.
En pratique, Google analyse ces différentes informations, et en déduit (ou non) une byline date cohérente.
Comment faire en sorte que Google prenne bien en compte mes dates de publication ?
Si vous voulez que Google affiche correctement une « byline date » qui correspond à vos dates de dernière mise à jour, vous devez
- soit respecter des formats facilement identifiables comme des contenus de type date de publication
- soit utiliser des données structurées
Combiner les deux solutions est possible, par contre assurez-vous bien que la version en données structurées soit cohérente avec la version affichée sur la page. Sinon le résultat sera imprévisible.
La solution de l’affichage simple en HTML
Quels formats sont compris par Google ?
En français, il suffit de présenter les dates comme ceci dans le contenu de la page:
- Publié le 4 février 2019
- Date de publication : 4 février 2019
- Dernière mise à jour : 14 février 2018
- Mise à jour le 14 février 2019 à 20h GMT+2
Il y’a d’autres formats qui passent, mais ceux là fonctionnent de manière officielle. Il n’y a pas besoin d’un balisage spécial.
Le format des dates sur notre blog ne suivait pas exactement cette recommandation. Passer à un format moins ambigu a permis d’afficher les dates de publication dans les SERPs.
Exemple de code HTML :
<html>
<head>
<title>Mon article sur une actualité brûlante</title>
</head>
<body>
<p>
Publié le 4 janvier 2023
</p>
<p>
Le secrétaire d'état en charge de l'économie numérique a déclaré que le projet de taxe sur les revenus des GAFAM était à nouveau à l'étude
</p>
</body>
</html>
Lorque vous affichez une date dans le contenu HTML (sans données structurées), préciser l’heure est inutile.
Par contre si vous affichez une heure, ajoutez toujours le fuseau horaire (GMT+2 dans l’exemple ci-dessus). Sans fuseau horaire, l’information sur l’heure sera ignorée. Avec le fuseau horaire, l’heure de publication permet à Google de corriger la date en cas de décalage horaire important. Prenez garde alors à ce que votre script de génération de date tienne bien compte des bascules heures d’été <-> heures d’hiver.
Avec la méthode HTML (sans données structurées), il est déconseillé d’avoir d’autres dates sur la page. Si tel est le cas, modifiez vos templates pour éviter que Google prenne ces autres dates pour une date de publication.
Encodage des dates avec des données structurées
Si vous utilisez un encodage en données structurées, il faudra indiquer l’heure et le fuseau horaire impérativement.
Les balisages à utiliser sont les sous-types de Creative Work : Article, BlogPost, et Videobject.
Les balises à renseigner sont DatePublished, et/ou DateModified.
La date et l’heure doivent respecter la syntaxe standard fixée par la norme ISO 8601 (« 2023-01-04T09:00:00+02:00 » qui correspond en clair à 4 janvier 2023 à 9h00 GMT+2)
<html>
<head>
<title>Mon article sur une actualité brûlante</title>
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "NewsArticle",
"headline": "Mon article sur une actualité brûlante",
"datePublished": "2023-01-04T09:00:00+02:00",
"dateModified": "2023-01-05T09:20:00+02:00"
}
</script>
</head>
<body>
<p>
Dernière mise à jour le 5 janvier 2023 à 9h20 GMT+2
</p>
<p>
Le secrétaire d'état en charge de l'économie numérique a déclaré que le projet de taxe sur les revenus des GAFAM était à nouveau à l'étude
</p>
</body>
</html>
Remarque : les deux balises datePublished et dateModified sont utilisées ici, et ces données sont cohérentes avec les infos affichées dans le HTML, même si une seule date est mentionnée.
L’erreur serait d’afficher quelque chose comme : Publié le 5 janvier 2023, ce qui conduira Google à douter de la validité de l’information poussée, et provoquera des résultats imprévisibles sur l’information affichée.
A ne pas faire
Outre le respect des consignes ci-dessus, il y’a d’autres erreurs à éviter :
Attention à ne pas afficher de dates dans le futur => les dates de publication peuvent disparaître, ou Google peut sélectionner des dates erronées. Cela peut arriver si vous rentrez à la main les dates de publication ou de mise à jour.
Si votre contenu parle d’un événement, vous serez forcément amenés à parler de la date de cet événement. Faites attention à éviter toute ambigüité entre date de publication (ou de dernière mise à jour) et date de l’événement. L’endroit le plus « safe » pour ajouter cette date est dans le corps de l’article, en précisant bien la nature de cette date dans le texte. Une solution à adopter en cas de confusion est d’utiliser le balisage de données structurées Evénement, et les champs beginDate et endDate.
Si vous souhaitez que vos dates soient comprises par Google Actualités, les consignes ci-dessus fonctionnent, avec une contrainte supplémentaire : la date de publication doit figurer entre le titre et le corps de l’article.
Ok, j’ai respecté ces consignes à la lettre, mais je n’ai pas de « byline dates ».
Testez d’autres formats ou d’autres solutions (les données structurées étant la solution la plus sûre). Parfois ce qui gêne Google n’est pas forcément évident à trouver au premier coup d’oeil.
Si rien ne fonctionne, le problème est chez Google, pas chez vous.
ATTENTION : ne manipulez pas les dates de publication ou de mises à jour pour améliorer vos classements. Si vous changez la date régulièrement sans que le contenu change, et si c’est détecté par Google, l’impact sur vos classsements sera négatif ! Ce point a été précisé par Gary Illyes en 2017. Dans la plupart des cas, vos byline dates ne seront plus affichées du tout.Goog Dans le pire des cas, vous perdrez des positions sur certaines requêtes.
Même chose si vous cherchez à « cacher » vos dates de publication => c’est une mauvaise idée, qui ne vous aidera pas à avoir un meilleur référencement.
IMPORTANT : Google distingue clairement les notions de contenu « à jour » et contenu « récent » :
- un contenu qui a été publié il y’a un an peut toujours être à jour aujourd’hui. Et rester pertinent pour la plupart des requêtes.
- un contenu récent publié hier peut contenir des informations obsolètes aujourd’hui. Et ne plus être pertinent comme réponse sur des requêtes QDF.
Donc hors requêtes QDF, il n’y a ni avantage ni inconvénient à avoir une date de dernière mise à jour ancienne, y compris face à des contenus concurrents plus récents?
Et la présence ou l’absence d’une byline date n’a pas d’impact direct sur les classements. Mais cela influence parfois le CTR sur les résultats
Conclusion : Aidez Google à déterminer vos dates de publication correctement en respectant les consignes ci-dessus. Ne manipulez cette information. Mettez réellement vos contenus à jour aussi régulièrement que possible (et quand c’est nécessaire uniquement). Et ne surestimez pas l’importance de cette date pour vos classements … C’est juste un « nice to have » (sauf pour Google News).