Définition de Scraper :
Le terme de Scraper est synonyme de copier un contenu depuis un autre site web pour l’utiliser sur sa propre source d’informations ou à des fins de traitement interne. Parfois assimilé à du pillage, le scrap sert souvent dans des stratégies de Black Hat SEO. Mais pas que.
Il est souvent important, voire indispensable pour certains traitements, d’obtenir des informations contenues sur d’autres sites Web de la Toile. C’est là que les techniques de scrap (ou scraping) interviennent…
SI vous avez besoin de récupérer des contenus (texte, image, etc.) depuis le Web pour vos besoins personnels (traitement interne, outil, site web perso, etc.), il y a de fortes chances que vous ayez recours un jour ou l’autre à des outils de scrap (ou scraping). Le fait de scraper le Web signifie que vous allez copier/coller, de façon automatisée, le contenu d’autres sites pour en récupérer un certain nombre d’informations. Bref, vous « aspirez » des contenus appartenant à autrui pour vos besoins personnels.
Le scrap est souvent assimilé à du spam ou à des pratiques illégales, et donc à du vol de contenu. Cela peut effectivement être le cas dans de nombreux cas. Mais il peut également s’agir de travailler dans ce sens de façon modérée et sans aucune volonté de nuire à autrui. D’ailleurs, Google n’est-il pas le plus gros scrapeur de la planète, en récupérant le code HTML de milliards de pages web pour garnir son index et son moteur de recherche ?
En termes de SEO, l’une des applications les plus courantes est de scraper les SERP des moteurs afin de récupérer les positionnements d’un site web pour une requête donnée. Mais ce n’est pas la seule, loin de là…
Il existe de nombreux outils de scrap sur le marché. Citons notamment ScrapeBox, Rddz Scraper ou Screaming Frog Web Scraping.
Un exemple d’outil de scrap : RDDZ Scraper. |
Voici également quelques liens pour aller plus loin sur le sujet :
- Toi aussi, scrape avec Excel ! (Cédric Guérin)
- Scrapez facilement avec Scraper pour Chrome (Sébastien Billard)
- Comment récupérer (scraper) les résultats Google pour une requête donnée ? (tuto) (Abondance)
Ah ah ah ah ! Merci d’avoir mis Google au rang de 1er scrapper de la planète.
C’est tellement vrai et tellement nécessaire de le dire.
On peut traduire ici que tous les moteurs de recherche scrap l’ensemble de nos sites internet pour récupérer des données et nous les ressortir en fonction des requêtes données ?
Court, simple et clair, merci pour cet article 😉