1min30 > Aspirateur de site web
2014
13/Avr

Aspirateur de site web

Définition

Un aspirateur de site est un logiciel qui “aspire” les données d’un site web public en les téléchargeant sur un support de stockage (disque dur, clef usb, etc.).

Objectifs d’un aspirateur de site

Il peut y avoir plusieurs raisons d’utiliser un aspirateur de site web :

Sauvegarder les données d’un site web

Il existe de nombreuses méthodes pour sauvegarder les données d’un site web “ami” (c’est à dire un site web dont on ne veut pas “voler” les données). La plus directe consiste à utiliser un client FTP. Cependant, il peut arriver, dans le cadre par exemple d’une migration de site où les accès FTP sont introuvables, qu’il n’y ait pas d’autres possibilités que de devoir aspirer le site pour en conserver une copie.Cependant, si le site a été réalisé avec un CMS, cette copie ne sera pas fonctionnelle : elle donnera seulement l’image des contenus statiques du site, c’est à dire le rendu html de la page web.

Accéder à un site hors connexion

Cas de plus en plus rare, mais qui peut se produire, par exemple si on souhaite consulter les données d’un site Internet dans le train.

Faire de la veille (le gentil mot pour “surveillance”)

Afin par exemple de “surveiller” la concurrence, on peut souhaiter télécharger de manière “industrielle” et régulière les contenus de certains sites web. La surveillance des sites concurrents est cependant plus efficace lorsqu’elle est effectuée de manière ciblée et structurée à l’aide des techniques de web scraping.

Gabriel Dabi-Schwebel

Posté par

Ingénieur de formation, j'ai accompagné notamment pour Alcatel, TF1, SFR et Lagardère Active le lanc





Commenter

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.

Abonnez-vous à notre excellente newsletter

Hey ne partez pas si vite !

Contactez-nous
Do NOT follow this link or you will be banned from the site!