Cherchez et parcourez les archives du web

25 Février 2011

Le web est un élément en constante évolution, ce qui est en ligne à un instant t ne le restera pas éternellement. Une page bookmarkée peut alors devenir totalement inutile si le site n'est plus en ligne ou si le contenu a changé. Heureusement il existe des sites qui stockent des milliards de pages web et leur date de publication pour les servir ensuite, ce type de service est extrêmement pratique...

Le site WaybackMachine permet de retrouver des anciennes version de sites internet surla toile. C'est un simple moteur de recherche comme Google qui permet de rechercher dans les archive du web et de les parcourir bien entendu sinon cela n'a aucun intérêt. Comme le service est tout simple, l'interface l'est également. Pour lancer une recherche, il suffit d'e saisir l'URL de la page que l'on veut chercher et c'est tout.

Capture de la home WaybackMachine

Une fois la recherche executée, si il y a des résultats, le site affiche la dernière version enregistrée avec une timeline en haut de la page (que l'on peut cacher) qui permet de parcourir les différente versions de la page enregistrée. Dans le cas de la home de Wikipédia, il y a 801 captures réparties sur plus de 9 ans, la première capture a eu lieu le 27 juillet 2001 et la dernière le 27 aout 2010.

Capture de Wikipedia avec WaybackMachine

Plutot pratique non ? Mais ce n'est pas tout... En effet, dans certains cas, le site enregistre également les fichiers téléchargeable sur le site. Ce qui est vraiment génial pour récupérer des anciennes versions d'une librairie ou d'un framework qui est très vieux. Je cherchais cette semaine les sources du serveur d'application Resin en version 2.1.11 qui a été releasé en septembre 2003. Impossible de les trouver sur le site et sur Google mon salut est venu de WayBackMachine...

Seul petit problème, c'est que cela ne fonctionne qu'avec de gros sites... J'ai testé quelques mon blog et quelques autres petits sites que je fréquente mais WayBackMachine n'avait pas de snapshots de ces sites, malheureusement.

Capture d'un site inconnu par WaybackMachine

En conclusion, ce service est définitivement à conserver dans ces bookmarks pour pouvoir rechercher dans les archives d'internet. Un grand merci à Aurélien (alias @jsoftbiz) pour son tweet...

Charger les commentaires…