la mémoire du Web

La plupart des moteurs de recherche, dont l’indispensable Google, ont depuis longtemps renoncé à comptabiliser le nombre de pages Web: Internet est pour eux à peu près sans mémoire (en constante augmentation depuis la fin des années 1990, la durée de vie moyenne d’une page Web a longtemps été de cent jours à peine).

Pour prendre la mesure de l’histoire du Web, le site Archive.org a pour sa part archivé près de 86 milliards de p., correspondant à 65 millions de sites Web, en 37 langues.

Sa base de données pèse près de 2 pétaoctets, soit 2 millions de gigaoctets, l’équivalent de deux cents fois le contenu de la Bibliothèque du Congrès américain.

Cette « machine à remonter le temps » permet ainsi, non seulement de revisiter les sites Web tels qu’ils se présentaient il y a un, cinq ou dix ans, mais aussi de retrouver la trace de ces contenus qui, depuis, ont disparu, avec une prédilection pour certains événements marquants, tels que les attentats terroristes du 11 septembre 2001, l’ouragan Katrina, qui a ravagé La Nouvelle-Orléans en 2005, ou encore le tsunami de décembre 2004, qui font l’objet de « collections ».

Au-delà du Web, la richesse d’Archive.org se mesure aussi à l’aune de la diversité de sa bibliothèque multimédia, forte de près de 45 000 concerts et de plus de 100 000 films, 200 000 enregistrements audio et 290 000 livres et textes… Car Archive.org s’est également donné pour mission de mettre à disposition tous les contenus textes, audio, vidéo disponibles en format numérique. A la différence des médiathèques traditionnelles, tout ou presque y est téléchargeable gratuitement, le site étant alimenté par des collectionneurs, des fondations, des particuliers.

Prototype emblématique des archives ouvertes, Archive.org cherche moins à rivaliser avec les services de téléchargement audio ou vidéo qu’à ouvrir la voie aux futures médiathèques numériques.

(D’après un article paru sur le site du journal Le Monde).

 

Étiquettes : , , , , ,

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :