Internet Archive – Consultez nos documents

Le Mouvement républicain du Québec possède un compte entièrement en ligne chez Internet Archive, aux États-Unis. Tous les documents écrits, audio, vidéo, images et articles de presse de l’organisation y seront déposés et pourront donc être visualisés et téléchargés en tout temps. Les documents de travail créés par les différents comités, et rendus accessibles au public, seront aussi ajoutés à ce compte pour être consultés par tous les internautes.

L’Internet Archive est l’équivalent virtuel d’une bibliothèque d’archives, sauf que celle-ci est accessible au niveau international. Il s’agit en fait d’un organisme à but non lucratif consacré à l’archivage du Web et situé dans le Presidio de San Francisco, en Californie. Le projet sert aussi de bibliothèque numérique. Ces archives électroniques sont constituées de clichés instantanés (copie de pages prises à différents moments) d’Internet, de logiciels, de films, de livres et d’enregistrements audio.

Pour assurer la stabilité et la sécurité des données archivées, un site miroir fonctionnel est conservé à la Bibliotheca Alexandrina en Égypte. L’Internet Archive met gratuitement ses collections à la disposition des chercheurs, historiens et universitaires. Elle est membre de l’American Library Association et est officiellement reconnue comme bibliothèque par l’État de Californie. Le robot d’indexation utilisé par l’Internet Archive est Heritrix, un logiciel libre. Le logiciel de numérisation de livres, libre également, est Scribe.

L’Internet Archive fut fondée en 1996 par Brewster Kahle. En raison de leurs objectifs — la préservation de la connaissance humaine et l’accessibilité des collections à tous —, les fondateurs de l’IA comparent ce projet à celui plus ancien de la bibliothèque d’Alexandrie.

En plus des archives Web, l’Internet Archive conserve d’importantes collections de médias numériques qui sont soit du domaine public soit titulaires d’une licence permettant leur redistribution, comme la Licence Creative Commons. Les médias sont organisés en collections par type (images animées, son, texte, etc.) et en sous-collections selon différents critères. Chaque collection principale comprend une sous-collection Open Source, où les apports du public en général peuvent être archivés. Ses collections comportent :

  • 456 milliards de versions archivées (snapshots) du World Wide Web et d’Usenet, soit 67 millions de sites Web de 37 langues ;
  • 1 900 000 films ;
  • 2 400 000 d’enregistrements audios ;
  • 149 000 concerts ;
  • 7 800 000 livres ;
  • 96 000 logiciels ;
  • 951 000 images.

À propos de la Wayback Machine

La Wayback Machine (littéralement « la machine à revenir en arrière ») est la partie des clichés du Web de l’Internet Archive. Wayback Machine a été créé par Brewster Kahle afin de stocker et indexer tout ce qui se trouve sur le web. La Wayback Machine est mise à jour à partir du contenu d’Alexa. Ce service permet aux utilisateurs de voir les versions archivées de pages Web à travers le temps : c’est l’« index à trois dimensions ».

Les clichés sont disponibles de six à douze mois après leur capture. La fréquence des instantanés est variable, toutes les mises à jour de sites Web ne sont pas enregistrées, et des intervalles de plusieurs semaines peuvent être observés.

En 2006, la Wayback Machine contenait près de deux pétaoctets de données. Le volume augmente à un rythme de 20 téraoctets par mois, soit une augmentation de deux tiers par rapport aux douze téraoctets par mois qui étaient le taux de croissance en 2003. Cette croissance est supérieure à la quantité de texte contenue dans les plus importantes bibliothèques du monde, notamment la Bibliothèque du Congrès. En 2009, la Wayback Machine contenait près de trois pétaoctets de données et son augmentation était de 100 téraoctets par mois. Les données sont archivées dans des systèmes fabriqués par Capricorne Technologies, des Petabox racks.

L’appellation « Wayback Machine » renvoie à des épisodes du The Rocky and Bullwinkle Show, où M. Peabody, un chien à l’air professoral et son assistant Sherman (un animal de compagnie humain), utilisent une machine à remonter le temps appelée « WABAC Machine » pour décrire des événements historiques célèbres.

En 2015, la Russie aurait par erreur bloqué l’intégralité du site Wayback Machine.