Qu'est-ce que la Wayback Machine ?
La Wayback Machine est l'une des parties les plus connues du site Internet Archive.
Il s'agit d'une archive numérique du WWW (World Wide Web). L'organisation à but non lucratif Internet Archive, basée à San Francisco, a fondé la Wayback Machine.
Wayback Machine utilise un logiciel d'exploration du Web pour archiver les pages Web que les gens peuvent voir même après des années.
Au moment de la rédaction du présent document, il contient environ 563 milliards de pages Web, et un grand nombre de ces pages sont ajoutées chaque année.
Liste des meilleures alternatives à la Wayback Machine
1. Stillio.
Stillio enregistre les pages web en faisant des captures d'écran à des intervalles spécifiques.
Il peut s'agir d'un enregistrement quotidien, horaire ou selon les besoins de l'utilisateur. Les captures d'écran sont enregistrées au format PNG et le contenu est parfaitement clair.
Il est également possible d'éditer la capture d'écran dans les dimensions de son choix.
Stillio enregistre les informations de tout site web de temps en temps.
Par conséquent, dès que vous vous connectez, vous pouvez accéder à tous les enregistrements et aux informations associées sur votre tableau de bord. Il propose une période d'essai de 14 jours, puis des formules d'abonnement à partir de 29 dollars par mois.
2. VisualPing.
Visualping est un logiciel de détection des modifications de sites Web bien connu, qui permet de suivre les modifications apportées à un site Web et de recevoir une notification par courrier électronique lorsqu'un site Web est modifié.
Il est utilisé par plus de deux millions d'utilisateurs, dont 85% des entreprises du Fortune 500. Visualping est très simple à utiliser, et il est gratuit pour un maximum de 5 pages par jour.
Pour commencer à suivre les modifications apportées à un site Web, il suffit d'introduire l'URL de la page que vous souhaitez surveiller, de sélectionner la zone de la page qui vous intéresse et de choisir la fréquence à laquelle vous souhaitez que la page soit vérifiée. Il offre quelques paramètres avancés pour bloquer certains éléments ou introduire des identifiants de connexion, entre autres.
Visualping peut aider à surmonter certaines des limites de Wayback Machine, car il peut explorer toutes sortes de sites web, comme les mises à jour des réseaux sociaux ou les pages protégées par un mot de passe.
Et il archive également les copies afin que vous puissiez accéder à toutes les différentes versions.
3. Internet Archive.
Internet Archive est l'une des bibliothèques Internet les plus utilisées pour les résultats du Web, qu'il s'agisse de livres électroniques, de logiciels, de films, de musique, etc.
Elle conserve l'historique de plus de 690 milliards de pages Web auxquelles chacun peut accéder à tout moment.
Tous les résultats sont disponibles gratuitement pour ses utilisateurs. La plateforme fonctionne grâce à des dons.
Internet Archive a commencé son voyage en 1996 en archivant le web. Aujourd'hui, elle dispose de plus de 25 ans d'historique de pages et de fichiers web accessibles via sà la Wayback Machine.
Tout le monde peut créer un compte gratuit auprès d'Internet Archive et enregistrer des copies d'œuvres dans sa collection spéciale.
4. Pagefreezer.
Pagefreezer est l'une des meilleures alternatives à la Wayback Machine basées sur le stockage en nuage. Il s'agit d'une plateforme d'archivage de réseaux sociaux et de sites Web utilisée par de nombreuses entreprises pour protéger leur contenu.
Ce qui le différencie de Wayback Machine est que vous pouvez gérer tous ses services avec un seul compte. Il est assez facile de travailler avec Pagefreezer car il stocke toutes les archives en un seul endroit.
Il n'est pas nécessaire d'installer Pagefreezer, car son processus d'archivage est automatique.
Un tel processus automatique garantit la sécurité du contenu.
Différents secteurs tels que le commerce de détail, le gouvernement, la finance, les télécommunications, l'éducation, etc. utilisent cette plateforme. Elle est proposée avec un abonnement mensuel de 99 $.
5. Perma.cc.
Perma.cc est une application dédiée à l'archivage du web. Elle est construite et maintenue par la bibliothèque de la Harvard Law School.
Grâce à cette application, vous pouvez créer des enregistrements permanents de votre site Web.
Une fois les liens créés, vous pouvez les supprimer dans les 24 heures suivant leur création. En cas d'échec de la conservation, vous pouvez télécharger des fichiers PDF ou des images.
Il s'agit de l'une des plateformes d'archivage les plus simples et les plus faciles à utiliser qui permet initialement aux nouveaux utilisateurs de créer dix liens.
Les nouveaux utilisateurs peuvent créer ces liens à titre d'essai. Une fois la période d'essai terminée et si vous souhaitez continuer à ajouter des liens, vous pouvez utiliser un abonnement payant.
6. Archive.today.
Archive.today est une excellente plateforme d'archivage qui prend en charge même les sites Web lourds.
Elle permet aux utilisateurs de récupérer des informations même à partir des versions précédentes des pages Web.
Archive.today conserve généralement les enregistrements de deux copies d'un même site Web. La première copie concerne les fonctionnalités en direct avec les liens et les URL répertoriés, et la seconde est une image statique. Vous pouvez facilement prendre des instantanés que vous pourrez utiliser ultérieurement en cas de besoin.
Archive.today utilise les moteurs de recherche Google et Yandex. Cela implique que lorsqu'un moteur de recherche cesse de fonctionner, le second travaille automatiquement à sa place. L'utilisation de cette plateforme est entièrement gratuite.
7. MirrorWeb.
MirrorWeb est un bon choix pour vos besoins d'archivage numérique et une excellente alternative à la Wayback Machine
Cette plateforme propose des enregistrements à la demande pour les sites Web, les plateformes de réseaux sociaux, la communication avec les clients, etc.
Elle prétend offrir un stockage fiable, robuste et sûr des données, plus facile à récupérer en cas de besoin.
Grâce à MirrorWeb, vous pouvez programmer la capture de votre site web, de votre plateforme de communication ou de votre plateforme de médias sociaux. Il peut capturer le contenu d'applications lourdes basées sur JavaScript ou d'applications construites à l'aide d'Angular, React, etc. Son assistance 24 heures sur 24 et 7 jours sur 7 vous offre la tranquillité d'esprit que son équipe vous aidera si vous êtes bloqué.
8. CachedView.
CachedView est un site Web d'archivage tridimensionnel considéré comme une excellente alternative à la Wayback Machine.
Il utilise plusieurs sources pour archiver les sites Web. Le programme vous permet d'accéder au cache de Google.
Le dossier Google Web Cache affiche tous les fichiers qu'il archive. CachedView combine la puissance de trois technologies qui sont l'archivage Internet, le contenu corallien et le cache de Google, en une seule plateforme. Son utilisation est entièrement gratuite.
9. ChangeTower.
ChangeTower est essentiellement une plateforme d'archivage et de détection des modifications de sites Web.
Il surveille les modifications apportées à un site Web et envoie des alertes et des notifications à ce sujet. Vous pouvez choisir une URL que vous voulez surveiller.
Cette URL est définie pour l'archivage. Les crawlers de ChangeTower prennent des captures d'écran du site Web à intervalles réguliers et capturent des captures d'écran des pages et du code source.
Vous pouvez également définir les critères d'alerte en fonction de vos besoins. Il vous avertit également de toute menace pour la sécurité.
10. Time Travel.
Time Travel est une sorte de produit d'archives Internet amélioré qui utilise l'API archive.today pour construire cette plate-forme.
Elle offre le souvenir de plusieurs archives Internet, qui sont révisées régulièrement. Vous pouvez utiliser l'archive Internet de votre choix et la présenter sur le site archive.today.
Memento Time Travel effectue une recherche sur l'ensemble du serveur pour explorer les pages web. Les éléments qu'il révèle sur une page web sont fonction de l'heure de la requête.
Ses services d'archivage sont disponibles gratuitement.
Quel est le but de la Wayback Machine ?
Il existe un grand nombre d'utilisations de la Wayback Machine. Voici quelques-unes de ses fonctions :
Analyse de vos concurrents
En tant qu'entreprise, vous souhaitez certainement savoir comment vos concurrents ont progressé avec le temps et ont atteint une bonne présence numérique.
Cela peut inclure l'examen de la manière dont ils ont amélioré le site Web par rapport à leur situation initiale et les changements qu'ils ont mis en œuvre au fil du temps.
Le moteur Wayback peut vous aider à examiner toutes ces choses.
LECTURE RECOMMANDÉE : Utilisez la Wayback Machine pour analyser vos concurrents
Retrouver les données perdues d'un site web
Il peut arriver que vous perdiez accidentellement les données de votre site Web et que vous souhaitiez les récupérer par la suite. la Wayback Machine vous permet d'accéder même aux contenus supprimés. Même si vous souhaitez récupérer une vidéo YouTube supprimée, elle peut également vous aider à le faire.
Visualiser le contenu d'un site web en panne
Il se peut que vous souhaitiez voir le contenu d'une page Web qui est actuellement indisponible. la Wayback Machine n'a aucun effet sur le fait qu'une page Web soit actuellement fermée. Elle peut vous montrer plusieurs versions de la page Web en question sans aucun inconvénient.
Dois-je m'inscrire pour utiliser la Wayback Machine ?
Non ! La plupart des contenus des archives relèvent du domaine public et peuvent être diffusés ou téléchargés par n'importe quel utilisateur, sans qu'il soit nécessaire de s'inscrire ou de se connecter.
Cependant, en vous inscrivant à un compte Internet Archive, vous avez accès à un certain nombre de fonctionnalités, notamment :
- accès à plus de 1,3 million d'ebooks modernes (sous copyright) que les utilisateurs enregistrés peuvent emprunter.
- une archive web personnelle qui vous permet d'ajouter de nouveaux sites à la Wayback Machine
- la possibilité de télécharger librement votre propre contenu vers les Archives
- Accès à l'API pour le téléchargement en masse et l'intégration de logiciels.
Créez un compte gratuit sur archive.org
FAQs
Pourquoi les images d'un site sont-elles cassées ou grises ?
Les images cassées se produisent lorsque les images ne sont pas disponibles sur leurs serveurs. Cela signifie généralement qu'ils ne les ont pas archivées.
Vous pouvez savoir si l'image ou le lien que vous recherchez se trouve dans la Wayback Machine en saisissant l'URL de l'image ou du lien dans le champ de recherche Wayback Machine. Toutes les archives dont ils disposent sont consultables dans la Wayback Machine.
Le meilleur moyen de voir tous les fichiers qu'ils ont archivé du site est : http://web.archive.org/*/www.yoursite.com/*.
Il y a un décalage de 3 à 10 heures entre le moment où un site est exploré et celui où il apparaît dans la Wayback Machine.
Pourquoi certains sites sont-ils plus difficiles à archiver que d'autres ?
Si vous regardez leur collection de sites archivés, vous trouverez des pages cassées, des graphiques manquants, et certains sites qui ne sont pas archivés du tout.
Voici quelques-unes des causes possibles :
- Robots.txt - Le document robots.txt d'un site peut avoir empêché l'exploration d'un site.
- Javascript - Les éléments Javascript sont souvent difficiles à archiver, mais surtout s'ils génèrent des liens sans avoir le nom complet dans la page. De plus, si le javascript doit contacter le serveur d'origine pour fonctionner, il échouera lors de l'archivage.
- Cartes d'images côté serveur - Comme toute fonctionnalité sur le web, si elle doit contacter le serveur d'origine pour fonctionner, elle échouera lors de l'archivage.
- Pages orphelines - S'il n'y a pas de liens vers vos pages, le robot ne les trouvera pas (les robots ne saisissent pas de requêtes dans les boîtes de recherche).
En règle générale, le html simple est le plus facile à archiver.
Puis-je encore trouver des sites dans la Wayback Machine si je connais seulement l'URL ?
Oui, il suffit de saisir un domaine ou une URL comme vous l'avez fait dans le passé et d'appuyer sur le bouton "Parcourir l'historique".
Pourquoi certains des points de la page du calendrier sont-ils de couleurs différentes ?
La Wayback Machine colore les points, et les liens, associés aux captures web individuelles, ou aux captures web multiples, pour un jour donné.
- Le bleu signifie que le code de résultat du serveur Web que le crawler a obtenu pour la capture correspondante était un 2nn (bon) ;
- Le vert signifie que le crawler a obtenu un code de statut 3nn (redirection) ;
- L'orange signifie que le crawler a obtenu un code de statut 4nn (erreur du client),
- Le rouge signifie que le crawler a vu un 5nn (erreur du serveur).
La plupart du temps, vous voudrez probablement sélectionner les points ou les liens bleus.
Résumé.
La Wayback Machine est un outil formidable, mais elle a ses limites.
Si vous recherchez des alternatives plus fiables, capables de capturer facilement les modifications apportées aux sites Web, essayez Stillio et VisualPing.
Ces deux outils sont proposés en version d'essai gratuite, ce qui vous permet de les tester et de voir lequel répond le mieux à vos besoins.