Laden Sie die Website von der WayBack-Maschine herunter

Ich habe auf dem WayBack-Computer eine hervorragende Website gefunden, die derzeit nicht funktioniert und die Domain zum Verkauf steht. Ich wollte es offline verwenden. Ich habe versucht, WinHTTrack zu verwenden, aber es speichert nur die Homepage, wegen der Struktur des WayBack-Computers.

Ich verwende Windows und würde mich über jede Hilfe freuen, die mir beim Herunterladen hilft.

Dank.

Author: Sanoo, 2014-06-23

2 answers

Habe gerade bemerkt, dass ich diese Frage von vor ein paar Jahren noch offen habe. Während ich zu dieser Zeit keine geeignete Option über einen generischen Crawler hinaus finden konnte, sind seitdem mehrere Optionen auf Websites wie GitHub aufgetaucht. Obwohl ich keinen von ihnen persönlich verwendet habe, möchte ich ihn hier für diejenigen dokumentieren, die noch nach einem Weg suchen, dies zu tun.

Ein Beispiel ist hartator/wayback-machine-downloader, das plattformunabhängig zu sein scheint (ein Ruby .GEM). Es beschreibt, wie es funktioniert wie folgt:

Es wird die letzte Version jeder auf Wayback Machine vorhandenen Datei auf ./websites/example.com / heruntergeladen.Es wird auch eine Verzeichnisstruktur neu erstellt und ein Index automatisch erstellt.html-Seiten, um nahtlos mit Apache und Nginx zu arbeiten. Alle heruntergeladenen Dateien sind die Originaldateien und keine Wayback Machine-neugeschriebenen Versionen. Auf diese Weise sind URLs und Links Struktur die gleichen wie zuvor.

Hoffe, das hilft jemandem, der das gleiche Problem hat wie vor vielen Jahren. Ich werde damit als gelöst markieren, es sei denn, jemand hat eine bessere Antwort.

 1
Author: Sanoo,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2020-04-21 15:12:51

Obwohl wir auf dieser Website im Allgemeinen keine Produktempfehlungen abgeben , würde ich vorschlagen, dass Sie sich das J-Spider-Projekt ansehen (http://j-spider.sourceforge.net/). Dieses Produkt ermöglicht das vollständige Herunterladen von Websites sowie Link-Tests, Sitemap-Generierung.. allerlei.

Es ist ein ziemlich nützliches Stück Kit.

 0
Author: Fazer87,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2014-06-23 13:29:15