Chcę uzyskać wszystkie pliki dla danej witryny w Archive.org. Przyczyny mogą obejmować:
- oryginalny autor nie zarchiwizował własnej strony internetowej i jest teraz offline, chcę z niej zrobić publiczną pamięć podręczną
- Jestem oryginalnym autorem niektórych stron i straciłem trochę treści. Chcę to odzyskać
- ...
W jaki sposób mogę to zrobić ?
Biorąc pod uwagę, że maszyna wayback archive.org jest bardzo wyjątkowa: linki do stron internetowych nie wskazują samego archiwum, ale strony internetowej, której już nie ma. JavaScript jest używany po stronie klienta do aktualizacji linków, ale sztuczka taka jak rekursywny wget nie działa.
gem install wayback_machine_downloader
. Uruchom wayback_machine_downloader z podstawowym adresem URL strony, którą chcesz pobrać jako parametr:wayback_machine_downloader http://example.com
Więcej informacji: github.com/hartator/wayback_machine_downloader