Poszukuję narzędzia do wyciągnięcia całego drzewa stron z niektórymi opcjami wyboru [duplikuj]


0

Możliwy duplikat:
Jak mogę pobrać całą stronę internetową

Często spotykam strony internetowe, które oferują strony z instrukcjami lub inne informacje dostępne tylko za pośrednictwem spisu treści zawierającego łącza do poszczególnych rozdziałów lub akapitów. Często poszczególne strony liści składają się tylko z kilku wierszy, więc przemierzanie całego drzewa jest wyjątkowo kłopotliwe.

To, czego szukam, to narzędzie, które pozwoliłoby mi wyciągnąć i połączyć wszystkie strony, do których prowadzą łącza strony początkowej, w jeden połączony dokument HTML, tak że można np. Zapisać tę stronę i / lub liniowo przewijać wszystkie strony potomne bez konieczności klikania i cofania się 1000 razy. Pozwoliłoby to również wydrukować całą kolekcję, aby mieć instrukcję lub przeszukać ją za jednym razem itp.

Czy ktoś zna dobre narzędzie, aby to osiągnąć? Idealnie byłoby, gdyby takie narzędzie oferowało pewne kryteria wykluczenia (takie jak zignorowanie wszystkich linków „wstecz” lub linku do pomocy lub stron głównych, które można znaleźć na każdej stronie itp.).


Narzędzie, które może pobrać pełne drzewo strony internetowej, to browse-offline.com
Menelaos Vergis

Odpowiedzi:


1

Możesz użyć wget w trybie lustrzanym:

C:\MySites\> wget -m http://mymanuals.com/manuals/foobar

Odzwierciedla całą witrynę http://mymanuals.com/manuals/foobar .

Inną rzeczą, z której korzystałem całkiem nieźle, jest HTTrack, który ponownie odzwierciedla twoją stronę internetową, ale z ładnym interfejsem GUI.


Chciałem zasugerować HTTrack, ale pobiłeś mnie.
Journeyman Geek

0

wgetaby uzyskać wszystkie strony. Możesz użyć xhtml2pdf i pdftk, aby utworzyć pojedynczy dokument.


Nie sądzę, że to duplikat! NIE próbuję powielić całej witryny. To, co wolałbym zobaczyć, to jakieś narzędzie, które wyświetla strukturę strony i strony, np. Jako drzewo, a następnie można wygodnie wybrać (np. Sprawdzając lub zaznaczając kółkiem) te, które chcemy skopiować (tj. Połączyć i „spłaszczyć”) w jednym dokumencie. IMHO to inna praca niż powielanie strony internetowej na lokalną.
Michael Moser
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.