Narzędzie do pobierania stron internetowych (pamięć podręczna?) Do przeglądania stron offline


9

Czy istnieje przenośny sposób pobierania lub buforowania wszystkich stron witryny w celu przeglądania offline? Jutro odbieram lot przez cały kraj i chciałbym mieć możliwość buforowania kilku stron internetowych (w szczególności strony doc Python ( http://docs.python.org/ ) i odnośnika pyqt ( http: // www. riverbankcomputing.co.uk/static/Docs/PyQt4/pyqt4ref.html ).

Idealnie chciałbym mieć dodatek do Firefoksa lub coś w tym rodzaju, ale wszystko będzie działać dobrze, dopóki będę mógł go uruchomić w systemie Linux.


Odpowiedzi:


15

Używam HTTrack .

Umożliwia pobranie witryny sieci Web z Internetu do lokalnego katalogu, rekurencyjne budowanie wszystkich katalogów, pobieranie HTML, obrazów i innych plików z serwera na komputer


Użyłem tego w przeszłości, miłego darmowego rozwiązania.
MaQleod

1
HTTrack jest najlepszy zarówno dla Linuksa, jak i Windowsa. Istnieje ogromna lista opcji konfiguracji procesu pobierania. Uwielbiam to
eslambasha

Ja też tego użyłem; teraz oferują też wersję na Androida.
gparyani

-1 Nie buduje „wszystkich katalogów”, nie otrzymuje wszystkich „obrazów i innych plików”. Dostaje tylko to, z czym jest powiązany.
barlop

6

Korzystam z wget z tymi opcjami do tworzenia kopii lustrzanej witryny do użytku offline

wget -cmkE -np http://example.com/a/section/i/like

gdzie

-m włącza opcje dublowania dla dublowania strony lokalnie

-c kontynuuje poprzednie pobieranie w przypadku, gdy już pobrałem niektóre strony

-k konwertuje absolutny href na lokalny w celu przeglądania w trybie offline

-E zapewnia, że ​​pliki mają rozszerzenie .html po pobraniu.

-np pobiera tylko obiekty z katalogu / a / section / i / i nie buforuje całej witryny.

Na przykład chciałem pobrać dokumentację południową, ale nie bilety południowe itp.

wget -cmkE -np http://south.aeracode.org/docs/index.html

Używam Windowsa i uruchamiam wget na cygwin, ale jest też natywny port wget dla Windows .

Chociaż w twoim przypadku możesz pobrać dokumenty Pythona offline z sekcji Dokumenty Pythona


1

Wypróbuj http://www.downthemall.net/ wtyczkę Firefox. Użyłem go do pobrania 250 stron plików PDF w ponad 20 osobnych plikach. Jest niezwykle potężny. Ma składnię wieloznaczną / zapytania, która pozwala chirurgicznie uzyskać tylko te pliki, które chcesz, i żadnych niepotrzebnych plików, których nie chcesz.


1

Niektóre rozszerzenia Firefoksa, które znam:

  • Album na wycinki

    pomaga zapisywać strony internetowe i łatwo zarządzać kolekcjami. Kluczowe cechy to lekkość, szybkość, dokładność i obsługa wielu języków. Główne cechy to:

    • Zapisz stronę internetową
    • Zapisz fragment strony internetowej
    • Zapisz stronę internetową
    • Uporządkuj kolekcję w taki sam sposób, jak Zakładki
    • Wyszukiwanie pełnotekstowe i szybkie filtrowanie wyszukiwania w kolekcji
    • Edycja zebranej strony internetowej
    • Funkcja edycji tekstu / HTML przypominająca uwagi Opery
  • ScrapBook Plus

    Różnica między ScrapBook Plus i ScrapBook:

    • szybsze sortowanie
    • szybszy import i eksport
    • otwórz okno, aby zarządzać swoją kolekcją bezpośrednio z paska bocznego
    • uproszczono obsługę „Kreatora łączenia”
    • nowe funkcje dla „Przechwytuj wiele adresów URL” (filtruj, aby wykluczyć linki, użyj tytułu strony internetowej lub tytułu linku jako nowego tytułu dla wpisu na pasku bocznym, określ czas oczekiwania między pobraniem od 0 do 3 sekund, użyj UTF-8 lub ISO-8859-1 jako zestaw znaków)
    • nowe okno „Przechwyć” (pobieranie należy rozpocząć ręcznie, automatyczne przewijanie wyłączone)
    • 6 zakreślaczy w edytorze
  • UnMHT

    umożliwia przeglądanie plików w formacie archiwum internetowego MHT (MHTML) i zapisywanie kompletnych stron internetowych, w tym tekstu i grafiki, w jednym pliku MHT

  • Kieszeń (nie rozszerzenie; wbudowana funkcja Firefox)

    pozwala zapisywać strony internetowe i filmy w Pocket za pomocą jednego kliknięcia. Kieszeń usuwa bałagan i zapisuje stronę w czystym, pozbawionym zakłóceń widoku i umożliwia dostęp do nich w podróży za pośrednictwem aplikacji Pocket.

    Uwaga:

    Zapisywanie i przeglądanie listy Pocket w Firefox wymaga połączenia z Internetem. Oglądanie offline jest możliwe na innych urządzeniach z aplikacją Pocket.


0

Możesz pobrać całą stronę internetową lub jej część za pomocą wget.

wget -r http://docs.python.org/

Sprawdź instrukcję wget pod kątem innych opcji, które możesz chcieć przekazać, np. Aby ograniczyć wykorzystanie przepustowości, kontrolować głębokość rekurencji, konfigurować listy wykluczeń itp.

Innym podejściem do przeglądania w trybie offline jest użycie buforującego serwera proxy. Wwwoffle to taki, który ma wiele funkcji ułatwiających przechowywanie podczas przeglądania w trybie offline, takich jak zastąpienie określonych przez serwer dat wygaśnięcia i możliwość cyklicznego pobierania z wyprzedzeniem. (Używam wwwoffle od moich dni dial-up).

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.