wget jest bardzo przydatnym narzędziem do szybkiego pobierania rzeczy w Internecie, ale czy mogę go używać do pobierania z witryn hostingowych, takich jak FreakShare, IFile.it Depositfiles, przesłane, Rapidshare? Jeśli tak, jak mogę to zrobić?
wget jest bardzo przydatnym narzędziem do szybkiego pobierania rzeczy w Internecie, ale czy mogę go używać do pobierania z witryn hostingowych, takich jak FreakShare, IFile.it Depositfiles, przesłane, Rapidshare? Jeśli tak, jak mogę to zrobić?
Odpowiedzi:
Tego rodzaju strona utrudnia nieużywanie graficznej przeglądarki internetowej, ponieważ jeśli użyjesz wget, stracisz wszystkie te reklamy, które płacą za przepustowość.
Niektóre strony nie przeprowadzają zaawansowanych kontroli i można je łatwo oszukać: powiedz wget, aby udawał, że to naprawdę Mozilla i że pochodzi z witryny pobierania .
wget --user-agent='Mozilla/5.0 (Windows NT 6.0) Gecko/20100101 Firefox/14.0.1' \
--referer=http://downloadsite.example.com/download-page-url
http://downloadsite.example.com/download-page-url/filename.ext`
Większość witryn, które sprawdzają, pozwala uciec --user-agent=Mozilla
i --referer
ustawić adres URL pobieranego pliku.
W przypadku niektórych witryn może być konieczne wyeksportowanie plików cookie przeglądarki internetowej i przejście --load-cookies
do wget; w tym momencie używanie wget zaczyna być bardziej pracochłonne niż ręczne pobieranie. Ostateczną metodą, która może działać cały czas, ale wymaga pewnego kodowania dla każdej witryny, jest użycie frameworka automatyzacji przeglądarki, takiego jak Selenium lub Watir .
Zobacz także Automatyzacja żądań internetowych za pomocą curl?
Zippyshare
Links: stackoverflow.com/a/21100640/1533054
Ta metoda opiera się na odpowiedzi Gillesa . Jak powiedział, sztuczka polega na tym, aby serwer pomyślał, że żądanie jest wysyłane z przeglądarki i aby tak się stało, potrzebujesz kilku rzeczy:
Oto zrzut ekranu wyjaśniający, gdzie można zdobyć każdy przedmiot:
Teraz otwórz terminal i użyj następującego polecenia (zastępując niezbędne elementy):
wget <download_link> \
--referer='<referrer>' \
--cookies=off --header "Cookie: JSESSIONID=<session_id>" \
--user-agent='Mozilla/5.0 (Windows NT 6.0) Gecko/20100101 Firefox/14.0.1'
Przykład:
wget http://www16.zippyshare.com/d/29887835/8895183/hello.txt \
--referer='http://www16.zippyshare.com/v/29887835/file.html' \
--cookies=off --header "Cookie: JSESSIONID=26458C0893BF69F88EB5743D74FE0F8C" \
--user-agent='Mozilla/5.0 (Windows NT 6.0) Gecko/20100101 Firefox/14.0.1'
Uwaga: w poleceniu tak referer
nie jestreferrer
Chciałbym również nad doskonałymi odpowiedziami, użyłem następującej sztuczki do pobrania filmu dla dziecka dla mojego syna z Turbobit:
Zamiast SESSION_ID z powyższej odpowiedzi, musisz znaleźć „compid” na karcie cookie FIREBUG:
Potem polecenie dla mojego wbudowanego systemu Debian było bardzo łatwe:
wget --referer='http://http://turbobit.net/download/free/yilmacr4e351' --cookies=off --header "Cookie: compid=c9255510c34624435292d8a0e7e405be66aa01f9%7ED01343F87AB53A2C38D957A564DA1D55" --user-agent='Mozilla/5.0 (Windows NT 6.0) Gecko/20100101 Firefox/14.0.1' http://turbobit.net/download/redirect/B3EDACDA9B899937A149D5AAB6662327/yilmacr4e351/Ters.Yuz.2015.1080P.WEBDL.TR.EN.mkv &
Mogę teraz wyłączyć komputer :)