Próbuję pobrać dwie witryny w celu umieszczenia na płycie CD:
http://boinc.berkeley.edu/trac/wiki
http://www.boinc-wiki.info
Problemem jest to, że są to wiki. Więc podczas pobierania za pomocą np .:
wget -r -k -np -nv -R jpg,jpeg,gif,png,tif http://www.boinc-wiki.info/
Dostaję dużo plików, ponieważ podążają one również za linkami takimi jak ...? Akcja = edycja ...? Akcja = różnica i wersja = ...
Czy ktoś zna sposób na obejście tego?
Chcę tylko bieżące strony, bez obrazów i bez różnic itp.
PS:
wget -r -k -np -nv -l 1 -R jpg,jpeg,png,gif,tif,pdf,ppt http://boinc.berkeley.edu/trac/wiki/TitleIndex
To zadziałało w Berkeley, ale boinc-wiki.info wciąż sprawia mi kłopoty: /
PPS:
Mam najbardziej odpowiednie strony z:
wget -r -k -nv -l 2 -R jpg,jpeg,png,gif,tif,pdf,ppt http://www.boinc-wiki.info