Możesz pobrać -pages-articles.xml.bz2
ze strony ze zrzutami Wikimedia i przetworzyć je za pomocą WikiTaxi (pobierz w lewym górnym rogu). Narzędzie do importowania Wikitaxi utworzy plik .taxi
(około 15 GB dla Wikipedii) z .bz2
pliku. Plik ten zostanie wykorzystany przez program WikiTaxi do wyszukiwania artykułów. Działanie jest bardzo podobne do działania przeglądarki.
Lub możesz użyć Kiwix , szybszego w konfiguracji, ponieważ zapewnia on również przetworzone zrzuty ( .zim
pliki). Jak podano w komentarzu w celu przejęcia innych witryn MediaWiki dla kiwix mwoffliner
, może nie działać ze wszystkimi, ponieważ mogą mieć niestandardowe różnice, ale jest to jedyny wariant, z którym się spotkałem.
Używanie materiałów Wikimedia wget
nie jest dobrą praktyką. Jeśli zrobi to zbyt wiele osób, może to zalać witryny żądaniami.
Później edytuj skrzynię, aby zdjęcia były także offline:
Jeśli chcesz mieć kompletne lustro Wikipedii (w tym obrazy) nienaruszone pełne formatowanie HTML, które będzie pobierane za około 30 godzin , powinieneś użyć:
Angielska Wikipedia ma wiele danych. Istnieje ponad 13,9 miliona stron z ponad 20,0 GB tekstu, a także ponad 3,7 miliona miniatur.
XOWA :
Konfiguracja tego wszystkiego na komputerze nie będzie szybkim procesem ... Sam import będzie wymagał 80 GB miejsca na dysku i pięciu godzin czasu przetwarzania dla wersji tekstowej. Jeśli chcesz również obrazy, liczby zwiększą się do 100 GB miejsca na dysku i 30 godzin czasu przetwarzania. Jednak gdy skończysz, będziesz mieć kompletną, najnowszą kopię angielskiej Wikipedii ze zdjęciami, które mogą zmieścić się na karcie SD o pojemności 128 GB.
Ale wersja offline jest bardzo podobna do wersji online, zawiera zdjęcia itp .:
(Testowałem poniższy artykuł całkowicie offline)
Później edytuj, jeśli żadne z powyższych nie ma zastosowania
Jeśli wiki nie jest częścią Wikimedia lub nie ma zrzutu, na github istnieje projekt, który pobiera tę wiki za pomocą swojego API:
Main Page
i podążaj za linkami stamtąd.