Można użyć biblioteki pdf2image.
Możesz go zainstalować po prostu za pomocą,
pip install pdf2image
Po zainstalowaniu możesz użyć następującego kodu, aby pobrać obrazy.
from pdf2image import convert_from_path
pages = convert_from_path('pdf_file', 500)
Zapisywanie stron w formacie jpeg
for page in pages:
page.save('out.jpg', 'JPEG')
Edycja: repozytorium Github pdf2image wspomina również, że używa pdftoppm
i wymaga innych instalacji:
pdftoppm to oprogramowanie, które robi prawdziwą magię. Jest dystrybuowany jako część większego pakietu zwanego poppler . Użytkownicy systemu Windows będą musieli zainstalować poppler dla systemu Windows . Użytkownicy komputerów Mac będą musieli zainstalować poppler dla komputerów Mac . Użytkownicy Linuksa będą mieli preinstalowany program pdftoppm z dystrybucją (testowany na Ubuntu i Archlinux), jeśli tak nie jest, uruchom sudo apt install poppler-utils
.
Możesz zainstalować najnowszą wersję w systemie Windows za pomocą programu anaconda, wykonując:
conda install -c conda-forge poppler
Uwaga: wersje Windows do 0.67 są dostępne na http://blog.alivate.com.au/poppler-windows/, ale pamiętaj, że 0.68 został wydany w sierpniu 2018, więc nie będziesz otrzymywać najnowszych funkcji ani poprawek błędów.