Pytania otagowane jako urlopen

14
Strona JavaScript do skrobania sieci w języku Python
Próbuję opracować prosty skrobak do sieci. Chcę wyodrębnić tekst bez kodu HTML. W rzeczywistości osiągam ten cel, ale widziałem, że na niektórych stronach, na których ładowany jest JavaScript, nie uzyskałem dobrych wyników. Na przykład, jeśli jakiś kod JavaScript dodaje jakiś tekst, nie widzę go, ponieważ kiedy dzwonię response = urllib2.urlopen(request) …

12
Pozwól obiektowi JSON akceptować bajty lub zostaw urlopen ciągi wyjściowe
W Pythonie 3 żądam dokumentu json z adresu URL. response = urllib.request.urlopen(request) responseObiekt jest obiektem plikopodobnym z readi readlinemetody. Zwykle obiekt JSON można utworzyć za pomocą pliku otwartego w trybie tekstowym. obj = json.load(fp) Chciałbym: obj = json.load(response) To jednak nie działa, ponieważ urlopen zwraca obiekt pliku w trybie binarnym. …
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.