Uczę się Pythona requestsi BeautifulSoup. W ramach ćwiczenia postanowiłem napisać szybki parser biletów parkingowych w Nowym Jorku. Jestem w stanie uzyskać odpowiedź HTML, która jest dość brzydka. Muszę pobrać lineItemsTablei przeanalizować wszystkie bilety. Możesz odtworzyć stronę, przechodząc tutaj: https://paydirect.link2gov.com/NYCParking-Plate/ItemSearchi wprowadzając NYtablicęT630134C soup = BeautifulSoup(plateRequest.text) #print(soup.prettify()) #print soup.find_all('tr') table = soup.find("table", …
Jak mógłbym, używając BeautifulSoup, wyszukiwać tagi zawierające TYLKO atrybuty, których szukam? Na przykład chcę znaleźć wszystko <td valign="top"> tagi. Poniższy kod: raw_card_data = soup.fetch('td', {'valign':re.compile('top')}) pobiera wszystkie potrzebne mi dane, ale także pobiera wszystkie <td>znaczniki, które mają ten atrybutvalign:top Próbowałem też: raw_card_data = soup.findAll(re.compile('<td valign="top">')) i to nic nie zwraca …
Zainstalowałem BeautifulSoup za pomocą easy_install i próbuję uruchomić następujący skrypt from BeautifulSoup import BeautifulSoup import re doc = ['<html><head><title>Page title</title></head>', '<body><p id="firstpara" align="center">This is paragraph <b>one</b>.', '<p id="secondpara" align="blah">This is paragraph <b>two</b>.', '</html>'] soup = BeautifulSoup(''.join(doc)) print soup.prettify() Ale nie wiem, dlaczego tak się dzieje Traceback (most recent call last): …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.