Programowanie beautifulsoup

3

Czy mogę usunąć tagi skryptów za pomocą BeautifulSoup?

Czy tagi skryptów i całą ich zawartość można usunąć z HTML za pomocą BeautifulSoup, czy też muszę używać wyrażeń regularnych lub czegoś innego?

93 python html beautifulsoup

4

python BeautifulSoup tabela parsowania

Uczę się Pythona requestsi BeautifulSoup. W ramach ćwiczenia postanowiłem napisać szybki parser biletów parkingowych w Nowym Jorku. Jestem w stanie uzyskać odpowiedź HTML, która jest dość brzydka. Muszę pobrać lineItemsTablei przeanalizować wszystkie bilety. Możesz odtworzyć stronę, przechodząc tutaj: https://paydirect.link2gov.com/NYCParking-Plate/ItemSearchi wprowadzając NYtablicęT630134C soup = BeautifulSoup(plateRequest.text) #print(soup.prettify()) #print soup.find_all('tr') table = soup.find("table", …

89 python beautifulsoup

7

Jak znaleźć tagi z tylko określonymi atrybutami - BeautifulSoup

Jak mógłbym, używając BeautifulSoup, wyszukiwać tagi zawierające TYLKO atrybuty, których szukam? Na przykład chcę znaleźć wszystko <td valign="top"> tagi. Poniższy kod: raw_card_data = soup.fetch('td', {'valign':re.compile('top')}) pobiera wszystkie potrzebne mi dane, ale także pobiera wszystkie <td>znaczniki, które mają ten atrybutvalign:top Próbowałem też: raw_card_data = soup.findAll(re.compile('<td valign="top">')) i to nic nie zwraca …

87 python beautifulsoup

8

ImportError: brak modułu o nazwie BeautifulSoup

Zainstalowałem BeautifulSoup za pomocą easy_install i próbuję uruchomić następujący skrypt from BeautifulSoup import BeautifulSoup import re doc = ['<html><head><title>Page title</title></head>', '<body>This is paragraph one.', 'This is paragraph two.', '</html>'] soup = BeautifulSoup(''.join(doc)) print soup.prettify() Ale nie wiem, dlaczego tak się dzieje Traceback (most recent call last): …

85 python beautifulsoup

Pytania otagowane jako beautifulsoup