Zastanawiam się nad wypróbowaniem Beautiful Soup , pakietu Pythona do skrobania HTML. Czy są jeszcze jakieś pakiety do zgarniania HTML, na które powinienem spojrzeć? Python nie jest wymagany, tak naprawdę jestem zainteresowany słuchaniem także o innych językach.
Dotychczasowe dzieje:
- Pyton
- Rubin
- .NETTO
- Perl
- Jawa
- JavaScript
- PHP
- Większość z nich
XPathExpression
można użyć własnego języka Java (który istnieje od wersji Java 1.5)